【音乐检索】基于matlab音乐检索系统【含Matlab源码 435期】

举报
海神之光 发表于 2022/05/29 02:25:16 2022/05/29
【摘要】 一、获取代码方式 获取代码方式1: 通过订阅紫极神光博客付费专栏,凭支付凭证,私信博主,可获得此代码。 获取代码方式2: 完整代码已上传我的资源:【音乐检索】基于matlab音乐检索系统【含Matla...

一、获取代码方式

获取代码方式1:
通过订阅紫极神光博客付费专栏,凭支付凭证,私信博主,可获得此代码。

获取代码方式2:
完整代码已上传我的资源:【音乐检索】基于matlab音乐检索系统【含Matlab源码 435期】

备注:
订阅紫极神光博客付费专栏,可免费获得1份代码(有效期为订阅日起,三天内有效);

二、音乐检索简介

1 基于文本的检索
音乐检索从方式上来分主要有两种:基于文本的检索和基于内容的检索。基于文本的检索是通过输入歌曲名、歌手名或者歌词来检索歌曲,此方式是目前最通用的方式。它通过对音乐库中的音乐进行特征标记完成,每首音乐都有歌名、歌手和歌词信息;用户检索时往往利用倒排索引进行关键词检索。基于文本检索的前提是用户知道歌曲的一些信息,这种方式在大多数情况下可以满足用户需求。但是这个限制在某些情况下是一个缺陷。很多时候,用户想检索的音乐是在路上行走时无意中听到的歌曲。片段可能是流行音乐,但是让用户记住歌词是不现实的;也可能是纯音乐,此时基于文本的检索就无能为力。此外,对上千万首音乐的标记会是一个非常耗时的任务。
为了应对用户随时随地检索的需求,基于内容的音乐检索应运而生。基于内容的音乐检索无需用户提供关键词,而是通过原始的音频去检索。它具体又可以分为两种形式:哼唱检索和录音检索。

2 哼唱检索
哼唱检索是目前音乐检索研究的热点,它是通过用户哼唱音乐片段的方式进行检索。具体工作原理是:用户哼唱期望检索音乐的一个片段,片段长度通常在10到15秒之间,然后上传片段到服务器,服务器通过相似度匹配返回和用户哼唱片段最相似的音乐。服务器不是通过将原始音乐直接进行匹配的方式检索,而是首先从音乐片段中提取特征,然后利用特征进行检索,最常用的特征是音乐的基频序列。哼唱检索的核心即是基频序列之间的相似度匹配。由于用户哼唱的片段和库中实际音乐的片段不可能完全相似,所以哼唱检索是一种模糊匹配。针对模糊匹配,方法很多,最常用的例如字符串编辑距离,复杂的有DTW动态时间规整算法等。出于准确率的目的,哼唱检索中往往采用DTW动态时间规整算法,该算法是动态规划算法,复杂度较高,但是非常适合于时间序列之间的模糊匹配,因而在哼唱检索中具有最高的准确率。DTW算法虽然是动态规划算法,但是可以通过GPU、FPGA等硬件进行加速,因而检索速度目前还不是瓶颈。
在这里插入图片描述
哼唱检索目前面临的最大问题是准确率的问题。虽然有DTW算法可以采用,但是如何提取准确的基频序列是最大的难题。目前从多声部音乐中提取基频序列的准确率很低,大约只有75%左右。利用错误的特征进行匹配,DTW也无济于事。强调从多声部音乐中提取基频特征是因为目前大量存在的音乐都是多声部音乐,因而从多声部音乐中提取特征就可以自然地构造一个非常大的特征库。多声部音乐的特点就是伴随有大量的乐器背景音,这些背景音在提取声乐的过程中就是噪音。如何提升多声部音乐基频特征提取的准确率是哼唱检索能否实用的关键。当提取的准确率达到95%以上时,哼唱检索将会发挥更大的价值。目前商用的哼唱检索软件主要是MIDOMI。

3 录音检索
名字可能取得不好,在QQ音乐中该应用叫做“听歌识曲”。就如字面所描述,录音检索通过录制一段音乐上传服务器进行检索。它和哼唱检索的区别就是录音检索不用用户哼唱,而是录制一段正在播放的音乐。在使用方式上,这种方式更为简单方便。由于录制的就是原始播放的音乐,所以录音检索不是模糊检索,而是一种精确匹配,采用的技术也和哼唱检索不同。不过庆幸的是,录音检索已经有十年的历史,准确率也非常高。最出名的应用可能就是Shazam,当然QQ音乐的“听歌识曲”也很好。
在这里插入图片描述
该算法的基本原理是从音乐的频域特征中选择一些能量极大值点作为landmark,然后将两个landmark组合成指纹存入数据库。匹配的原理是:检索的片段提取的指纹会在原始音乐中复现。所以检索的过程就是寻找录制片段在原始音乐中哪个时刻会出现指纹的大量重合。可以形象地理解匹配为:原始音乐提取的指纹散布在一个长条上,录制片段是一个短条,从长条的开始移动短条直到指纹大量重合。具体的实现今后会详细介绍。

三、部分源代码

function varargout = recognition(varargin)
% RECOGNITION MATLAB code for recognition.fig
%      RECOGNITION, by itself, creates a new RECOGNITION or raises the existing
%      singleton*.
%
%      H = RECOGNITION returns the handle to a new RECOGNITION or the handle to
%      the existing singleton*.
%
%      RECOGNITION('CALLBACK',hObject,eventData,handles,...) calls the local
%      function named CALLBACK in RECOGNITION.M with the given input arguments.
%
%      RECOGNITION('Property','Value',...) creates a new RECOGNITION or raises the
%      existing singleton*.  Starting from the left, property value pairs are
%      applied to the GUI before recognition_OpeningFcn gets called.  An
%      unrecognized property name or invalid value makes property application
%      stop.  All inputs are passed to recognition_OpeningFcn via varargin.
%
%      *See GUI Options on GUIDE's Tools menu.  Choose "GUI allows only one
%      instance to run (singleton)".
%
% See also: GUIDE, GUIDATA, GUIHANDLES

% Edit the above text to modify the response to help recognition

% Last Modified by GUIDE v2.5 08-Jun-2018 15:48:10

% Begin initialization code - DO NOT EDIT
gui_Singleton = 1;
gui_State = struct('gui_Name',       mfilename, ...
                   'gui_Singleton',  gui_Singleton, ...
                   'gui_OpeningFcn', @recognition_OpeningFcn, ...
                   'gui_OutputFcn',  @recognition_OutputFcn, ...
                   'gui_LayoutFcn',  [] , ...
                   'gui_Callback',   []);
if nargin && ischar(varargin{1})
    gui_State.gui_Callback = str2func(varargin{1});
end

if nargout
    [varargout{1:nargout}] = gui_mainfcn(gui_State, varargin{:});
else
    gui_mainfcn(gui_State, varargin{:});
end
% End initialization code - DO NOT EDIT


% --- Executes just before recognition is made visible.
function recognition_OpeningFcn(hObject, eventdata, handles, varargin)
% This function has no output args, see OutputFcn.
% hObject    handle to figure
% eventdata  reserved - to be defined in a future version of MATLAB
% handles    structure with handles and user data (see GUIDATA)
% varargin   command line arguments to recognition (see VARARGIN)
setappdata(handles.pushbutton1,'pathfile',0);
% Choose default command line output for recognition
handles.output = hObject;
ha=axes('units','normalized','pos',[0 0 1 1]);
 uistack(ha,'down');
 ii=imread('beijing.jpg');
%设置程序的背景图为beijing1.jpg
 image(ii);
 colormap gray
 set(ha,'handlevisibility','off','visible','off');

% Update handles structure
guidata(hObject, handles);

% UIWAIT makes recognition wait for user response (see UIRESUME)
% uiwait(handles.figure1);


% --- Outputs from this function are returned to the command line.
function varargout = recognition_OutputFcn(hObject, eventdata, handles) 
% varargout  cell array for returning output args (see VARARGOUT);
% hObject    handle to figure
% eventdata  reserved - to be defined in a future version of MATLAB
% handles    structure with handles and user data (see GUIDATA)

% Get default command line output from handles structure
varargout{1} = handles.output;


% --- Executes on button press in pushbutton1.
function pushbutton1_Callback(hObject, eventdata, handles)
% hObject    handle to pushbutton1 (see GCBO)
% eventdata  reserved - to be defined in a future version of MATLAB
% handles    structure with handles and user data (see GUIDATA)
[filename, pathname] = uigetfile('*.wav', '读取声音文件'); %选择声音文件
if isequal(filename,0)   %判断是否选择
   msgbox('没有选择任何音乐');
else
   pathfile=strcat(pathname, filename);  %获得声音路径
 [x,fs]=audioread(pathfile);     %将声音读入矩阵
   sound(x,fs);    %播放声音 
end
set(handles.edit1,'string',filename)
setappdata(handles.pushbutton1,'pathfile',pathfile);


% --- Executes on button press in pushbutton2.
function pushbutton2_Callback(hObject, eventdata, handles)
% hObject    handle to pushbutton2 (see GCBO)
% eventdata  reserved - to be defined in a future version of MATLAB
% handles    structure with handles and user data (see GUIDATA)
pathfile=getappdata(handles.pushbutton1,'pathfile');
Fs=40000;
[memory, FS]=audioread(pathfile);
memorypiece=memory(1:100000,1);
fullmemory=memory(1:200000,1);
memorypiece=memorypiece';
memorypiece=resample(memorypiece,Fs,FS);
fullmemory=resample(fullmemory,Fs,FS);
fullmemory=fullmemory';
B=mfcc_m(fullmemory,Fs,13,Fs/4,Fs/8);
c1=load('data1.mat');
c2=load('data2.mat');
c3=load('data3.mat');
n1=c1.C1;
n2=c2.C2;
n3=c3.C3;
DTW1 = dtw(B,n1);
DTW2 = dtw(B,n2);
DTW3 = dtw(B,n3);


function edit1_Callback(hObject, eventdata, handles)
% hObject    handle to edit1 (see GCBO)
% eventdata  reserved - to be defined in a future version of MATLAB
% handles    structure with handles and user data (see GUIDATA)

% Hints: get(hObject,'String') returns contents of edit1 as text
%        str2double(get(hObject,'String')) returns contents of edit1 as a double


% --- Executes during object creation, after setting all properties.
function edit1_CreateFcn(hObject, eventdata, handles)
% hObject    handle to edit1 (see GCBO)
% eventdata  reserved - to be defined in a future version of MATLAB
% handles    empty - handles not created until after all CreateFcns called

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • 69
  • 70
  • 71
  • 72
  • 73
  • 74
  • 75
  • 76
  • 77
  • 78
  • 79
  • 80
  • 81
  • 82
  • 83
  • 84
  • 85
  • 86
  • 87
  • 88
  • 89
  • 90
  • 91
  • 92
  • 93
  • 94
  • 95
  • 96
  • 97
  • 98
  • 99
  • 100
  • 101
  • 102
  • 103
  • 104
  • 105
  • 106
  • 107
  • 108
  • 109
  • 110
  • 111
  • 112
  • 113
  • 114
  • 115
  • 116
  • 117
  • 118
  • 119
  • 120
  • 121
  • 122
  • 123
  • 124
  • 125
  • 126
  • 127
  • 128
  • 129
  • 130
  • 131
  • 132
  • 133
  • 134
  • 135
  • 136
  • 137
  • 138
  • 139

四、运行结果

在这里插入图片描述

五、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019.
[2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.

文章来源: qq912100926.blog.csdn.net,作者:海神之光,版权归原作者所有,如需转载,请联系作者。

原文链接:qq912100926.blog.csdn.net/article/details/115712373

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。