收藏本站
《山东科技大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

基于哼唱的MIDI音频检索算法研究

肖艳  
【摘要】:随着音乐数据库爆炸式的增长,传统的基于文本的音频检索给用户带来极大的不便。基于哼唱的MIDI音乐检索是基于内容的音乐检索方式,它允许用户不需要歌词而只需哼唱旋律就可以检索到自己需要的歌曲。本文的目标是构建完整的基于哼唱的MIDI音频检索算法并检验其可行性。本文的主要研究内容如下:1.音频特征提取。分析了音频信号的时域、频域和倒谱特征,并介绍了几种基本的旋律轮廓的表达,阐述了音频信号的特征提取方法。2.基于HMM的哼唱检索算法。建立了以音符为基础的HMM模型,避免了音符切分。对音调进行转换,将音调转换后的音高序列作为旋律的音高特征,从而克服了因哼唱者哼唱习惯和音域差别导致的差异。用500个哼唱片段的测试集测试算法的性能,达到了 TOP3为78%的识别率。3.基于深度学习的哼唱检索算法。采用3层DBN网络结构得到每首歌曲的关键特征,保证旋律数据能精确描述歌曲旋律,解决了旋律特征不稳定的情况。并采用了基于聚类的方法实现旋律特征的近邻检索。构建了 200首MIDI格式的音乐库,用42首wav格式的哼唱查询文件验证算法的性能,达到了 TOP3为81.0%的识别率。同时引入基于DBN的哼唱检索算法与基于LSH的哼唱检索算法的对比实验,证明了基于DBN的检索算法的优良性能。上述两个算法的核心部分都包括旋律特征提取和旋律特征匹配,这也是各个检索算法着重研究的部分。MIDI音乐数据库的旋律特征提取和哼唱旋律特征提取相关技术在各个算法中都有着重研究。
【学位授予单位】:山东科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.3;TP391.3

【参考文献】
中国期刊全文数据库 前10条
1 肖艳;王虎;;一种基于哼唱的小规模MIDI音乐检索系统及实现[J];中国新通信;2017年03期
2 余凯;贾磊;陈雨强;徐伟;;深度学习的昨天、今天和明天[J];计算机研究与发展;2013年09期
3 郭敏;张卫强;刘加;;一种基于帧-音符方式的哼唱检索算法[J];清华大学学报(自然科学版);2011年04期
4 林小兰;王晓光;王晖;;基于内容的音乐检索关键技术研究[J];中国传媒大学学报(自然科学版);2010年04期
5 袁里驰;;基于改进的隐马尔科夫模型的语音识别方法[J];中南大学学报(自然科学版);2008年06期
6 罗凯;魏维;谢青松;;哼唱检索中改进的动态时间规整算法[J];计算机工程;2008年20期
7 赵芳;吴亚栋;宿继奎;;基于音轨特征量的多音轨MIDI主旋律抽取方法[J];计算机工程;2007年02期
8 徐开阔;唐常杰;段磊;魏大刚;钟义啸;乔少杰;;正态分布下基于隐Markov模型的多声道MIDI音乐检索[J];四川大学学报(自然科学版);2006年03期
9 续鸿飞;肖明;;音频检索综述[J];晋图学刊;2005年06期
10 李雪莹,刘宝旭,许榕生;字符串匹配技术研究[J];计算机工程;2004年22期
中国硕士学位论文全文数据库 前7条
1 孙洁;基于哼唱的MIDI音乐检索系统的研究[D];西安建筑科技大学;2013年
2 曹建红;基于哼唱的音乐检索技术研究[D];南京理工大学;2009年
3 沙晓艳;HMM模型在哼唱检索中的应用[D];西北大学;2008年
4 宋星华;基于哼唱的音乐检索[D];南京理工大学;2008年
5 陈家红;哼唱检索中哼唱信息处理方法的研究[D];南京理工大学;2008年
6 陈旭;基于内容的音频哼唱识别及检索系统[D];上海交通大学;2008年
7 王薇;基于内容的音频检索特征提取技术研究[D];上海交通大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 禹龙;牛苗;田生伟;孙霞;李莉;王梅;孔军;;基于数据预处理深度置信网络的药物与非药物分类(英文)[J];新疆大学学报(自然科学版);2018年01期
2 万月;陈秀宏;何佳佳;;利用稀疏自编码的局部谱聚类映射算法[J];传感器与微系统;2018年01期
3 任俊;胡晓峰;李宁;;基于SDA与SVR混合模型的迁移学习预测算法[J];计算机科学;2018年01期
4 罗小春;;实验开发 深度学习 培养创新思维[J];中学理科园地;2017年06期
5 王烈;秦伟萌;罗文;;基于多任务学习及Faster R-CNN的SAR目标图像识别分类[J];科学技术与工程;2017年35期
6 梁栋屹;陶宏曜;刘兴旺;;基于深度表示模型的旅游路线推荐算法研究[J];软件导刊;2017年12期
7 罗仙仙;曾蔚;陈小瑜;张东水;庄世芳;;深度学习方法用于遥感图像处理的研究进展[J];泉州师范学院学报;2017年06期
8 党宇;张继贤;邓喀中;赵有松;余凡;;基于深度学习AlexNet的遥感影像地表覆盖分类评价研究[J];地球信息科学学报;2017年11期
9 林奕欧;雷航;李晓瑜;吴佳;;自然语言处理中的深度学习:方法及应用[J];电子科技大学学报;2017年06期
10 翟俊海;张素芳;郝璞;;卷积神经网络及其研究进展[J];河北大学学报(自然科学版);2017年06期
中国硕士学位论文全文数据库 前10条
1 肖艳;基于哼唱的MIDI音频检索算法研究[D];山东科技大学;2017年
2 林生燕;音乐信号的非线性特征研究[D];杭州电子科技大学;2017年
3 冷娇娇;钢琴乐音的音频分割算法研究[D];武汉工程大学;2016年
4 刘迪;基于鲁棒主成分分析的音乐降噪[D];天津大学;2016年
5 端明亮;基于哼唱搜索的音乐检索系统研究[D];电子科技大学;2015年
6 孟建华;基于听觉滤波器的音频感知哈希算法及其在音乐检索中的应用[D];华东理工大学;2015年
7 敖欢欢;基于特征比对的音乐学唱系统设计与实现[D];华中师范大学;2014年
8 高昕晟;基于数字指纹的音频检索系统的设计与实现[D];电子科技大学;2014年
9 张国林;基于哼唱搜索的语音云平台框架设计与实现[D];西安电子科技大学;2014年
10 吴康妍;结合端点检测的DTW乐谱跟随算法研究[D];天津大学;2014年
【二级参考文献】
中国期刊全文数据库 前10条
1 徐霁;袁旭海;王让定;;一个音乐检索系统的研究与实现[J];宁波大学学报(理工版);2007年03期
2 严斌峰;朱小燕;张智江;张范;;基于邻接空间的鲁棒语音识别方法[J];软件学报;2007年04期
3 张辉;杜利民;;汉语连续语音识别中不同基元声学模型的复合[J];电子与信息学报;2006年11期
4 刘宇红;刘桥;任强;;基于模糊聚类神经网络的语音识别方法[J];计算机学报;2006年10期
5 唐赟;刘文举;徐波;;基于后验概率解码段模型的汉语语音数字串识别[J];计算机学报;2006年04期
6 颜龙;刘刚;郭军;;基于小波分析的大词汇汉语连续语音识别系统鲁棒性的研究[J];中文信息学报;2006年02期
7 马志欣;付少锋;周利华;;哼唱检索中一种新的旋律模糊匹配方法[J];西安电子科技大学学报;2006年01期
8 刘耦耕,贺素良,龙永红;语音信号变速算法及其TMS320C5402实时实现[J];中南大学学报(自然科学版);2004年01期
9 宋博,须德;音频信息检索的研究及实现[J];计算机应用;2003年12期
10 李扬,吴亚栋,刘宝龙;一种新的近似旋律匹配方法及其在哼唱检索系统中的应用[J];计算机研究与发展;2003年11期
中国硕士学位论文全文数据库 前9条
1 鲁帆;基于哼唱的音乐检索系统[D];西安建筑科技大学;2011年
2 宋星华;基于哼唱的音乐检索[D];南京理工大学;2008年
3 黄丽;BP神经网络算法改进及应用研究[D];重庆师范大学;2008年
4 郭丽惠;基于内容的哼唱式音乐检索研究[D];华东师范大学;2008年
5 邹益;基于内容的音频检索研究[D];南京理工大学;2007年
6 鲁佳;基于哼唱的音乐检索技术研究与实现[D];上海海事大学;2007年
7 陆茵;基于遗传算法和BP神经网络的汉语语音识别研究[D];广西大学;2007年
8 吴恬盈;线性预测在语音信号处理中的应用研究[D];华侨大学;2006年
9 宋贤美;基于重复模式的连续哼唱输入音乐检索研究[D];哈尔滨工业大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 续鸿飞;肖明;;音频检索综述[J];晋图学刊;2005年06期
2 白云晖;;基于内容的音频检索[J];广播与电视技术;2007年06期
3 唐峰;刘玉贵;;广播电台音频检索技术研究[J];计算机应用;2007年S1期
4 李国辉,李恒峰;基于内容的音频检索:概念和方法[J];小型微型计算机系统;2000年11期
5 许玲;音频检索的原理[J];内蒙古科技与经济;2004年S2期
6 李珂;周明全;;基于音频检索的点歌系统[J];北京师范大学学报(自然科学版);2006年04期
7 吴春辉;钟宝荣;;基于内容的音频检索技术研究[J];科技情报开发与经济;2007年06期
8 李迎新;陈能太;施高瞻;;引入相关反馈的基于内容音频检索研究[J];现代计算机(专业版);2007年11期
9 吴春辉;陈洪生;;基于内容的音频检索关键技术研究与设计[J];咸宁学院学报;2007年06期
10 杜军;;基于模板的音频检索方法研究[J];山东师范大学学报(自然科学版);2008年02期
中国重要会议论文全文数据库 前8条
1 李明;吕萍;韩疆;颜永红;;固定音频检索的方法和实现[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
2 王鋆;郑丽敏;吴平;;基于内容的音频检索综述[A];农业系统工程理论与实践研究——全国农业系统工程学术研讨会论文集[C];2006年
3 王晓霞;田岚;;一种基于新型收视率调查系统的音频检索方法[A];中国电子学会第十七届信息论学术年会论文集[C];2010年
4 吕萍;王炜;颜永红;;音频匹配技术及其在音频检索中的应用[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
5 王小凤;耿国华;孙霞;张翔;;一个以句为单位的音乐哼唱检索算法[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
6 章毓晋;徐寅;刘忠伟;姚玉荣;李勍;;一个基于特征的图象检索实验平台[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
7 张孝飞;陈肇雄;黄河燕;俞旸;;基于信息熵的候选实例模式检索算法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 孙永强;徐昕;黄遵国;;基于HMM的分布式拒绝服务攻击检测方法[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年
中国重要报纸全文数据库 前1条
1 蔡国忠(作者单位:保定师专涿州分校);MIDI与音乐专业课程[N];中国艺术报;2004年
中国博士学位论文全文数据库 前4条
1 张雪源;面向音频检索的音频特征分析方法研究[D];华南理工大学;2015年
2 兰超;面向图数据的Top-k检索算法研究[D];清华大学;2016年
3 郑贵滨;基于内容的音频信息检索技术研究[D];哈尔滨工业大学;2006年
4 叶大鹏;基于2D-HMM的旋转机械故障诊断方法及其应用研究[D];浙江大学;2004年
中国硕士学位论文全文数据库 前10条
1 肖艳;基于哼唱的MIDI音频检索算法研究[D];山东科技大学;2017年
2 高昕晟;基于数字指纹的音频检索系统的设计与实现[D];电子科技大学;2014年
3 金国平;GPU加速的音频检索算法的研究与实现[D];南京大学;2013年
4 潘文娟;基于内容的音频检索的关键技术研究[D];西安电子科技大学;2008年
5 张敏;融合多模式信息特定音频检索技术研究[D];湘潭大学;2009年
6 唐杰;基于内容的音频检索技术研究[D];北京邮电大学;2010年
7 李明;基于内容的音频检索的研究与实现[D];哈尔滨工业大学;2006年
8 邬显康;基于内容的音频检索技术研究与系统实现[D];西安电子科技大学;2007年
9 邢伟利;基于内容的音频检索技术研究与实现[D];西北大学;2004年
10 史兆印;音频检索技术在数字语音教学系统中的应用与研究[D];南京理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026


丁香五月 啪综合