收藏本站
《武汉大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于深度学习的哼唱音频乐谱识别技术研究

郭琛  
【摘要】:哼唱识别是当前音乐信息提取研究中的一大热点,其目标是根据用户的哼唱,识别出用户哼唱的歌曲。由于其交互形式友好,在移动设备上使用便利,相关技术在音乐检索、音乐推荐等领域具有广阔的应用前景。本文针对哼唱音频信号自动识别问题,研究了深度学习研究中常用方法和手段,将深度学习方法应用到哼唱识别中,结合传统音频信号处理方法,提出了一种基于深度学习框架的识别方法,设计了一个哼唱音频识别深度学习框架,实现对人声哼唱的音乐信号进行识别。本文还基于此实现了一个具有实用价值、可扩展性强的哼唱音频乐谱识别系统,通过实验验证了所提出的基于深度学习的哼唱识别算法的可行性。论文的研究工作主要包括:(1)研究了哼唱音频数据处理方法,包括音频滤波、预加重、加窗分帧、音符起始点检测、音频信号特征表示等方法,对比了不同方法之间的区别和优缺点,针对深度学习数据集的要求选取了合适的方法进行深入研究和实践。(2)深入研究了当前深度学习研究的理论基础与常用方法,包括常用神经网络的设计与训练方法,应用广泛的各类神经网络结构的原理与优缺点等。基于此设计了一个卷积循环神经网络模型,结合卷积神经网络在局部特征提取和循环神经网络在归纳序列数据特征方面的优势,提高哼唱音频信号识别的准确率。(3)利用开源深度学习平台与工具,对所提出的神经网络模型进行了实验与论证。通过在测试数据集上进行训练和测试,反复调整模型,得到了效果较好的模型参数。并通过在测试数据集上的评估测试,验证了所提出的神经网络模型的可行性和有效性,并对模型性能进行了分析和评估。(4)基于所提出的深度学习框架,利用服务端和移动端开发技术,设计实现了一个哼唱音频乐谱识别原型系统,包括服务端的音频识别服务、移动端的音频录制、音频上传等功能模块。
【学位授予单位】:武汉大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:J613.2;TP181

【参考文献】
中国期刊全文数据库 前8条
1 余凯;贾磊;陈雨强;徐伟;;深度学习的昨天、今天和明天[J];计算机研究与发展;2013年09期
2 曹辉;徐晨;赵晓;吴胜举;;说话人识别中的Mel特征频率倒谱系数[J];西北大学学报(自然科学版);2013年02期
3 侯珏;刘轶;郑方;蒋丹宁;秦勇;黄石磊;刘勇;;基于VP树结构的多层匹配算法在哼唱识别中的应用[J];清华大学学报(自然科学版);2009年S1期
4 曹文晓;刘轶;郑方;蒋丹宁;秦勇;;用于哼唱识别精确匹配的线性伸缩动态规划算法[J];清华大学学报(自然科学版);2009年S1期
5 冯雅中,庄越挺,潘云鹤;一种启发式的用哼唱检索音乐的层次化方法[J];计算机研究与发展;2004年02期
6 李扬,吴亚栋,刘宝龙;一种新的近似旋律匹配方法及其在哼唱检索系统中的应用[J];计算机研究与发展;2003年11期
7 覃光华,丁晶,陈彬兵;预防过拟合现象的人工神经网络训练策略及其应用[J];长江科学院院报;2002年03期
8 刘曙光;郑崇勋;刘明远;;前馈神经网络中的反向传播算法及其改进:进展与展望[J];计算机科学;1996年01期
中国硕士学位论文全文数据库 前5条
1 王公友;基于内容的音频分析与场景识别[D];南京大学;2013年
2 王京辉;语音信号处理技术研究[D];山东大学;2008年
3 李晨;结合语音识别技术的音乐哼唱检索研究[D];西北大学;2008年
4 陈家红;哼唱检索中哼唱信息处理方法的研究[D];南京理工大学;2008年
5 陈旭;基于内容的音频哼唱识别及检索系统[D];上海交通大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 李轶南;张雄伟;李治中;吴海佳;孙久皓;;第1讲 深度学习:开启人工智能的新纪元[J];军事通信技术;2015年04期
2 范燕;吴小俊;邵长斌;宋晓宁;;基于PCA的GHA算法在BP网中的融合应用[J];计算机科学;2015年12期
3 石鑫;朱永利;;深度学习神经网络在电力变压器故障诊断中的应用[J];电力建设;2015年12期
4 毛存礼;余正涛;沈韬;高盛祥;郭剑毅;线岩团;;基于深度神经网络的有色金属领域实体识别[J];计算机研究与发展;2015年11期
5 陈珍;夏靖波;柏骏;徐敏;;基于进化深度学习的特征提取算法[J];计算机科学;2015年11期
6 郭平;王可;罗阿理;薛明志;;大数据分析中的计算智能研究现状与展望[J];软件学报;2015年11期
7 付伟;王金桥;滕可振;;基于深度学习的监控视频目标检索[J];无线电工程;2015年12期
8 黄海波;李人宪;杨琪;丁渭平;杨明亮;;基于DBNs的车辆悬架减振器异响鉴别方法[J];西南交通大学学报;2015年05期
9 冯玉涵;栗磊;;BP网络在水质监测方面的研究[J];信阳农林学院学报;2015年03期
10 王知音;禹龙;田生伟;钱育蓉;丁建丽;杨柳;;基于栈式自编码的水体提取方法[J];计算机应用;2015年09期
中国硕士学位论文全文数据库 前10条
1 张溯;基于深度学习的音频场景识别研究[D];东北石油大学;2018年
2 郭琛;基于深度学习的哼唱音频乐谱识别技术研究[D];武汉大学;2018年
3 汪啸;远距离激光振动检测技术的研究[D];电子科技大学;2018年
4 肖艳;基于哼唱的MIDI音频检索算法研究[D];山东科技大学;2017年
5 吴品奇;音符识别算法研究[D];湖北工业大学;2016年
6 刘迪;基于鲁棒主成分分析的音乐降噪[D];天津大学;2016年
7 胡冰心;录音设备音质评价系统的研究[D];北京化工大学;2015年
8 陈雨莺;基于EMD的说话人特征参数提取方法研究[D];湘潭大学;2015年
9 米川;语音信号的预测研究[D];河北科技大学;2015年
10 刘超;基于麦克风阵列的声源定位算法研究[D];南京大学;2015年
【二级参考文献】
中国期刊全文数据库 前4条
1 罗宪华;杨大利;徐明星;徐露;;面向非特定人语音情感识别的PCA特征选择方法[J];计算机科学;2011年08期
2 余建潮;张瑞林;;基于MFCC和LPCC的说话人识别[J];计算机工程与设计;2009年05期
3 朱君波;朱夏君;王守觉;;PCA在语音检测中的应用研究[J];模式识别与人工智能;2006年05期
4 甄斌,吴玺宏,刘志敏,迟惠生;语音识别和说话人识别中各倒谱分量的相对重要性[J];北京大学学报(自然科学版);2001年03期
中国硕士学位论文全文数据库 前6条
1 郭丽惠;基于内容的哼唱式音乐检索研究[D];华东师范大学;2008年
2 郭红波;音乐哼唱检索关键技术研究[D];西北大学;2007年
3 邹益;基于内容的音频检索研究[D];南京理工大学;2007年
4 赵静;基于内容的音乐检索系统研究[D];西北大学;2005年
5 邢伟利;基于内容的音频检索技术研究与实现[D];西北大学;2004年
6 云霞;基于Mel倒谱和Bark谱失真距离的汉语音质客观评价研究[D];西南交通大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 买热木沙·托呼提;;音频编辑软件在音频降噪方面的应用[J];电视指南;2017年08期
2 田劲;;多媒体会议中音频处理单元的设计与实现[J];武汉理工大学学报;2009年15期
3 张玉奇,陈树宝,孙锟,王荣发,刘斌,王威琪,汪源源,倪金洪,高玲玲,郁怡;应用音频处理系统无创自动估测肺动脉压的研究[J];中国超声医学杂志;1999年05期
4 王祖立 ,邬惠林;YC-2K型音频处理装置[J];广播与电视技术;1988年04期
5 于寅虎;;音频处理技术随便携式电子产品需求发展[J];电子产品世界;2009年12期
6 David Katz;Rick Gentile;Tomasz Lukasiak;;嵌入式音频处理基础(一)[J];电子产品世界;2008年08期
7 David Katz;Rick Gentile;Tomasz Lukasiak;;嵌入式音频处理基础(3)[J];电子产品世界;2008年11期
8 刘毓敏;用好Adobe Premiere中的音频处理工具[J];实用影音技术;2005年02期
9 张秀常;;音频处理任我行[J];浙江教育技术;2013年04期
10 ;2013年是音频处理系统去整合化的转折之年[J];电子产品世界;2012年07期
中国重要会议论文全文数据库 前5条
1 廉明涛;;音频处理在中波转播台的应用[A];2005年广播电视技术论文汇编[C];2005年
2 王兴国;蒋伟峰;刘济林;顾伟康;;现代音频处理的DSP方案[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 赵侠;刘志刚;;音频响度分析研究[A];天津市电子工业协会2018年年会论文集[C];2018年
4 吴烁宇;;基于C-SKY CPU的音频处理SoC设计[A];《IT时代周刊》2013年度论文集[C];2013年
5 杨伟斌;;基于以太网的音频传输技术比较及应用[A];中国新闻技术工作者联合会第六次会员代表大会、2014年学术年会暨第七届《王选新闻科学技术奖》和优秀论文奖颁奖大会论文集(三等奖)[C];2014年
中国重要报纸全文数据库 前10条
1 ;音频处理[N];电脑报;2001年
2 ;体验X-Ripper录制音乐[N];电脑报;2002年
3 木哥;闪亮的音乐精灵[N];计算机世界;2002年
4 甄书秀;手机突围支点:创新和速度[N];中国质量报;2006年
5 ;Analog Devices 公司发布SoundMAX2.0系统[N];中国高新技术产业导报;2001年
6 ;德州仪器推出全新DSP[N];人民邮电;2006年
7 屈歌;谨防听录音的“陷阱”[N];音乐周报;2015年
8 本报记者 黄志昕;Intel革命,DIY没命?[N];计算机世界;2004年
9 记者  母晓洁;DTS:拓展中国市场水到渠成[N];中国电子报;2006年
10 王新禧;APE音乐还原高品质CD[N];中国电脑教育报;2004年
中国博士学位论文全文数据库 前1条
1 郑贤中;高指向性音频声波理论与控制研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 郭琛;基于深度学习的哼唱音频乐谱识别技术研究[D];武汉大学;2018年
2 冯婷婷;基于神经网络的音乐音频自动合成的研究与实现[D];吉林大学;2018年
3 朱田恬;复杂场景下的音频序列切分方法的研究[D];哈尔滨工业大学;2018年
4 范苍宁;基于音频内容重复性的广播广告检测[D];哈尔滨工业大学;2018年
5 张立赛;复杂场景下的音频自动标注方法[D];哈尔滨工业大学;2018年
6 李琪;基于深度学习的音频场景识别方法研究[D];西安电子科技大学;2018年
7 张迪昌;云存储环境下基于音频字的盗版视频检测方案的设计与实现[D];湖南大学;2017年
8 段正国;音乐情感检索下音频感知哈希方法的研究[D];湖南大学;2014年
9 廖伟鸿;手机有声读物系统设计与实现[D];湖南大学;2016年
10 翁炀冰;面向场景理解的视、听觉媒体内容处理与分析方法研究[D];南京大学;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026


丁香五月 啪综合