收藏本站
《东北石油大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于深度学习的音频场景识别研究

张溯  
【摘要】:随着互联网及新媒体平台的迅猛发展,音频数据总量变得越来越庞大。在大数据及人工智能的背景下,音频场景识别技术可应用的领域越来越广泛,其重要性不言而喻。音频场景识别本质上是对声音信号中包含的声音特征及声学事件进行感知,并加以处理和分析,从而对音频信号进行分类。声学特征的选择直接影响分类结果的好坏,因此选择合适的声学特征尤其关键。梅尔频率倒谱系数(MEL Frequency Cepstrum Coefficient,MFCC)能够模拟人耳对声音处理的特质,计算方面较其他声学特征更容易,能够抓取信号中具有辨识度的部分。因此,在有关音频识别的分类任务中,MFCC的抗干扰能力优于其他声学特征。近年来对于人工智能的研究渐渐成熟,深度学习技术飞速发展,在模式识别、机器学习等领域取得了革命性的突破,使得越来越多的人投身有关深度学习的研究。深度神经网络是深度学习当中的一个重要研究方向,相较于浅层神经网络,其拥有更复杂的网络结构,更强大的运算组合能力,更细致的特征分析能力。卷积神经网络(Convolutional Neural Network,CNN)采用深度学习构架,是深度神经网络中的一种经典网络模型,具有权值共享、局部连接等特性。这使得卷积神经网络在训练过程中所需要学习的参数更少、网络节点更少,降低了网络复杂度,减少计算开销。卷积神经网络具有出色的特征提取能力,由于特有的网络结构,其抗畸变能力更强,具有输入不变性,在分类任务中表现尤其出色。本课题选用MFCC作为场景音频所提取的声学特征,利用CNN在特征提取及分类方面的优越性能对声学特征进一步抽取和分析,得到更加高级、抽象的特征,并对其进行分类,达到提升分类准确率的目的。本文主要工作如下:(1)对音频场景识别技术、深度学习、声学特征等方面展开深入调研,整理并总结各领域国内外发展现状,对深度学习及音频场景识别技术的发展历程、声学特征的分类及其特点进行了详细介绍。(2)阐述了MFCC的原理并给出提取流程,介绍了K近邻算法(K-Neighbor Nearest,KNN)的理论基础及分类流程,设计并搭建了使用KNN作为分类器的基线实验系统,调整重要参数进行多组对照实验,得到并分析实验结果。(3)介绍了CNN的网络结构、计算方式、学习算法及应用范围等。设计并搭建了基于MFCC和CNN的音频场景识别系统,给出了实验整体流程及系统中卷积神经网络的网络构架。首先,对场景音频进行声学特征的提取,将声学特征数据集分为训练样本集及测试样本集两类。接下来利用训练样本集对卷积神经网络进行训练,使网络训练至收敛,使权值等参数的学习达到最优状态。最后,使用完成训练的卷积神经网络对测试样本集进行音频场景的识别,得到场景识别准确率。同时,对CNN中的重要参数:卷积核大小、特征图数量、激活函数等进行调整,对比在参数调整后分类准确率的变化大小及趋势。通过对两组实验结果的观察可以得到,基于MFCC和CNN的场景识别系统的整体识别率比基线系统高出1.4个百分点,通过调整卷积核尺寸、特征图数量等参数后,整体识别率又有小幅度上升。因此,基于MFCC和CNN的实验系统在整体识别率方面优于基线系统。
【学位授予单位】:东北石油大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP18;TN912.34

【参考文献】
中国期刊全文数据库 前5条
1 胡正平;陈俊岭;王蒙;赵淑欢;;卷积神经网络分类模型在模式识别中的新进展[J];燕山大学学报;2015年04期
2 崔璨;袁英才;;窗函数在信号处理中的应用[J];北京印刷学院学报;2014年04期
3 毛青春;徐分亮;;窗函数及其应用[J];中国水运(学术版);2007年02期
4 于明;袁玉倩;董浩;王哲;;一种基于MFCC和LPCC的文本相关说话人识别方法[J];计算机应用;2006年04期
5 宋博,须德;使用支持向量机进行音频精彩场景的识别提取[J];微计算机应用;2004年03期
中国重要会议论文全文数据库 前1条
1 姜洪臣;梁伟;张树武;徐波;;音频场景分类的音频特征提取和分析[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国硕士学位论文全文数据库 前5条
1 彭凡凡;基于多深度模型集成的音频场景分类方法研究[D];哈尔滨工业大学;2017年
2 高越;量子K近邻算法研究[D];东南大学;2015年
3 李晓普;基于卷积神经网络的图像分类[D];大连理工大学;2015年
4 周成豪;基于概率潜在语义分析的音频场景识别方法[D];哈尔滨工业大学;2013年
5 王公友;基于内容的音频分析与场景识别[D];南京大学;2013年
【共引文献】
中国期刊全文数据库 前10条
1 王含蕾;李凯;韩焱;;井下射孔振动信号软件处理平台设计[J];山西电子技术;2015年06期
2 熊静;高嵩;张良;任鹏;张针海;;LabVIEW时频分析在地空瞬变电磁信号处理中的应用[J];现代电子技术;2015年24期
3 马金龙;景新幸;杨海燕;冼灿娇;赵靖;;主成分分析和K-means聚类在说话人识别中的应用[J];计算机应用;2015年S1期
4 刘志强;李富才;陈凯;谢万强;全基哲;陈孝明;;冷轧机组振动数据采集与报警判断系统[J];噪声与振动控制;2014年06期
5 崔璨;袁英才;;窗函数在信号处理中的应用[J];北京印刷学院学报;2014年04期
6 胡峰松;张璇;;基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J];计算机应用;2012年09期
7 董平;;基于动态信号分析仪的便携式振动校准器的测量方法[J];上海计量测试;2012年04期
8 莫丽花;周孝进;张晓俊;陶智;赵鹤鸣;顾济华;;基于LPCC和MFCC参数的病理嗓音识别研究[J];通信技术;2012年01期
9 梁日华;;基于STFT的电力系统继电保护故障分析[J];科技信息;2011年13期
10 谭维凤;冯立强;王兵;;解决频域干扰处理法能量泄露问题的方法研究[J];通信技术;2010年12期
中国硕士学位论文全文数据库 前10条
1 孙超;基于卷积神经网络的人脸面部疲劳识别方法研究[D];南京邮电大学;2018年
2 王雒瑶;X射线焊缝缺陷图像降维及分类检测算法研究[D];西安石油大学;2018年
3 刘柯;基于数据融合的碳纤维复合材料孔隙超声测量[D];南昌航空大学;2018年
4 张溯;基于深度学习的音频场景识别研究[D];东北石油大学;2018年
5 高浩宇;基于机器学习的图像识别研究与应用[D];华中师范大学;2018年
6 刘辰雨;基于卷积神经网络的手写数字识别研究与设计[D];成都理工大学;2018年
7 孙振;深度学习框架研究及初步实现[D];吉林大学;2018年
8 董云玲;基于机器学习的DNA序列分类算法研究[D];东北农业大学;2017年
9 张伟;基于深度卷积神经网络自学习特征的地表覆盖分类研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2017年
10 胡琛;基于卷积神经网络的人脸识别研究[D];武汉工程大学;2017年
【二级参考文献】
中国期刊全文数据库 前10条
1 刘丽;谢毓湘;魏迎梅;老松杨;;局部二进制模式方法综述[J];中国图象图形学报;2014年12期
2 黄凯奇;任伟强;谭铁牛;;图像物体分类与检测算法综述[J];计算机学报;2014年06期
3 郑胤;陈权崎;章毓晋;;深度学习及其在目标和行为识别中的新进展[J];中国图象图形学报;2014年02期
4 余凯;贾磊;陈雨强;徐伟;;深度学习的昨天、今天和明天[J];计算机研究与发展;2013年09期
5 王绪虎;陈建峰;陈万平;张群飞;;窗函数在时空域信号处理中的对比分析[J];电气电子教学学报;2013年03期
6 田园;周勖;;窗函数在数字滤波器设计中的应用[J];国外电子测量技术;2013年04期
7 杨昭;高隽;谢昭;吴克伟;;局部Gist特征匹配核的场景分类[J];中国图象图形学报;2013年03期
8 苏松志;李绍滋;陈淑媛;蔡国榕;吴云东;;行人检测技术综述[J];电子学报;2012年04期
9 郭建涛;刘友安;王林;;基于窗函数设计的跳频信号时频分析[J];计算机应用;2011年09期
10 周新星;王典洪;;窗函数用于频谱分析的研究[J];微计算机信息;2009年36期
中国硕士学位论文全文数据库 前2条
1 史秋莹;基于深度学习和迁移学习的环境声音识别[D];哈尔滨工业大学;2016年
2 陈晨;I-VECTOR说话人识别中基于偏最小二乘的总变化空间估计方法[D];哈尔滨工业大学;2015年
【相似文献】
中国期刊全文数据库 前10条
1 胡悦;;金融市场中的神经网络拐点预测法[J];金融经济;2017年18期
2 迟惠生;陈珂;;1995年世界神经网络大会述评[J];国际学术动态;1996年01期
3 吴立可;;脉冲神经网络和行为识别[J];通讯世界;2018年12期
4 王丽华;杨秀萍;王皓;高峥翔;;智能双轮平衡车的设计研究[J];数字技术与应用;2018年04期
5 张庭略;;基于硬件的神经网络加速[J];通讯世界;2018年08期
6 苏秀婷;;耦合神经网络的同步[J];绍兴文理学院学报(自然科学);2016年03期
7 朱溦;;神经网络结合平均影响值方法筛选变量[J];产业与科技论坛;2017年01期
8 ;硅光子神经网络亮相[J];石油工业计算机应用;2016年04期
9 任刚红;杜坤;周明;刘年东;张晋;;基于级联神经网络的年降雨量预测[J];土木建筑与环境工程;2016年S2期
10 金鑫;李龙威;季佳男;李祉歧;胡宇;赵永彬;;基于大数据和优化神经网络短期电力负荷预测[J];通信学报;2016年S1期
中国重要会议论文全文数据库 前10条
1 孙军田;张喆;;基于神经网络数据挖掘技术确定灾害等级的灭火救援出动力量模型研究[A];2016中国消防协会科学技术年会论文集[C];2016年
2 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
3 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
4 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
5 李涛;费树岷;;具有变时滞Cohen-Grossberg神经网络的指数稳定性准则[A];第二十六届中国控制会议论文集[C];2007年
6 汪灵枝;秦发金;;具有变时滞和脉冲的离散Cohen-Grossberg神经网络的周期解[A];中国自动化学会控制理论专业委员会D卷[C];2011年
7 韩正之;林家骏;;用神经网络求解非线性相容方程[A];1993年控制理论及其应用年会论文集[C];1993年
8 林家骏;王赞基;;求解不可微优化问题的连续极大熵神经网络[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
9 姜德宏;徐德民;任章;;基于神经网络的自校正控制器[A];1993中国控制与决策学术年会论文集[C];1993年
10 窦永丰;贝超;;模糊与神经网络结合方式及在控制中的应用[A];1997年中国控制会议论文集[C];1997年
中国重要报纸全文数据库 前10条
1 记者 刘霞;忆阻器制成神经网络更高效[N];科技日报;2017年
2 整理 本报记者 诸玲珍 顾鸿儒;微软神经网络切割法可使加速作用超线性[N];中国电子报;2018年
3 ;神经网络小史[N];电子报;2018年
4 张敏;人机大战,到底谁会赢?[N];北京日报;2017年
5 ;人工智能将取得大面积突破[N];中国企业报;2017年
6 本报记者 龚丹韵;人机大战:人类还有优势吗[N];解放日报;2017年
7 ;人类正迎来云端机器人时代[N];中国企业报;2017年
8 张斌;谁还需要“同传”[N];文汇报;2017年
9 科大讯飞董事长 刘庆峰;高考机器人考入一流大学不再是梦[N];中国教育报;2017年
10 邓洲 中国社会科学院工业经济研究所;深度学习:人工智能进入应用阶段[N];上海证券报;2017年
中国博士学位论文全文数据库 前10条
1 刘梅;网络系统的稳定和同步行为研究[D];新疆大学;2017年
2 靳然;基于神经网络和支持向量机的麦蚜发生动态预测研究[D];山西农业大学;2017年
3 李骁;基于深度卷积神经网络MSCT对小肾肿瘤病理分型的预测研究[D];中国人民解放军海军军医大学;2018年
4 李若霞;基于忆阻的神经网络的动力学分析及应用[D];东南大学;2017年
5 项延德;基于卷积神经网络的心电信号检测和分类研究[D];浙江大学;2018年
6 李一鸣;结合知识和神经网络的文本表示方法的研究[D];浙江大学;2018年
7 李扬;面向图像目标识别和检测的深度神经网络关键技术研究[D];北京邮电大学;2018年
8 LYDIA LAZIB;文本否定范围识别技术研究及其应用[D];哈尔滨工业大学;2018年
9 周小强;基于深度学习的交互式问答技术研究[D];哈尔滨工业大学;2017年
10 孔颖;终态神经网络及其相关应用[D];浙江工业大学;2017年
中国硕士学位论文全文数据库 前10条
1 陈超峰;高速公路全线建设三维智能动态优化管理方法研究[D];石家庄铁道大学;2018年
2 赵丽;基于图像识别技术的网络阅卷系统的研究与设计[D];石家庄铁道大学;2018年
3 张丽民;基于深度卷积神经网络的室内服务机器人的场景理解技术研究[D];江苏科技大学;2018年
4 吕权;基于神经网络的番茄叶部病害识别[D];河北农业大学;2018年
5 郭雷;分布式光伏发电系统超短期功率预测方法研究[D];沈阳农业大学;2018年
6 杨天云;基于卷积神经网络的多尺度目标检测研究[D];华中科技大学;2017年
7 葛波;基于深度卷积神经网络的脑组织分割方法研究[D];华中科技大学;2017年
8 张容容;基于BP神经网络的多通道微波辐射计大气参数反演算法[D];华中科技大学;2017年
9 鲁向拥;基于交通大数据的KPI关联关系发现方法研究[D];华中科技大学;2017年
10 曹雷;一种基于卷积神经网络的加密解密算法[D];华中科技大学;2017年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026


丁香五月 啪综合