收藏本站
《南京理工大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于内容的音频检索研究

邹益  
【摘要】: 随着网络技术和多媒体技术的迅速发展,大量的多媒体信息都可以从网上获得。音频是多媒体中的一种重要媒体。由于音频数据量的快速增长,如何自动地对这些内容进行管理就成为一个突出的问题。特别对于身边的种类繁多的音乐数据,人们要求有快速高效的方法对它们进行分类管理(根据不同风格或演唱者等),这需要有效的自动分类技术对音频数据进行整理,以便于检索和相关的分析处理。本文对基于内容的音乐分类进行研究。 目前音乐分类的研究主要集中在音乐特征提取和分类两方面。音乐特征包括时域的短时能量、短时过零率等,频域的带宽、谱质心等,还有基于听觉感受的Mel倒谱系数(MFCC)等。许多音乐特征都可用于音乐分类。而分类算法可利用模式分类中现存的大量高效算法,例如高斯混合模型(GMM)、神经网络(NN)、支持向量机(SVM)、隐马尔可夫模型(HMM)等。 本文根据上述的研究,采用基于Mel倒谱系数特征的隐马尔可夫模型对音乐进行分类。在音乐特征提取方面,以感知特征和Mel倒谱系数组成特征向量;在音乐分类方面,以隐马尔可夫模型作为分类器,对音乐进行聚类和分类。通过有监督的学习方式进行聚类,分类时将测试样本归入似然值最大的类别,对同一音频抽取若干样本,对样本识别结果采用投票法,判定该音频的音乐类别,使分类的准确率得到进一步的提高。根据上述方法进行了仿真实验,并对实验结果进行了分析。本文将音频数据分为5类,对4种分类器的分类性能进行了比较,并对有干扰的模型进行了分类实验。实验结果表明HMM模型的分类性能还是有一定优势的,并有较强的抗干扰性。音频分类技术是音频检索以及其他音频处理的重要辅助手段。通过基于内容的音乐分类之后,为进一步的音乐检索和相关的分析处理提供了便利。因此,在基于内容的音乐检索研究中,对音乐的分类研究是一项非常重要而有意义的工作。
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP391.3

【引证文献】
中国硕士学位论文全文数据库 前4条
1 王红丽;基于半监督学习的音频实时检测方法的研究[D];延边大学;2011年
2 马永芬;基于声音样本匹配的语音应用系统技术研究[D];华北电力大学(北京);2009年
3 陈家红;哼唱检索中哼唱信息处理方法的研究[D];南京理工大学;2008年
4 曹绘;基于基音频率的哼唱式音乐检索系统的研究[D];西安建筑科技大学;2012年
【参考文献】
中国期刊全文数据库 前9条
1 段红梅,汪军,马良河,徐冉;隐马尔可夫模型在语音识别中的应用[J];工科数学;2002年06期
2 冯雅中,庄越挺,潘云鹤;一种启发式的用哼唱检索音乐的层次化方法[J];计算机研究与发展;2004年02期
3 李恒峰,李国辉;基于内容的音频检索与分类[J];计算机工程与应用;2000年07期
4 卢坚 ,陈毅松 ,孙正兴 ,张福炎;语音/音乐自动分类中的特征分析[J];计算机辅助设计与图形学学报;2002年03期
5 韩圣龙;;基于内容的音频音乐自动分析和检索技术研究[J];情报科学;2007年03期
6 卢坚 ,陈毅松 ,孙正兴 ,张福炎;基于隐马尔可夫模型的音频自动分类[J];软件学报;2002年08期
7 李超;熊璋;贺静;薛玲;;基于Web Service的多层音频分类器设计[J];计算机工程与设计;2006年04期
8 李国辉,李恒峰;基于内容的音频检索:概念和方法[J];小型微型计算机系统;2000年11期
9 杨欣;费树岷;陈丽娟;;基于小波子空间、支持向量机和模糊积分的信号多类分类算法[J];信息与控制;2007年02期
【共引文献】
中国期刊全文数据库 前10条
1 徐港;卫军;王青;;基于WEB的结构仿真试验[J];四川建筑科学研究;2006年01期
2 饶云江;吴敏;冉曾令;喻瑜;;基于准分布式FBG传感器的光纤入侵报警系统[J];安防科技;2007年06期
3 罗云贵;张友纯;;嵌入式语音门禁系统的设计与实现[J];安防科技;2010年02期
4 张道信,周爱毓;语音信号实时降噪软件的设计[J];安徽大学学报(自然科学版);2004年04期
5 陈蕴谷;;基于谱减法和经验模式分解的语音增强[J];安庆师范学院学报(自然科学版);2010年01期
6 胡钢,沈文轩;一种基于噪声动态检测的语音端点检测算法[J];鞍山科技大学学报;2004年02期
7 胡钢;;一种语音端点检测算法在DSP上的实现[J];鞍山师范学院学报;2009年06期
8 徐振辉,马立元;滚动轴承的故障特征提取[J];兵工自动化;2004年01期
9 王继祥;刘贵忠;刘广健;高向东;;基于小波谱失真测度的语音质量评估[J];兵工学报;2008年01期
10 段新,黄新宇,吴淑珍;与文本无关的说话人辨认系统中一种新的使用基音周期方法研究[J];北京大学学报(自然科学版);2003年05期
中国重要会议论文全文数据库 前10条
1 董静;刘健刚;;英语寂语声信号检测[A];2011'中国西部声学学术交流会论文集[C];2011年
2 李曼曼;杨鸿武;洪宁;杨硕;刘亚丽;;基于EMD的带噪语音端点检测[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 杨靓;苗振江;;WEB音频自动分类的研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
5 张瑞华;陈国华;颜伟文;陈清光;;基于VC与MATLAB接口技术的LPG储罐重大事故动态模拟评价系统软件开发与应用[A];第十四届海峡两岸及香港、澳门地区职业安全健康学术研讨会暨中国职业安全健康协会2006年学术年会论文集[C];2006年
6 牟峰;俞铁城;杨道淳;;新型半波语音编解码的实现[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
7 方杰;李英;陶泯;;语音信号的一种加权的鲁棒特征参数W_RAS_MFCC[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 张庆芳;赵鹤鸣;苏秦;;基于改进Kohonen网络训练算法的说话人识别系统[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
9 易克初;谷春燕;王勇;;两种实用的连续波时分复用技术[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
10 闵刚;蒋永生;杨吉斌;张雄伟;;分段声码器中的语音分段算法研究[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 黄湘松;基于混淆网络的汉语语音检索技术研究[D];哈尔滨工程大学;2010年
2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
3 王晓松;复杂背景下树木图像提取研究[D];北京林业大学;2010年
4 俞凯;计算机书法若干关键技术研究[D];浙江大学;2010年
5 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年
6 夏丁胤;互联网图像高效标注和解译的关键技术研究[D];浙江大学;2010年
7 尹伟;基于模型的语音增强方法及质量评估研究[D];武汉大学;2009年
8 曾庆虎;机械传动系统关键零部件故障预测技术研究[D];国防科学技术大学;2010年
9 黄丽霞;非特定人鲁棒性语音识别中前端滤波器的研究[D];太原理工大学;2011年
10 许相莉;基于智能计算的图像检索算法研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 周雪梅;基于颜色和形状特征的图像检索技术研究[D];河南理工大学;2010年
2 李锦;基于声波的运动车辆行驶状态辨识理论研究[D];南昌航空大学;2010年
3 王萍;语音情感识别研究[D];山东科技大学;2010年
4 陈斌;PJR-2X型喷浆机器人交互式虚拟样机系统开发[D];山东科技大学;2010年
5 楼侃;基于DSP的语音信号环境噪声降噪处理技术的研究[D];长春理工大学;2010年
6 张增银;基因表达式编程与HMM融合技术应用研究[D];广西师范学院;2010年
7 靳志强;报告厅环境下语音增强方法研究[D];郑州大学;2010年
8 曹唯伟;基于拼音编码的水下语音通信发射端的设计与实现[D];哈尔滨工程大学;2010年
9 徐雯;VDR音频数据数字水印算法研究[D];哈尔滨工程大学;2010年
10 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 李珂;周明全;;基于音频检索的点歌系统[J];北京师范大学学报(自然科学版);2006年04期
2 付青青;吴爱平;;基于Matlab的语音信号自相关基音检测[J];长江大学学报(自科版)理工卷;2006年04期
3 鲁珂,赵继东,叶娅兰,曾家智;一种用于图像检索的新型半监督学习算法[J];电子科技大学学报;2005年05期
4 罗大光;郝玉洁;刘乃琦;;一种非常快速的字符串匹配算法[J];电子科技大学学报;2005年06期
5 张宝华;张品;;基于旋律的音乐检索系统[J];电声技术;2005年12期
6 郑展恒;曾庆宁;;噪声环境下端点检测方法的研究[J];大众科技;2008年04期
7 张文耀,许刚,王裕国;循环AMDF及其语音基音周期估计算法[J];电子学报;2003年06期
8 张煜;;一种语音信号基音周期的提取方法[J];福建电脑;2008年04期
9 郑展恒;曾庆宁;张少兵;;一种语音端点检测方法的研究[J];桂林电子科技大学学报;2008年01期
10 李玉萍;朴春俊;韩永成;;一种改进的语音信号端点检测方法研究[J];国外电子测量技术;2008年01期
中国博士学位论文全文数据库 前1条
1 王小凤;基于内容的音乐检索关键技术研究[D];西北大学;2008年
中国硕士学位论文全文数据库 前10条
1 鲁帆;基于哼唱的音乐检索系统[D];西安建筑科技大学;2011年
2 李盛宁;车牌识别系统中车牌定位算法的研究[D];苏州大学;2011年
3 宋文静;基于隐马尔可夫模型的音频检索[D];南京理工大学;2004年
4 宋贤美;基于重复模式的连续哼唱输入音乐检索研究[D];哈尔滨工业大学;2006年
5 郭红波;音乐哼唱检索关键技术研究[D];西北大学;2007年
6 郭丽惠;基于内容的哼唱式音乐检索研究[D];华东师范大学;2008年
7 鲁佳;基于哼唱的音乐检索技术研究与实现[D];上海海事大学;2007年
8 宋星华;基于哼唱的音乐检索[D];南京理工大学;2008年
9 魏文华;哼唱式音乐检索系统[D];华中科技大学;2007年
10 构玉荣;基于哼唱的音乐检索技术研究[D];华中科技大学;2007年
【二级引证文献】
中国硕士学位论文全文数据库 前2条
1 何晓亮;舞蹈机器人中的音乐特征提取与处理的研究[D];沈阳航空航天大学;2012年
2 曹绘;基于基音频率的哼唱式音乐检索系统的研究[D];西安建筑科技大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 薛伟,刘旭东,葛声,林学练;Web服务运行管理平台安全结构的研究与实现[J];北京航空航天大学学报;2003年10期
2 张宝华;张品;;基于旋律的音乐检索系统[J];电声技术;2005年12期
3 李苇营,易克初,胡征;神经网络与HMM构成的混合网络在语音识别中应用的研究[J];电子学报;1994年10期
4 李超,熊璋;MPEG音频现状及其发展研究[J];计算机研究与发展;2003年04期
5 张杰,黄志同,王晓兰;语音识别中隐马尔可夫模型状态数的选取原则及研究[J];计算机工程与应用;2000年01期
6 李恒峰,李国辉;音频信息检索[J];计算机工程;1999年08期
7 伊明,王文杰;有关智能Web服务问题的讨论[J];计算机仿真;2003年05期
8 韩晓峰,徐良贤;基于Web服务的多Agent系统的研究[J];计算机仿真;2004年01期
9 陈博,许满武;基于Web的计算模型——Web Service[J];计算机应用研究;2003年01期
10 徐勋华,王继成;支撑向量机的多类分类方法[J];微电子学与计算机;2004年10期
【相似文献】
中国期刊全文数据库 前10条
1 夏庆观,路红,赵茜,王东霞;基于IMAQ的零件图像特征提取和识别[J];机械设计与制造;2005年09期
2 李雅梅;吴中福;;川南石刻图像特征提取方法研究[J];计算机科学;2008年06期
3 张建民;冯建生;蔡元龙;;用统计相关法鉴别印章[J];计算机应用与软件;1993年03期
4 夏庆观,路红,陈桂;基于小波神经网络的零件图像特征提取和识别[J];仪器仪表学报;2005年S1期
5 夏庆观;盛党红;路红;陈桂;;零件图像特征提取和识别的研究[J];中国机械工程;2005年22期
6 刘宇红;孟宪春;刘剑;;ART-2神经网络在机器人视觉特征识别中的应用[J];河北工业大学学报;2006年04期
7 李雪梅;;数字识别技术探究[J];电力学报;2007年03期
8 张松林;杨航;潘传红;;基于支持向量机的脱机手写体数字的识别[J];大众科技;2007年05期
9 樊振萍;;人脸检测与识别技术综述[J];电脑知识与技术;2008年07期
10 樊振萍;;人脸检测与识别技术综述[J];可编程控制器与工厂自动化;2008年05期
中国重要会议论文全文数据库 前10条
1 汪洋;张小栋;赵建平;;应用于外骨骼机器人的肌电信号模式识别[A];2009全国虚拟仪器大会论文集(二)[C];2009年
2 马宪民;蒋勇;卜祥莉;;基于图像处理的煤矸石自动分选系统的研究[A];2003年中国智能自动化会议论文集(下册)[C];2003年
3 林培群;徐建闽;傅惠;梁俊斌;;基于多分支BP网络模型的车型分类研究[A];可持续发展的中国交通——2005全国博士生学术论坛(交通运输工程学科)论文集(下册)[C];2005年
4 夏庆观;路红;陈桂;;基于小波神经网络的零件图像特征提取和识别[A];第三届全国信息获取与处理学术会议论文集[C];2005年
5 李士进;俞峰;;基于多分类器组合的人脸检测[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
6 王先梅;杨扬;林子钰;;基于背景特征与HMMs的脱机手写字符识别技术[A];第25届中国控制会议论文集(下册)[C];2006年
7 董光波;孙增圻;谢桂海;马健;;核磁共振波谱分析与癌症特征提取技术研究[A];2005年中国智能自动化会议论文集[C];2005年
8 马宪民;蒋勇;;煤与矸石识别的数字图像处理方法探讨[A];中国煤炭学会煤矿机电一体化专业委员会、中国电工技术学会煤矿电工专业委员会2004年学术年会论文集[C];2004年
9 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
10 周书仁;梁昔明;朱灿;;一种优化的ICA表情特征提取方法[A];第二十六届中国控制会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 吴加录;胡启恒:科技界需要润物细无声[N];中国计算机报;2006年
2 陈瑜唐婷;让计算机会看、会听、会说、会思考[N];科技日报;2007年
3 记者 左常睿;应重视互联网模式识别的研究[N];科技日报;2005年
4 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
5 本报记者 贾婧;宗成庆:做科研也要为师立范[N];科技日报;2007年
6 河北 宁海征;常见多频彩显的模式识别与控制电路[N];电子报;2003年
7 武德锋 李国辉 林洪文 姚作梁;图像 “堆”里寻知识[N];计算机世界;2002年
8 记者 刘垠;首届中美视觉夏令营开营[N];大众科技报;2009年
9 ;通用数字视觉平台JVISION-500[N];科技日报;2003年
10 比尔·盖茨   ;新的工作世界[N];中国计算机报;2005年
中国博士学位论文全文数据库 前10条
1 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
2 隋文涛;滚动轴承表面损伤故障的特征提取与诊断方法研究[D];山东大学;2011年
3 韩鸿哲;基于计算机视觉的步态特征提取与身份识别研究[D];北京科技大学;2003年
4 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
5 焦卫东;基于独立分量分析的旋转机械故障诊断方法研究[D];浙江大学;2003年
6 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
7 刘云鹏;电力变压器局部放电的电气定位及诊断[D];华北电力大学(河北);2005年
8 游峰;智能车辆自动换道与自动超车控制方法的研究[D];吉林大学;2005年
9 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
10 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
中国硕士学位论文全文数据库 前10条
1 邹益;基于内容的音频检索研究[D];南京理工大学;2007年
2 周冬生;肺音信号的特征提取与模式识别[D];山东大学;2005年
3 陈辉;人脸表情自动识别系统[D];西南交通大学;2005年
4 安贝;基于K-L变换的人脸识别方法[D];四川大学;2005年
5 周辉;齿轮故障的特征提取与模式识别技术研究[D];郑州大学;2005年
6 张雪;肝脏超声图像的纹理分析[D];长春理工大学;2004年
7 刘云飞;脱机手写体汉字识别中细化、特征提取和相似字识别算法研究[D];湖南大学;2006年
8 魏国忠;基于小波与分形理论的局部放电类型识别[D];天津大学;2006年
9 臧晓艳;基于CDHMM/SOFM神经网络的语音识别研究[D];燕山大学;2006年
10 郝巧红;高压变电站数显仪表的识别[D];天津大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026


丁香五月 啪综合