收藏本站
《西北大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

结合语音识别技术的音乐哼唱检索研究

李晨  
【摘要】: 随着计算机科学技术的飞速发展,人们不再满足于单一的检索方式。哼唱检索(QBH:Query By Humming)作为一种全新的检索方式,可以帮助用户通过哼唱旋律的片断,在大规模的音乐数据库中找到想要的乐曲。 歌谱是音乐的高级特征,若能准确识别出歌谱信息,则检出率会得到很大提高。如何快速而精确地从哼唱信号中识别出音符序列是一个具有挑战性的课题。本文将语音识别的技术应用到音乐检索当中,实现音乐的高级特征识别,为大规模QBH系统走向实用化提供了关键性技术,并开展了以下研究工作: (1)对整个语音识别系统理论进行了全面分析,通过分析语音识别的特点和哼唱检索的难点,给出了结合语音识别技术的哼唱检索系统的处理方案。 (2)总结了在语音识别建模中广泛应用的隐马尔可夫模型的基础理论。并且给出了DTW和HMM两种经典算法的比较,说明了HMM模型的优势。 (3)采用了基于统计模型的哼唱旋律模型算法进行语音识别。算法将每个音符(以及静音)分别视为一个单词。阐述了在HMM模型的基础上,对声学模型和语言模型的训练数据和训练过程。 (4)在训练声学模型时发现,即使采用基频算法,也无法避免在基频估计以及清浊判定的过程中引入错误,从而对系统性能产生负面影响;针对这一问题,对特征提取做了研究。最终在声学模型方面,采用了高阶倒谱系数作为特征,提高了鲁棒性。同时,训练采用了调无关的四元语言模型以体现不同音符序列在歌曲中分布的先验概率。 (5)设计了一个应用语音识别技术的音乐哼唱检索系统。通过实验,从音符识别错误率和哼唱查询系统整体性能的角度给出评测结果,并与另一个先进旋律识别系统进行了比较。实验证明,该系统对环境噪声有较好的鲁棒性,同时在干净数据上的性能具有很好的效果,具有较高的检索精度。 本研究工作得到国家自然科学基金“基于Web的音频识别与检索关键技术研究(基金编号:60673100)”的资助。
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TN912.3

【引证文献】
中国期刊全文数据库 前2条
1 马丽丽;邬杨波;李宏;;基于DTW算法的哼唱检索系统的设计[J];科技视界;2012年01期
2 马丽丽;邬杨波;李宏;;基于DTW算法的哼唱检索系统的设计[J];科技信息;2012年01期
中国硕士学位论文全文数据库 前1条
1 周旭;车载蓝牙语音控制系统的设计与实现[D];吉林大学;2011年
【参考文献】
中国期刊全文数据库 前4条
1 薛锋,杨宗英,郑巧英,黄敏;基于内容的音乐检索[J];大学图书馆学报;1999年04期
2 王小凤;周明全;耿国华;郭红波;;一个使用歌谱信息进行哼唱检索的系统[J];计算机辅助设计与图形学学报;2007年07期
3 罗德勇,明海;数字图书馆中基于内容的多媒体检索研究[J];情报探索;2003年01期
4 李国辉,李恒峰;基于内容的音频检索:概念和方法[J];小型微型计算机系统;2000年11期
中国硕士学位论文全文数据库 前3条
1 邢伟利;基于内容的音频检索技术研究与实现[D];西北大学;2004年
2 赵静;基于内容的音乐检索系统研究[D];西北大学;2005年
3 郭红波;音乐哼唱检索关键技术研究[D];西北大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 林小兰;王晓光;王晖;;基于内容的音乐检索关键技术研究[J];中国传媒大学学报(自然科学版);2010年04期
2 易长平;赵明生;崔正荣;;基于独立分量分析的爆破振动信号分离仿真试验[J];爆破;2010年01期
3 李珂;周明全;;基于音频检索的点歌系统[J];北京师范大学学报(自然科学版);2006年04期
4 赵明生;张建华;易长平;;独立分量分析在爆破振动信号分离中的应用初探[J];爆炸与冲击;2011年02期
5 刘洪林;李海山;;ICA及其在气液两相流辨识中的应用[J];吉林大学学报(地球科学版);2009年01期
6 陈超;高宪军;李德鑫;;基于独立分量分析的混叠跳频信号分离算法[J];吉林大学学报(信息科学版);2008年04期
7 陈永彬;;TDMA信号态势信息获取技术[J];成都电子机械高等专科学校学报;2009年01期
8 闫彩虹;曾孝平;;基于ICA的胎儿心电信号提取算法的比较[J];重庆工学院学报(自然科学版);2009年10期
9 金骥;鲁华祥;;核ICA在电流传感器相位差监测中的应用[J];传感器与微系统;2008年12期
10 钟宝荣;吴春辉;杜红;;音频检索方法的研究[J];长江大学学报(自然科学版)理工卷;2008年02期
中国重要会议论文全文数据库 前10条
1 陈晋央;吴瑛;;基于独立分量分析的通信信号盲分离算法研究[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
2 胡楠;许洁萍;;音乐哼唱检索系统中元数据特征的提取[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 王小凤;耿国华;孙霞;张翔;;一个以句为单位的音乐哼唱检索算法[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
4 吕萍;王炜;颜永红;;音频匹配技术及其在音频检索中的应用[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
5 钟岑岑;苗振江;章洁;杜鲁燕;康丹丹;;汉语语音检索系统的设计与实现[A];第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文摘要集[C];2009年
6 丁晓敏;叶明;廖科;;快速独立分量分析算法在语音增强中的应用[A];中国通信学会第六届学术年会论文集(中)[C];2009年
7 王鋆;郑丽敏;吴平;;基于内容的音频检索综述[A];农业系统工程理论与实践研究——全国农业系统工程学术研讨会论文集[C];2006年
8 郑贵滨;韩纪庆;;基于听觉模型的模糊直方图音频索引和检索方法[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
9 张卫强;刘加;;网络音频数据检索技术[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
10 熊薇薇;梁巍;李莉;黄梅志;;基于混合核函数SVM的人脸识别方法研究[A];中国计量协会冶金分会2011年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 乔梁;信源定位的可观测性及跟踪技术研究[D];哈尔滨工程大学;2010年
2 郑贵滨;基于内容的音频信息检索技术研究[D];哈尔滨工业大学;2006年
3 庄毅;海量多媒体数据库的高效查询处理[D];浙江大学;2007年
4 王小凤;基于内容的音乐检索关键技术研究[D];西北大学;2008年
5 赵宸;MIMO-OFDM系统中的盲多用户检测研究[D];吉林大学;2008年
6 高颖;盲源分离理论及其在地球物理勘探中的应用[D];吉林大学;2008年
7 王俊元;基于ICA的工作模态参数辨识方法研究[D];太原理工大学;2008年
8 孙成立;语音关键词识别技术的研究[D];北京邮电大学;2008年
9 韩爽;风电场功率短期预测方法研究[D];华北电力大学(北京);2008年
10 何新;基于内容的音频信息分类检索技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 王春华;基于盲源分离的肺音信号提取研究[D];山东科技大学;2010年
2 蒋静;基于子空间的二阶统计量盲信道辨识算法研究[D];郑州大学;2010年
3 边峦剑;基于改进粒子群的盲源分离算法及其应用研究[D];哈尔滨工程大学;2010年
4 张国强;复杂信号分选算法研究与硬件设计[D];哈尔滨工程大学;2010年
5 李纯;P2P网络中基于内容的音乐信息检索[D];大连理工大学;2010年
6 王若冲;船舶动力设备振动评估及故障特性提取研究[D];大连理工大学;2010年
7 甄会;欠定盲分离混合矩阵估计方法的研究[D];大连理工大学;2010年
8 刘伯权;欠定卷积混合语音信号盲分离研究[D];湘潭大学;2010年
9 罗文兵;自适应教学科研信息推送服务模型研究[D];江西师范大学;2010年
10 刘义红;基于Bayes统计学习的语义图像检索研究[D];华东师范大学;2010年
【同被引文献】
中国期刊全文数据库 前8条
1 付显君;;试论DSP发展趋势[J];电脑知识与技术;2009年36期
2 刘国巍,梁钊,沈连丰;基于蓝牙技术的车载免提系统研究[J];电声技术;2003年11期
3 李扬,吴亚栋,刘宝龙;一种新的近似旋律匹配方法及其在哼唱检索系统中的应用[J];计算机研究与发展;2003年11期
4 赵芳;吴亚栋;宿继奎;;基于音轨特征量的多音轨MIDI主旋律抽取方法[J];计算机工程;2007年02期
5 王昉;;音乐检索现状及发展趋势研究[J];科技广场;2008年03期
6 王敏妲;;语音识别技术的研究与发展[J];微型机与应用;2009年23期
7 李宏梅;伍小芹;;有关语音识别技术的研究[J];现代电子技术;2010年08期
8 刘志强;;基于DTW的哼唱识别系统的研制[J];信息与电脑(理论版);2009年12期
中国硕士学位论文全文数据库 前10条
1 李旭杰;蓝牙应用模型的研究与免提应用模型的实现[D];河海大学;2004年
2 董国军;蓝牙无线通信技术及其应用研究[D];天津大学;2004年
3 付贤辉;蓝牙耳机剖面协议的研究及其实现[D];天津大学;2005年
4 李建辉;嵌入式蓝牙语音通信设备的设计[D];天津大学;2004年
5 王红园;蓝牙技术在车载信息系统中的应用研究[D];吉林大学;2006年
6 芮亚楠;嵌入式蓝牙高级音频应用系统的研究与实现[D];国防科学技术大学;2005年
7 涂友斌;多功能车载免提电话系统的设计及实现[D];东南大学;2006年
8 栾颖;基于蓝牙技术和GPS技术的军车智能管理系统的设计与实现[D];东南大学;2006年
9 谢晓;基于蓝牙无线局域网的文件传输系统的研究与设计[D];北京邮电大学;2007年
10 高艳旭;基于蓝牙技术的车载免提系统研究[D];东北农业大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 罗大光;郝玉洁;刘乃琦;;一种非常快速的字符串匹配算法[J];电子科技大学学报;2005年06期
2 蔡莲红,胡其炜,张维;基于音频内容的检索技术[J];多媒体世界;1997年12期
3 王先全,李建蜀;WAVE声音文件格式的分析及其合成[J];电脑开发与应用;1999年07期
4 张宝华;张品;;基于旋律的音乐检索系统[J];电声技术;2005年12期
5 薛锋,杨宗英,郑巧英,黄敏;基于内容的音乐检索[J];大学图书馆学报;1999年04期
6 张文耀,许刚,王裕国;循环AMDF及其语音基音周期估计算法[J];电子学报;2003年06期
7 齐俊英,孙劲光,高爱东;基于内容的音频自动分类方法[J];辽宁工程技术大学学报;2005年S1期
8 庄越挺,毛祎,吴飞,潘云鹤;基于隐马尔可夫链的广播新闻分割分类[J];计算机研究与发展;2002年09期
9 李扬,吴亚栋,刘宝龙;一种新的近似旋律匹配方法及其在哼唱检索系统中的应用[J];计算机研究与发展;2003年11期
10 冯雅中,庄越挺,潘云鹤;一种启发式的用哼唱检索音乐的层次化方法[J];计算机研究与发展;2004年02期
中国硕士学位论文全文数据库 前1条
1 赵静;基于内容的音乐检索系统研究[D];西北大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 赵力,邹采荣,吴镇扬;基于分段模糊聚类算法的VQ-HMM语音识别模型参数估计[J];电路与系统学报;2002年03期
2 汪红;韩飞;王建;马延平;钟滙;李贺;;基于FPGA的语音识别拨号系统的设计与实现[J];电脑知识与技术;2011年10期
3 荆嘉敏,刘加,刘润生;基于HMM的语音识别技术在嵌入式系统中的应用[J];电子技术应用;2003年10期
4 赵力,邹采荣,吴镇扬;基于FVQ/HMM的无教师说话人自适应[J];电子学报;2002年07期
5 孙恺 ,容太平;基于TMS320VC5409的语音识别模块[J];电子产品世界;2002年06期
6 国辛纯;郭继昌;窦修全;;基于HMM的语音信号情感识别研究[J];电子测量技术;2006年05期
7 鲁梓贞 ,彭容修;基于ADSP-2181的语音识别模块[J];国外电子元器件;2002年06期
8 林坤辉;息晓静;周昌乐;;基于HMM与神经网络的声学模型研究[J];厦门大学学报(自然科学版);2006年01期
9 陈志鑫,郭华伟;基于TMS320C54×DSP的实时语音识别系统[J];半导体技术;2001年04期
10 赵力,刘怡龙,邹采荣,高西奇,吴镇扬;基于VQ-HMM的无教师说话人自适应方法[J];东南大学学报(自然科学版);2001年02期
中国重要会议论文全文数据库 前10条
1 曹文明;叶虹;徐春燕;王守觉;;基于双权值神经网络的数字语音识别研究[A];2005中国控制与决策学术年会论文集(下)[C];2005年
2 计天颖;王作英;陆大金;;有限命令集连续语音识别[A];第三届全国人机语音通讯学术会议论文集[C];1994年
3 余鹏;王作英;;语音识别码本状态间的线性和非线性相关性[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 宋君;葛余博;;应用于鲁棒语音识别的置信度加权特征丢失法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
5 靳慧龙;;基于DSP的电视语音拨号遥控技术[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
6 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
7 张超;刘轶;郑方;;面向多口音语音识别的声学模型重构方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 马晓川;刘冬;赵荣椿;;孤立短语隐马尔可夫模型自动建模软件的实现[A];第四届全国人机语音通讯学术会议论文集[C];1996年
9 郭晨;;汉语语音技术[A];第一届学生计算语言学研讨会论文集[C];2002年
10 赵海滨;王宏;闻绍飞;;嵌入式语音识别控制机械手的系统设计[A];第二届全国信息获取与处理学术会议论文集[C];2004年
中国重要报纸全文数据库 前10条
1 中国科学院声学研究所研究员 俞铁城;解析语音识别的发展现状[N];通信产业报;2004年
2 黄梦;方案商积极切入语音识别市场[N];电脑商报;2006年
3 本报记者 刘学习;认准语音识别的“内核”[N];计算机世界;2002年
4 ;“超人类语音识别”计划[N];中国计算机报;2002年
5 ;Intel涉足语音识别[N];计算机世界;2003年
6 本报记者 艾文;语音识别:IBM继续领跑[N];中国计算机报;2001年
7 小雷;芝麻开门[N];电脑商报;2006年
8 记者 潘治;汽车真能听话[N];新华每日电讯;2002年
9 闫婷;语音识别 理想与现实的距离[N];计算机世界;2007年
10 本报记者 钟洪奇;Pattek语音识别产品: 找一条走得通的路[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 刘纪平;多重演化神经网络在语音识别中的应用[D];武汉大学;2011年
2 吕钊;噪声环境下的语音识别算法研究[D];安徽大学;2011年
3 奉小慧;音频噪声环境下唇动信息在语音识别中的应用技术研究[D];华南理工大学;2010年
4 丁沛;语音识别中的抗噪声技术[D];清华大学;2003年
5 刘庆升;计算机辅助普通话发音评测关键技术研究[D];中国科学技术大学;2010年
6 田斌;实用化汉语语音识别理论及关键技术研究[D];西安电子科技大学;1999年
7 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
8 陈伟;语音识别声学建模中的主动学习研究[D];北京邮电大学;2011年
9 陈伟;语音识别声学建模中的主动学习研究[D];北京邮电大学;2011年
10 许超;带噪语音信号处理中的稳健性加权方法[D];清华大学;2005年
中国硕士学位论文全文数据库 前10条
1 李晨;结合语音识别技术的音乐哼唱检索研究[D];西北大学;2008年
2 康燕;基于HMM的情感语音识别[D];太原理工大学;2011年
3 郭恒飞;基于非特定人车载电器语音集成控制系统的设计与实现[D];合肥工业大学;2011年
4 张静亚;基于HMM的汉语连续数字语音识别[D];苏州大学;2005年
5 王一平;用遗传算法改进HMM的语音识别算法研究[D];太原理工大学;2007年
6 张俊;基于HMM与ANN混合结构的语音识别系统研究[D];中南大学;2009年
7 叶虹;基于高维空间点覆盖理论非特定人问候语的语音识别[D];浙江工业大学;2005年
8 纪正飚;基于ARM技术的语音识别研究[D];河海大学;2007年
9 李星星;基于HMM的汉语语音关键词检测研究与实现[D];武汉理工大学;2009年
10 王霅煜;基于VQ和ASR的多媒体课件检索[D];上海交通大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026


丁香五月 啪综合