收藏本站
《南京大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

基于内容的音频分析与场景识别

王公友  
【摘要】:基于内容的音频分析和场景识别是多媒体领域一个新兴的研究方向,在国内外仍出于探索研究阶段。音频信号主要分为有结构信号和无结构信号两类。一直以来,有结构音频信号的处理主要集中在语音识别和音乐检索等方面的研究。基于无结构的环境场景音频信号识别技术的研究还不多。如何提取音频中的摘要信息和语义内容是基于内容的音频分析技术的关键所在,具有重要的理论研究价值和实际应用前景。现有的音频检索算法往往局限于特定的音频类型,并对音频的结构的构成有很大的限制(如基于相似度分析的音乐检索算法)。基于监督学习和无监督学习算法在音频信息检索过程中都有自身的局限性。本文分析了这两种音频检索算法的优缺点,并提出了一种基于内容的音频分析方法和场景识别算法。实验结果表明,该方法对于环境场景声音具有很好的检索效果。对于输入的音频数据,首先本文根据音频环境场景的变化对其进行音频分割,并提取音频分割片段的特征。通过谱聚类将相似的音频分割片段聚类在一起,作为音频事件进行处理。然后对音频事件中的背景声音事件和关键音频事件进行检测,并计算音频事件的主特征向量,通过音频事件主特征向量的相似度对音频事件进行标定。最后,提出了一个上下文模型对音频事件中的错误标定的音频片段进行更正并通过对比基于伪语义特征的场景识别模型,给出了一种更加简单、计算复杂度小的场景识别模型。该模型通过对每个训练场景都建立一个HMM模型,实现测试场景数据的分类。
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TN912.3

【相似文献】
中国期刊全文数据库 前10条
1 陈宇海;;三种音频处理设备的介绍及使用[J];声屏世界;2007年09期
2 黄汝逊;;几个小软件在音频处理中的应用[J];音响技术;2008年07期
3 David Katz;Rick Gentile;Tomasz Lukasiak;;嵌入式音频处理基础(一)[J];电子产品世界;2008年08期
4 David Katz;Rick Gentile;Tomasz Lukasiak;;嵌入式音频处理基础(二)[J];电子产品世界;2008年09期
5 David Katz;Rick Gentile;Tomasz Lukasiak;;嵌入式音频处理基础(3)[J];电子产品世界;2008年11期
6 林剑;刘笑;;几款音频后期处理软件的简介和使用[J];电视字幕(特技与动画);2009年04期
7 于寅虎;;音频处理技术随便携式电子产品需求发展[J];电子产品世界;2009年12期
8 ;2013年是音频处理系统去整合化的转折之年[J];电子产品世界;2012年07期
9 熊先锋;;计算机音频处理[J];计算机光盘软件与应用;2012年12期
10 周建勇;;音频网络传输设备设计的探讨[J];中国新通信;2012年15期
中国重要会议论文全文数据库 前7条
1 廉明涛;;音频处理在中波转播台的应用[A];2005年广播电视技术论文汇编[C];2005年
2 何冬梅;高文;;MPEG音频编码器的软件实时实现[A];第五届全国人机语音通讯学术会议论文集[C];1998年
3 王兴国;蒋伟峰;刘济林;顾伟康;;现代音频处理的DSP方案[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
4 张承云;;TMS320C54xx DSP的音频数据收发技术及实现[A];2006年声频工程学术交流会论文集[C];2006年
5 吴烁宇;;基于C-SKY CPU的音频处理SoC设计[A];《IT时代周刊》2013年度论文集[C];2013年
6 于建华;;电视广播中的音频嵌入技术[A];中国电影电视技术学会影视科技论文集[C];2002年
7 舒平;钟民主;杨琳;;舱音记录器译码系统的改进[A];探索创新交流--中国航空学会青年科技论坛文集[C];2004年
中国重要报纸全文数据库 前10条
1 小新;打造个人音频工作室[N];中国电脑教育报;2003年
2 ;德州仪器推出全新DSP[N];人民邮电;2006年
3 罗清岳;3D环绕功能与扬声放大器的单芯片设计[N];电子资讯时报;2007年
4 宁夏 杨勇杰;清华紫光8017B超级VCD机维修两例[N];电子报;2006年
5 四川 贺学金;网影HD360全高清多媒体播放器音频、视频信号处理电路分析与故障检修(下)[N];电子报;2011年
6 湖北 王绍华;日立VT-M757E(DH)录像机 检修一例[N];电子报;2004年
7 ;飞思卡尔半导体24位音频数字信号处理器产品简介[N];电子资讯时报;2004年
8 龙哥;软件应用问答[N];中国计算机报;2004年
9 ADI高级应用工程师 Ke Ning Gabby Yi;先进压缩标准引发音视频同步化技术热[N];中国电子报;2007年
10 重庆 杨清德;创维DVD-948P碟机信号流程及IC引脚数据(下)[N];电子报;2006年
中国博士学位论文全文数据库 前4条
1 张聪;面向3G通信的移动音频关键技术研究[D];武汉大学;2010年
2 李辉;改进的离散余弦反变换迭代算法研究与音频DSP核设计[D];电子科技大学;2010年
3 郑贤中;高指向性音频声波理论与控制研究[D];华中科技大学;2006年
4 杨艳秋;强鲁棒的音频掩密与扩频掩密分析研究[D];重庆大学;2009年
中国硕士学位论文全文数据库 前10条
1 胡伟;音频指纹技术及其在广播音乐版权中的应用[D];电子科技大学;2014年
2 尹翠微;初级音频处理软件界面设计的图形语言研究[D];北京理工大学;2015年
3 李琼;基于信号与内容特征的音频判决系统的研究与实现[D];电子科技大学;2015年
4 田帅帅;基于MirrorLink协议的音频传输与巾贞缓冲优化[D];东北大学;2013年
5 林平;基于音乐特征解析的音乐喷泉展示系统的设计与实现[D];电子科技大学;2014年
6 张明;变电站主设备工况音频监控系统[D];长沙理工大学;2014年
7 熊雨新;基于WebRTC引擎的音频视频交互系统设计与实现[D];电子科技大学;2014年
8 王宇;新闻通讯社音频移动报道系统设计与实现[D];天津大学;2014年
9 王公友;基于内容的音频分析与场景识别[D];南京大学;2013年
10 沈玥;基于手机音频处理原理的音频缺陷分析与检测方法改进[D];天津大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026


丁香五月 啪综合