收藏本站
《吉林大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于神经网络的音乐音频自动合成的研究与实现

冯婷婷  
【摘要】:音乐与人类生活息息相关,是人们抒发情感、歌唱生活的一种重要的表达方式。而随着人工智能在近年来的飞速进度以及渗入到各个领域的应用,也给计算机音乐带来了不小的发展,其中算法作曲是计算机音乐的一个重要研究分支,旨在利用计算机技术使创作者在作曲的过程中的人为因素降到最低,从而达到自动化作曲的目的。计算作曲通常是以乐谱为研究对象,利用算法通过某种策略控制生成音符序列,进而组成音乐旋律,最终得到完整乐谱。此类的方法存在的问题是,它们需要基于大量的音乐知识规则:只有当乐理规则引入量足够大时,才能使算法变得有效;且当我们想获得直观听觉感受时,只用通过演奏家的演奏或利用MIDI设备来实现。而以音频为研究对象进行人工智能(Artificial Intelligence,AI)作曲,可以使计算机自动生成音乐片段的排列组合,以生成新的音乐音频。基于音频的AI作曲不依赖大量的音乐知识规则,同时又能传递给听众以直观感受。因此,该类算法比传统基于乐谱的作曲方法更具有实用性。本文就将以音乐音频作为研究对象,基于递归神经网络提出一种新的自动合成乐曲算法。以音频为研究对象的音乐自动合成的框架主要包括了音频文件解析,音乐音频特征以及应用于自动作曲的模型。在音频文件解析部分详细介绍了音频文件的结构组成,以及其中与本实验相关的重要参数,为之后顺利进行实验操作打下基础;在音乐音频特征部分,介绍了包括梅尔频率倒谱系数、线性预测编码、过零率、短时能量值等特征;在应用于自动作曲的模型中,着重介绍了人工神经网络中在自动作曲算法领域最活跃的循环神经网络以及长短时记忆模型和门控循环单元模型两种变体,这也是本文所研究的基础模型。其次详细描述了基于神经网络的音乐音频自动合成算法,首先将音乐音频自动合成问题进行了形式化的描述,提出了单位音乐,单位音乐向量,AI生成音乐等概念,将音乐创作表示成为可过程化的问题;然后对提取单位音乐的音频特征及其过程进行了详细的描述;之后详细描述了音乐音频的预测和合成过程,并给出了算法描述;最后,将直接影响到听众直观听觉感受的音频拼接合成部分进行了介绍,提出了先行削弱和增强的方法进行叠加拼接,从而达到平滑拼接的效果。最后本文对算法模型进行了一系列的实验,包括了基于LSTM模型的音乐音频自动合成实验,加入了人机交互的实验以及基于GRU的音乐音频自动合成实验,实验结果标明,基于LSTM的实验所生成的音乐中,得分最高的通常是被大众所熟知的如致爱丽丝的曲目,而在除了熟知度更高的曲目外,模型生成曲目与人工作曲曲目排名分布均匀,表明听众并不能区分人工与智能作曲的区别,达到了本实验的目的。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TN912.3;TP183

【参考文献】
中国期刊全文数据库 前9条
1 吴艳花;;语音短时幅度和短时过零率分析与应用[J];电脑知识与技术;2009年33期
2 崔学敏;张力;赵文靖;;常用多媒体视频、音频文件格式综述[J];山西电子技术;2007年03期
3 苏彤;;数字音频文件格式[J];图书馆学刊;2006年04期
4 刘涧泉;;第三种作曲方式——论计算机音乐创作的新思维[J];中国音乐;2006年03期
5 冯寅;周昌乐;;算法作曲的研究进展[J];软件学报;2006年02期
6 陈功;王振力;张建兵;;基于短时能量的语音/音乐快速分类[J];电子技术应用;2006年01期
7 余立功,卜佳俊,陈纯;计算机音乐研究初探[J];计算机工程与应用;2005年04期
8 史水平,李世作;线性预测编码(LPC)技术及其在音频文件上的应用[J];现代电子技术;2004年04期
9 王尚武;语音压缩中的线性预测编码技术[J];微机发展;2002年06期
【共引文献】
中国期刊全文数据库 前10条
1 田梅;刘瑶;周冰颖;余亮;黄智兴;;结合Kinect与MIDI的和声辅助训练系统[J];计算机应用与软件;2015年08期
2 刘晓晖;;传统作曲与电子音乐作曲观念及技法的对比[J];音乐时空;2015年15期
3 吴海霞;李艳玲;刘潞锋;;基于内容和旋律的音频片段识别与检索[J];太原师范学院学报(自然科学版);2015年02期
4 多杰太;;计算机音乐创作的作曲方式素描[J];音乐时空;2015年09期
5 郭东东;马克;;基于波形编码技术的IP网络电话[J];电脑知识与技术;2015年11期
6 翁诗杰;李维华;丁海燕;;基于贝叶斯网研究自动作曲中音高的表示和推理[J];计算机科学;2014年S2期
7 刘臻;;从音乐素材的组织方式看计算机作曲与传统作曲的异同[J];通俗歌曲;2014年09期
8 范翎;;论新媒体技术对当代电影音乐创作的影响[J];现代电影技术;2014年09期
9 王占威;;计算机音乐的思维与美学性研究[J];北方音乐;2014年06期
10 谢可;姚鸿强;;基于PWM的数字音频播放器设计[J];计算机应用与软件;2014年05期
【二级参考文献】
中国期刊全文数据库 前10条
1 吴恬盈;;一种新的清浊音在线辨识法[J];计算机仿真;2007年04期
2 周家新;王长松;汪建新;李枝梅;;基于短时幅度-过零率函数识别抽油井液面回波[J];化工自动化及仪表;2007年02期
3 武光利;戴玉刚;马宁;;基于短时平均幅度和短时平均过零率的藏语语音端点检测研究[J];福建电脑;2007年03期
4 熊琦;杜旭;朱晓亮;;一种基于短时平均幅度差的语音检测算法[J];电声技术;2006年09期
5 李昱;林志谋;黄云鹰;卢贵主;;基于短时能量和短时过零率的VAD算法及其FPGA实现[J];电子技术应用;2006年09期
6 廖逢钗;卢昌荆;王红雨;;基于短时平均幅度的语音端点检测的改进[J];三明学院学报;2006年02期
7 张仁志,崔慧娟;基于短时能量的语音端点检测算法研究[J];电声技术;2005年07期
8 冯康,时慧琨;一种参考短时平均能量和平均幅度差函数的基音检测方法[J];淮南师范学院学报;2003年05期
9 马祥杰,孟相如,张百生;一种自相关基音检测算法[J];通信技术;2003年05期
10 卢坚 ,陈毅松 ,孙正兴 ,张福炎;语音/音乐自动分类中的特征分析[J];计算机辅助设计与图形学学报;2002年03期
【相似文献】
中国期刊全文数据库 前10条
1 买热木沙·托呼提;;音频编辑软件在音频降噪方面的应用[J];电视指南;2017年08期
2 田劲;;多媒体会议中音频处理单元的设计与实现[J];武汉理工大学学报;2009年15期
3 张玉奇,陈树宝,孙锟,王荣发,刘斌,王威琪,汪源源,倪金洪,高玲玲,郁怡;应用音频处理系统无创自动估测肺动脉压的研究[J];中国超声医学杂志;1999年05期
4 王祖立 ,邬惠林;YC-2K型音频处理装置[J];广播与电视技术;1988年04期
5 于寅虎;;音频处理技术随便携式电子产品需求发展[J];电子产品世界;2009年12期
6 David Katz;Rick Gentile;Tomasz Lukasiak;;嵌入式音频处理基础(一)[J];电子产品世界;2008年08期
7 David Katz;Rick Gentile;Tomasz Lukasiak;;嵌入式音频处理基础(3)[J];电子产品世界;2008年11期
8 刘毓敏;用好Adobe Premiere中的音频处理工具[J];实用影音技术;2005年02期
9 张秀常;;音频处理任我行[J];浙江教育技术;2013年04期
10 ;2013年是音频处理系统去整合化的转折之年[J];电子产品世界;2012年07期
中国重要会议论文全文数据库 前5条
1 廉明涛;;音频处理在中波转播台的应用[A];2005年广播电视技术论文汇编[C];2005年
2 王兴国;蒋伟峰;刘济林;顾伟康;;现代音频处理的DSP方案[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 赵侠;刘志刚;;音频响度分析研究[A];天津市电子工业协会2018年年会论文集[C];2018年
4 吴烁宇;;基于C-SKY CPU的音频处理SoC设计[A];《IT时代周刊》2013年度论文集[C];2013年
5 杨伟斌;;基于以太网的音频传输技术比较及应用[A];中国新闻技术工作者联合会第六次会员代表大会、2014年学术年会暨第七届《王选新闻科学技术奖》和优秀论文奖颁奖大会论文集(三等奖)[C];2014年
中国重要报纸全文数据库 前10条
1 ;音频处理[N];电脑报;2001年
2 ;体验X-Ripper录制音乐[N];电脑报;2002年
3 木哥;闪亮的音乐精灵[N];计算机世界;2002年
4 甄书秀;手机突围支点:创新和速度[N];中国质量报;2006年
5 ;Analog Devices 公司发布SoundMAX2.0系统[N];中国高新技术产业导报;2001年
6 ;德州仪器推出全新DSP[N];人民邮电;2006年
7 屈歌;谨防听录音的“陷阱”[N];音乐周报;2015年
8 本报记者 黄志昕;Intel革命,DIY没命?[N];计算机世界;2004年
9 记者  母晓洁;DTS:拓展中国市场水到渠成[N];中国电子报;2006年
10 王新禧;APE音乐还原高品质CD[N];中国电脑教育报;2004年
中国博士学位论文全文数据库 前1条
1 郑贤中;高指向性音频声波理论与控制研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 朱田恬;复杂场景下的音频序列切分方法的研究[D];哈尔滨工业大学;2018年
2 范苍宁;基于音频内容重复性的广播广告检测[D];哈尔滨工业大学;2018年
3 张立赛;复杂场景下的音频自动标注方法[D];哈尔滨工业大学;2018年
4 冯婷婷;基于神经网络的音乐音频自动合成的研究与实现[D];吉林大学;2018年
5 于晨晨;安全监控中音频事件检测的关键问题研究[D];北京邮电大学;2018年
6 王一平;一种基于大数据的VoIP音频溯源方法的研究与实现[D];北京邮电大学;2018年
7 李召;基于安卓音频口通信的多参生理采集系统设计[D];河北大学;2017年
8 欧阳娣;基于嵌入式的音频处理和播放系统的设计[D];中南大学;2013年
9 冷娇娇;钢琴乐音的音频分割算法研究[D];武汉工程大学;2016年
10 张学波;基于DSP的视频音频处理系统设计与研究[D];西安电子科技大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026


丁香五月 啪综合