收藏本站
《大连理工大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

面向查询理解的扩展词排序模型研究与应用

徐博  
【摘要】:近年来,随着互联网数据规模的持续增长,信息检索技术得到广泛关注,并被应用于多种垂直领域检索场景。信息检索旨在根据用户查询,在大规模数据中查找与查询相关的文档或网页,并根据其相关程度给出相应的排序列表。而用户提交给搜索引擎的查询往往仅包含少量关键词,很难全面描述用户的信息需求,进而对查询意图的理解带来模糊性和不确定性,因此,如何准确有效地理解用户查询对于检索性能的提升至关重要,也是信息检索性能优化的核心方向之一。为精确地理解用户查询,提升检索性能,本文从如下三个方面展开研究,具体内容包括:1、针对伪相关反馈中的扩展词选择问题,提出一种基于伪相关反馈的扩展词排序模型。该模型以伪相关反馈方法为基础,将排序学习作为核心技术,通过监督学习构建候选扩展词排序模型,用以选择最符合用户信息需求的扩展词,补充和完善原始查询,提高扩展查询的质量。在模型构建中,分别对候选扩展词选择、扩展词相关性标注、扩展词特征抽取和排序模型构建等方面给出具体优化策略,并基于三个标准TREC检索数据集展开实验,实验结果表明本文方法能够有效提升通用领域信息检索的性能。2、针对生物医学文献检索中的查询理解问题,提出一种面向生物医学文献检索的扩展词排序模型。该模型以现有基于伪相关反馈的扩展词排序模型为基础,融合生物医学领域知识,优化候选扩展词选择和特征抽取,并基于查询主题信息标注候选扩展词相关性。在模型构建中,提出一种基于词项分组的候选扩展词排序方法,该方法以组排序学习为基础,优化生物医学扩展词排序的样本空间。在两个标准TREC生物医学文献检索数据集上的实验结果表明该方法能够有效提升生物医学文献检索的性能。3、针对代码信息检索中的查询理解问题,提出一种面向代码信息检索的扩展词排序模型。该模型以基于伪相关反馈的扩展词排序模型为基础,融合代码片段和代码文件相关信息,优化候选扩展词选择、候选扩展词特征抽取以及候选扩展词相关性标注策略。在模型构建中,提出一种基于查询级排序自编码算法的扩展词排序模型,该模型采用查询级自编码算法优化排序学习特征空间,以提高扩展词排序的准确率。在现有代码片段检索数据集上的实验结果表明该方法能够有效改善代码信息检索的性能。本论文研究工作面向信息检索中的查询理解问题,构建扩展词排序模型,并将其应用于两类垂直检索任务,改进了查询扩展中扩展词选择效果,有助于更加准确地理解用户检索意图,同时,该研究也可以推广并应用于其他相关检索任务。
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP391.3

【参考文献】
中国期刊全文数据库 前2条
1 周栋;刘建勋;张三蓉;;基于矩阵分解的伪相关反馈技术[J];模式识别与人工智能;2015年08期
2 黄名选;严小卫;张师超;;基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J];软件学报;2009年07期
【共引文献】
中国期刊全文数据库 前10条
1 张兰芳;年梅;李芳;;信息查询扩展发展研究[J];计算机时代;2015年11期
2 仲兆满;李存华;胡云;;基于迭代策略的微博事件查询扩展方法[J];情报学报;2015年09期
3 周秀梅;黄名选;;基于项权值变化的完全加权正负关联规则挖掘[J];电子学报;2015年08期
4 周栋;刘建勋;张三蓉;;基于矩阵分解的伪相关反馈技术[J];模式识别与人工智能;2015年08期
5 黄名选;黄发良;严小卫;兰慧红;;基于项权值变化和SCCI框架的加权正负关联规则挖掘[J];控制与决策;2015年10期
6 张乃洲;;基于时间点击图挖掘的查询建议方法[J];计算机工程;2015年05期
7 周秀梅;黄名选;;基于项权值变化的矩阵加权关联规则挖掘[J];计算机应用研究;2015年10期
8 余如;黄丽霞;黄名选;;教育信息化数据中完全加权正负关联模式发现[J];计算机应用与软件;2015年04期
9 余如;黄名选;黄丽霞;;基于互信息的教育数据矩阵加权正负关联模式发现[J];数据采集与处理;2015年01期
10 刘梦飞;;分布式激振频率数据库粒子匮乏补偿算法[J];科技通报;2014年12期
【二级参考文献】
中国期刊全文数据库 前9条
1 张付志;刘赛;李忠华;孙继浩;;融合用户评论和环境信息的协同过滤推荐算法[J];小型微型计算机系统;2014年02期
2 王序文;王小捷;孙月萍;;双语主题跨语言伪相关反馈[J];北京邮电大学学报;2013年04期
3 孙冬婷;何涛;张福海;;推荐系统中的冷启动问题研究综述[J];计算机与现代化;2012年05期
4 吴丹;何大庆;王惠临;;一种基于相关反馈的跨语言信息检索查询翻译优化技术研究[J];情报学报;2012年04期
5 杨阳;向阳;熊磊;;基于矩阵分解与用户近邻模型的协同过滤推荐算法[J];计算机应用;2012年02期
6 黄名选;严小卫;张师超;;基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J];软件学报;2009年07期
7 黄名选;严小卫;张师超;;查询扩展技术进展与展望[J];计算机应用与软件;2007年11期
8 崔航,文继荣,李敏强;基于用户日志的查询扩展统计模型[J];软件学报;2003年09期
9 谭义红,林亚平;向量空间模型中完全加权关联规则的挖掘[J];计算机工程与应用;2003年13期
【相似文献】
中国期刊全文数据库 前10条
1 周星璞;选择价值工程改进对象的动态排序模型[J];上海机械学院学报;1988年03期
2 陈永伟;张策;王夏华;;一种估计和检验排序模型中结构变化的方法及应用[J];数量经济技术经济研究;2017年08期
3 王扬;黄亚楼;卢敏;庞晓东;谢茂强;刘杰;;直接优化性能指标的多排序模型融合方法[J];计算机学报;2014年08期
4 吴松林;;机译统计片语排序模型介绍[J];科技咨询导报;2006年09期
5 刘方强;;公租房实物配租轮候排序模型及其应用[J];山西建筑;2011年04期
6 郑晨;王俊涛;徐军凯;田东呵;;基于模糊二次评判的防空兵进攻作战保卫目标排序模型[J];兵工自动化;2007年05期
7 章志敏;李继乾;;层次分析中的一种动态排序模型[J];运筹学杂志;1990年01期
8 刘伟;刘柏嵩;王洋洋;;融合网络图模型和排序模型的论文个性化推荐算法[J];数据通信;2019年02期
9 曹迎槐;;基于标准C的M×N排序模型工期求解算法仿真与实现[J];公安海警学院学报;2012年03期
10 潘燕妮;王震;刘明明;赵林;李阳;薛庆;;跨国石油公司风险分级与排序模型构建及应用[J];中国石油大学学报(社会科学版);2012年01期
中国重要会议论文全文数据库 前9条
1 李波;邱锡鹏;吴立德;;使用语法分析和统计方法构建问答系统的答案排序模型[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 曹迎槐;;排序模型之TKW递推算法研究[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
3 吴强;王同根;;Fuzzy—grey综合评判排序模型[A];数学及其应用文集——中南模糊数学和系统分会第三届年会论文集(下卷)[C];1995年
4 刘广军;李瑞芹;;2×n排序模型在装备战场抢修决策中的应用[A];系统仿真技术及其应用(第16卷)[C];2015年
5 陈晨;金涛;张浩义;;混流生产计划排序模型研究[A];第十三届河南省汽车工程科技学术研讨会论文集[C];2016年
6 孙萌;姚建民;吕雅娟;刘群;姜文斌;;基于最大熵短语重排序模型的特征抽取算法改进[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 李文权;杜文;;铁路技术站调机运用排序模型及算法[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
8 崔洪军;陆建;王炜;;不确定多属性公路建设项目排序模型[A];可持续发展的中国交通——2005全国博士生学术论坛(交通运输工程学科)论文集(上册)[C];2005年
9 李继乾;苏醒;黄奇成;魏翠萍;;区间数判断矩阵的排序及一致性改进算法[A];第四届全国决策科学/多目标决策研讨会论文集[C];2007年
中国博士学位论文全文数据库 前7条
1 徐博;面向查询理解的扩展词排序模型研究与应用[D];大连理工大学;2018年
2 程明宝;工件加工时间非恒定的排序模型研究[D];上海大学;2006年
3 彭公孚;面向信息融合的句子排序若干关键技术研究[D];武汉大学;2010年
4 程凡;基于排序学习的信息检索模型研究[D];中国科学技术大学;2012年
5 陈德品;基于迁移学习的跨领域排序学习算法研究[D];中国科学技术大学;2010年
6 潘志斌;半监督排序的若干关键问题研究[D];华中科技大学;2014年
7 林原;信息检索中排序学习方法的研究[D];大连理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 冷海涛;抽取式作文生成研究[D];哈尔滨工业大学;2018年
2 乔猛;领域化词向量的融合排序模型研究[D];重庆大学;2018年
3 赵轩;基于深度学习的排序模型的研究与实现[D];北京邮电大学;2018年
4 杨成;基于排序模型的个性化推荐系统设计及研究[D];北京邮电大学;2018年
5 李杨;机器学习排序模型在个性化推荐系统中的应用研究[D];北京邮电大学;2018年
6 吕豪;基于排序的图像美学质量评估[D];中国科学技术大学;2017年
7 翟倩;在线评论有用性排序模型研究[D];吉林大学;2017年
8 李梁;面向不同对象的搜索引擎中的排序模型与性能评价[D];中国科学技术大学;2016年
9 姬赛;两类半在线排序模型的算法性能分析[D];湖南师范大学;2016年
10 徐菁;点评类社区高效评论挖掘研究[D];华南理工大学;2016年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026


丁香五月 啪综合