收藏本站
《浙江大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于主题模型的模块化网络和社区挖掘研究

骆国靖  
【摘要】: 随着计算机技术和网络技术的发展,大量的数字图书馆被建设,给我们提供了丰富的数字化信息资源和大量的文献数据信息。文献数据包括了大量的信息,如文本信息、链接信息、社会信息,通过对其进行分析和挖掘,可以发现大量有用或潜在的知识,能够有效地提高研究者对科技文献的整理和总结,对研究领域的理解和把握,进而帮助和指导研究者开展更加有效的科学研究工作。 本文主要针对文献数据,进行了一些挖掘研究和分析,主要的工作内容,创新贡献如下: 1)引入文献数据中的会议信息到主题模型中,提出了Conference-Author-Topic的主题抽取模型,不仅可以获得文献数据整体的主题信息,同时也挖掘了作者和会议的主题分布。改进后的CAT主题模型使得抽取的主题更加准确和合理,也方便了对作者、会议在主题信息上的进一步分析和研究工作; 2)在主题抽取的基础上,提出了主题相互影响的模块化网络的构造方法。首先从主题模型的结果中获得主题强度的时间序列数据,对其采用分段线性化来消除局部波动,最后构造主题相互影响的模块化网络。模块化网络的构造使研究者能够准确地理解研究领域的演化规律,掌握发展趋势,指导科研工作的开展。 3)设计了基于主题抽取的社区挖掘方法。针对文献数据的研究者关系网络,利用主题模型直接找出能够反映用户需求的社区的本质关系,即研究者的主题信息,以此挖掘的社区更加符合了现实的需求和意义。 4)对社区及其成员的网络结构进行了研究分析,提出了基于page-rank算法的社区排名方法。这不像传统的对社区组织的评价方法总是基于一些统计量上的分析。
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:G250.7;TP311.13

【引证文献】
中国硕士学位论文全文数据库 前2条
1 马秀敏;中国典型管理期刊文献主题发现与演化分析[D];大连理工大学;2011年
2 严姣;基于主题模型的社区发现研究[D];西南大学;2012年
【参考文献】
中国期刊全文数据库 前1条
1 杨楠,弓丹志,李忺,孟小峰;Web社区发现技术综述[J];计算机研究与发展;2005年03期
【共引文献】
中国期刊全文数据库 前10条
1 张永平;丰志刚;李从东;;一种基于流量的Web社区挖掘方法[J];燕山大学学报;2007年05期
2 段晓东;王存睿;刘向东;张庆灵;;基于网络权重的多社团网络结构划分算法[J];复杂系统与复杂性科学;2009年03期
3 段滢滢;陆锋;;基于道路结构特征识别的城市交通状态空间自相关分析[J];地球信息科学学报;2012年06期
4 李梅;;基于Windows平台的POS信息系统的设计与实现[J];华商;2007年Z3期
5 林友芳;王天宇;唐锐;周元炜;黄厚宽;;一种有效的社会网络社区发现模型和算法[J];计算机研究与发展;2012年02期
6 樊鹏翼;王晖;姜志宏;李沛;;微博网络测量研究[J];计算机研究与发展;2012年04期
7 刘馨月;赵明砚;张宪超;刘芳芳;;基于最大流HITS的改进算法[J];计算机工程与应用;2008年17期
8 李翠;;面向CRIC的Web社区发现方法研究[J];计算机工程与应用;2009年25期
9 段晓东;王存睿;刘向东;林延平;;基于粒子群算法的Web社区发现[J];计算机科学;2008年03期
10 杨茹;陶晓鹏;;社团挖掘和话题监控的互动模型研究[J];计算机应用;2009年03期
中国博士学位论文全文数据库 前7条
1 余伟;基于用户个性挖掘的Web社区营销研究[D];武汉大学;2011年
2 杨洪礼;非负矩阵与张量分解及其应用[D];山东科技大学;2011年
3 王刚;基于本体的服务模型及方法研究[D];西南大学;2008年
4 张永平;基于分散型工作流系统的人力资源共享问题研究[D];天津大学;2007年
5 葛继科;语义网格环境中的服务匹配研究[D];西南大学;2009年
6 蒲国林;基于QoS的服务模型与方法研究[D];西南大学;2009年
7 周亦鹏;基于软件人的情境主题分析及应用研究[D];北京科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 张士军;基于随机游走的网页协同排序算法研究[D];大连理工大学;2010年
2 李玥亭;互联网社区核及完整社区提取策略[D];大连理工大学;2010年
3 杨阳;复杂网络社团划分算法的研究与实现[D];西安电子科技大学;2010年
4 张景阳;基于局部介数的复杂网络社区动态演化研究[D];太原理工大学;2011年
5 赵忠祥;教育网站社区发现方法技术的研究[D];北方工业大学;2011年
6 张韦;基于语义的Web主题提取的研究[D];湖北工业大学;2011年
7 罗方;基于社会网络分析的Blog社区发现[D];安徽工业大学;2011年
8 罗乐;基于核心成员识别的网络社区发现及跟踪方法[D];哈尔滨工业大学;2010年
9 云颖;复杂网络中的社区发现及进化研究[D];河北大学;2011年
10 张林安;多关系社会网络社区挖掘方法研究[D];哈尔滨工程大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 薛为民;陆玉昌;;文本挖掘技术研究[J];北京联合大学学报(自然科学版);2005年04期
2 阎艳;黄智兴;邱玉辉;;一种基于派系过滤的社区进化发现研究[J];重庆师范大学学报(自然科学版);2009年02期
3 倪丽娟;于淑丽;;档案学研究热点分析——基于2004—2008年《档案学研究》、《档案学通讯》论文关键词的词频分析[J];档案学通讯;2010年01期
4 汪小帆;刘亚冰;;复杂网络中的社团结构算法综述[J];电子科技大学学报;2009年05期
5 梁立明,谢彩霞;词频分析法用于我国纳米科技研究动向分析[J];科学学研究;2003年02期
6 王亮亮;彭晓东;;国内外管理科学学科发展趋势研究——基于内容分析方法[J];科学学研究;2007年05期
7 丁堃;李鑫;;我国知识管理研究主题变化的计量分析[J];科学学研究;2008年02期
8 周凤华;朱雪忠;;2000-2004年中国知识产权研究的文献计量分析[J];科研管理;2006年04期
9 岳洪江;刘思峰;梁立明;;我国对技术创新的关注与研究——基于24年的文献计量分析[J];科研管理;2008年03期
10 谌志群;张国煊;;文本挖掘研究进展[J];模式识别与人工智能;2005年01期
中国硕士学位论文全文数据库 前2条
1 宋丹;基于语义和链接的话题跟踪方法[D];大连理工大学;2007年
2 林洋港;概率主题模型在文本分类中的应用研究[D];中国科学技术大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 丁纪云,蔡春娥;利用构造数据集评定数据挖掘过程的方法[J];湖南广播电视大学学报;2001年02期
2 任承业,罗伟其;校园信息系统中CRM与数据挖掘的结合和应用[J];计算机工程与应用;2003年13期
3 王艳;数据挖掘在数字图书馆中的应用[J];情报科学;2003年02期
4 邵红全,赵茜;用SQL Server2000实现数据挖掘的技术与策略[J];电脑开发与应用;2003年04期
5 耿庆鹏,卢子芳;利用数据挖掘技术实现对电信行业用户欺诈行为的预测[J];电信快报;2003年10期
6 蒋良孝,蔡之华;基于数据仓库的数据挖掘研究[J];计算技术与自动化;2003年03期
7 叶静,蔡之华;遥感图像中的数据挖掘应用概述[J];计算机与现代化;2003年10期
8 黄解军,万幼川,潘和平;银行客户关系管理与数据挖掘的应用[J];计算机工程与设计;2003年07期
9 崔强,朱卫东;基于数据挖掘的铁路机务段成本控制系统[J];铁路计算机应用;2003年01期
10 杨思春;基于数据仓库的数据挖掘技术分析研究[J];微机发展;2003年09期
中国重要会议论文全文数据库 前10条
1 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
4 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
5 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
6 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
7 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
8 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
9 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病阴阳类证辨证规范的数据挖掘研究[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
2 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
3 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
4 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
5 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
6 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
7 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
8 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
9 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年
10 余红;网络时政论坛舆论领袖研究[D];华中科技大学;2007年
中国硕士学位论文全文数据库 前10条
1 骆国靖;基于主题模型的模块化网络和社区挖掘研究[D];浙江大学;2008年
2 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
3 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
4 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
5 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
6 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
7 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
8 王浩;数据挖掘在上海市职业能力考试院招录考试优化管理项目中的运用研究[D];华东理工大学;2012年
9 黎卫英;数据挖掘在中职幼教课程改革中的应用[D];福建师范大学;2009年
10 张煜辉;数据挖掘和SPC在生产过程质量控制中应用研究[D];上海交通大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026


丁香五月 啪综合