收藏本站
《华南理工大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

社交网络中话题检测与趋势分析及预测算法改进研究

徐光  
【摘要】:近年来随着社交网络的蓬勃发展,社交网络在信息的传播广度和速度上都更具优越性。因此,专门针对社交网络的话题检测研究也随之兴起。如何及时准确地检测出有价值的话题,对于舆情分析、热点新闻挖掘等领域有很重要的意义。本文主要从文本表示模型、在线话题检测算法和趋势分析指标提取三个方面进行改进。首先,为了综合考虑词在不同长度的文档中权重应该不同的特点,以及词本身的词频特征和词与文档之间的关联性特征,本文提出了一种基于改进的TF-IDF(Term Frequency-Inverse Document Frequency)与点互信息(Pointwise Mutual Information,PMI)的文本表示模型——PT权重值(PMI and TF-IDF weight),使得该模型能够更好地应用于微博中的短文本,并提出了基于该模型的非负矩阵分解文本聚类算法NMFPT(Non-negative Matrix Factorization(NMF)based on Pointwise mutual and Tf-idf),另外,算法还通过引入L2正则化因子来避免因数据稀疏导致的过拟合问题。最后通过实验证明了该算法相比于原算法在准确度上有所提升。其次,为了能够检测出随时间动态到达的文本流中的话题,本文提出一种基于时间窗以及簇合并的层次非负矩阵分解在线话题检测算法HNMF_TC(Hierarchical NMF based on Time window and Cluster merging)。为了解决原始层次非负矩阵分解算法在选择分解簇时仅考虑簇中数据点数量的不足,本算法引入了mNDCG值(modified Normalized Discounted Cumulative Gain)来衡量分解过程中每个簇的凝聚度,再使用混合相似度算法来合并两个相邻时间窗的话题集。最后通过对比实验验证了本文算法在准确度上有所提升。然后,本文确立了趋势分析的目标。通过分析,提取出了影响趋势走势的用户相关指标、博文相关指标和时间相关指标,并将意见领袖影响力因素加入用户相关指标中,提出了基于改进的KED算法的意见领袖影响力评估方法,该方法将共同关注数作为补充指标加入了原始方法中。然后使用梯度提升回归树作为预测模型。最后,通过在真实微博数据集中进行实验证明了本文提出的预测模型的合理性、准确性以及通用性。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 徐泰燕;郝玉龙;;非负矩阵分解及其应用现状分析[J];武汉工业学院学报;2010年01期
2 何光辉;张太平;;保持拓扑性非负矩阵分解法在人脸识别的应用[J];计算机工程与应用;2010年14期
3 史加荣;焦李成;尚凡华;;不完全非负矩阵分解的加速算法[J];电子学报;2011年02期
4 王文俊;张军英;;一种非负矩阵分解的快速方法[J];计算机工程与应用;2009年25期
5 张雷鸣;李秋丹;廖胜才;;非负矩阵分解在标签语义分析中的应用[J];计算机科学;2010年04期
6 于彬;;基于局部非负矩阵分解的人脸识别[J];科学技术与工程;2010年33期
7 姜伟;杨炳儒;隋海峰;;局部敏感非负矩阵分解[J];计算机科学;2010年12期
8 宋金歌;杨景;陈平;佘玉梅;;一种非负矩阵分解的快速稀疏算法[J];云南民族大学学报(自然科学版);2011年04期
9 高燕燕;;非负矩阵分解及其应用探讨[J];硅谷;2011年23期
10 郝红;徐常青;张新平;;基于非负矩阵分解的航拍图像信息提取[J];浙江农林大学学报;2012年01期
中国重要会议论文全文数据库 前10条
1 孙江明;李通化;;非平滑三维非负矩阵分解[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
2 蒋永锴;叶东毅;;基于稀疏非负矩阵分解的自动多文摘方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 马帅;吴飞;杨易;邵健;;基于稀疏非负矩阵分解的图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
4 徐利民;龚珊;余再军;;奇异值分解与非负矩阵分解色在数据降维方面的特性分析[A];2010年通信理论与信号处理学术年会论文集[C];2010年
5 蔡蕾;朱永生;;基于稀疏性非负矩阵分解和支持向量机的轴心轨迹图识别[A];2008年全国振动工程及应用学术会议暨第十一届全国设备故障诊断学术会议论文集[C];2008年
6 蒋霈霖;;KL散度下的非负矩阵分解[A];中国自动化学会中南六省(区)2010年第28届年会·论文集[C];2010年
7 杨宝;朱启兵;黄敏;;基于非负矩阵分解一稀疏表示分类的玻璃缺陷图像识别[A];第24届中国控制与决策会议论文集[C];2012年
8 钱乐乐;高隽;徐小红;;非负性约束的图像稀疏编码[A];第七届全国信息获取与处理学术会议论文集[C];2009年
9 朱昊;黄源水;付梦印;;基于NMF的道路识别算法在野外环境感知中的应用[A];第九届全国光电技术学术交流会论文集(下册)[C];2010年
10 郑能恒;蔡毅;李霞;Tan Lee;;基于非负矩阵分解和向量相似测度的语音与音乐分离算法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
中国重要报纸全文数据库 前10条
1 本报驻堪培拉记者 陈小方;社交网络让人焦虑不安[N];光明日报;2010年
2 彭敏;社交网络分析异军突起成新宠[N];电脑商报;2011年
3 VAR记者 彭敏;企业拥抱社交网络的步骤及工具[N];电脑商报;2011年
4 中国电信广东公司员工 谭拯;社交网络:挖掘“连接”与“发现”的价值[N];人民邮电;2011年
5 周虎城;管理社交网络需要政治智慧[N];南方日报;2011年
6 刘一冰;方案商的社交网络[N];电脑商报;2011年
7 钟声;社交网络管理是各国共同课题[N];人民日报;2011年
8 ;企业如何创建内部社交网络[N];网络世界;2012年
9 宋平 编译;如何优化社交网络营销[N];中华读书报;2013年
10 本报记者 王娟;企业社交网络盈利未“水起”[N];中国计算机报;2013年
中国博士学位论文全文数据库 前10条
1 杨士准;基于样本和特征的迁移学习方法及应用[D];国防科学技术大学;2013年
2 叶军;基于正则化方法的非负矩阵分解算法及其应用研究[D];南京理工大学;2014年
3 陆玉武;图像分类中流形回归与非负矩阵分解研究[D];哈尔滨工业大学;2015年
4 张恩德;在线社会网络分析与挖掘若干关键问题研究[D];东北大学;2014年
5 张翔;投影非负矩阵分解算法研究及其应用[D];国防科学技术大学;2015年
6 胡俐蕊;非负矩阵分解方法及其在选票图像识别中的应用[D];安徽大学;2013年
7 殷海青;图像分析中的非负矩阵分解理论及其最优化和正则化方法研究[D];西安电子科技大学;2011年
8 杨洪礼;非负矩阵与张量分解及其应用[D];山东科技大学;2011年
9 史加荣;多尺度张量逼近及应用[D];西安电子科技大学;2012年
10 方蔚涛;人脸识别特征抽取算法的研究[D];重庆大学;2012年
中国硕士学位论文全文数据库 前10条
1 徐光;社交网络中话题检测与趋势分析及预测算法改进研究[D];华南理工大学;2017年
2 谢昊;非负矩阵分解初始化及其应用[D];暨南大学;2015年
3 王一;凸与半非负矩阵分解的近点梯度方法研究[D];东北师范大学;2015年
4 项磊;基于乳腺癌计算机辅助诊断的病理图像分析[D];南京信息工程大学;2015年
5 王丹;基于非负矩阵分解的脑电信号特征提取算法研究[D];燕山大学;2015年
6 马春霞;非负矩阵分解及在基因表达数据分析中的应用研究[D];曲阜师范大学;2015年
7 崔艳荣;基于非负矩阵分解的高光谱遥感数据融合方法分析及应用[D];电子科技大学;2014年
8 赖淑珍;非负矩阵分解若干算法研究与应用[D];电子科技大学;2014年
9 赵龙;基于多流形正则化非负矩阵分解的多视图聚类[D];大连理工大学;2015年
10 黄震;基于多视角非负矩阵分解的同名区分算法研究[D];大连理工大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026


丁香五月 啪综合