版权说明 操作指南
首页 > 成果 > 成果详情

基于主题模型的微博话题检测算法

认领
导出
下载 Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
黄华军;谭骏珊;秦姣华
作者机构:
中南林业科技大学计算机与信息工程学院,湖南长沙,410004
[谭骏珊; 黄华军; 秦姣华] 中南林业科技大学
语种:
中文
关键词:
话题检测;主题模型;文档词条矩阵;词语关联矩阵
关键词(英文):
topic model;text word matrix;word relation matrix
期刊:
网络与信息安全学报
ISSN:
2096-109X
年:
2016
卷:
2
期:
5
页码:
30-38
基金类别:
(No.61304208):国家自然科学基金资助项目 (No.13JJ2031):湖南省自然科学基金资助项目 (No.QJ2012009A):中南林业科技大学青年科学研究基金资助项目 (61304208):Foundation Items:The National Natural Science Foundation of China (13JJ2031):The Natural Science Foundation of Hunan Province (QJ2012009A):Youth Scientific Research Foundation of Central South University of Forestry &Technology
机构署名:
本校为第一机构
院系归属:
计算机与信息工程学院
摘要:
微博数据的实时、大规模、短文本以及富含噪声等特征为话题检测带来新的挑战,传统向量空模型(VSM)表示文本无法很好地对其进行建模。基于此,提出一种基于主题模型的微博话题检测算法。首先,对微博数据构建文档词条矩阵和词语关联矩阵来提取主题词;然后,对主题词进行聚类,得到主题模型;最后,利用文本与主题模型相互匹配实现文本聚类,从而达到话题检测的目的。实验结果表示,该算法能有效地进行话题聚类并检测出话题,在最佳参数组合条件下,其各类别的平均F值达到95%以上。
摘要(英文):
Micro-blog data has the characteristic of real-time, volume, short-text, and noise-rich. So it is a challenge for the traditional topic detection technology. A novel micro-blog topic detection algorithm based on topic model was proposed. Firstly, the micro-blog data was expressed as text word matrix and word relation matrix. The topic word was extracted from the two vectors. Secondly, the topic model was obtained with clustering. Finally, the topic detection of micro-blog was obtained by clustering text and topic model. Experimental results show that the algorithm proposed can effectively dete...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com