版权说明 操作指南
首页 > 成果 > 成果详情

基于部件关联图的文本相似度检测算法

认领
导出
下载 Link by 万方会议论文
反馈
分享
QQ微信 微博
成果类型:
会议论文
论文标题(英文):
Text similarity detection algorithm based on component relation map
作者:
谢黎黎;黄华军;秦姣华
作者机构:
中南林业科技大学计算机与信息工程学院,湖南长沙,410004
语种:
中文
关键词:
部件关联图;中文文本;相似度检测;特征匹配
年:
2015
页码:
482-493
会议名称:
第十二届全国信息隐藏暨多媒体信息安全学术大会
会议论文集名称:
第十二届全国信息隐藏暨多媒体信息安全学术大会论文集
会议时间:
2015-03-28
会议地点:
武汉
会议赞助商:
中国电子学会通信学分会<&wdkj&>北京电子技术应用研究所
机构署名:
本校为第一机构
院系归属:
计算机与信息工程学院
摘要:
提出一种新的基于部件关联图的文本相似度检测算法.根据汉字数学表达式理论将文本汉字拆分成部件,统计每个部件出现的频次并构建部件直方图;接着,构造出每个部件在文本中与之相关联的部件相互关联组成汉字的关系构建部件关联图;最后对部件关联图进行图匹配,得到关联图的相似度,最终得出文本的相似度值.实验结果表明CRM-TSD算法具有较好的准确率、召回率和F值;在与余弦定理和Jaccard系数方法的对比实验中表明,CRM-TSD算法在综合评价指标F-度量值上也优于这两种方法.
摘要(英文):
  The traditional text similarity detection method almost used VSM to represent the text, but it is high dimensional and sparse.So we proposed a new text similarity detection algorithm using component relation map (CRM-TSD).Firstly, split the Chinese characters into components by the structure of the Chinese characters and the Mathematical Expression of Chinese Characters and constructed the component histogram map after calculated the frequency of each component.Secondly, built the component relation maps according to the relation between co...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com