版权说明 操作指南
首页 > 成果 > 成果详情

基于汉字部件直方图的文本复制检测算法

认领
导出
下载 Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
姜丽清;黄华军;谢黎黎
作者机构:
中南林业科技大学计算机与信息工程学院 湖南410004
[谢黎黎; 黄华军; 姜丽清] 中南林业科技大学
语种:
中文
关键词:
复制检测;汉字部件;相似度距离;直方图
期刊:
网络安全技术与应用
ISSN:
1009-6833
年:
2015
期:
3
页码:
58-59
机构署名:
本校为第一机构
院系归属:
计算机与信息工程学院
摘要:
现有文本复制检测技术均基于相似度计算,针对其模型特征表示高维稀疏、算法设计复杂低效等问题,本文提出了一种新的基于汉字部件直方图的文本复制检测算法。其基本原理是根据汉字的数学表达式理论将文本中的所有汉字进行部件拆分,对部件频率进行统计,构造文本汉字部件直方图,以其作为文本的特征表示并将其间的相似度距离值作为复制检测评估依据。通过实验确定了巴氏距离为直方图相似度距离的计算公式。对比实验结果表明本算法查准率、召回率、F1值方面具有可取性。

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com