版权说明
操作指南
首页
成果
学者
机构
首页
>
成果
>
成果详情
基于汉字部件直方图的文本复制检测算法
认领
导出
下载
Link by 中国知网学术期刊
Link by 万方学术期刊
反馈
分享
QQ
微信
微博
作者信息
关键词
期刊信息
基础信息
归属信息
摘要
成果类型:
期刊论文
作者:
姜丽清;黄华军;谢黎黎
作者机构:
中南林业科技大学计算机与信息工程学院 湖南410004
[谢黎黎; 黄华军; 姜丽清] 中南林业科技大学
语种:
中文
关键词:
复制检测;汉字部件;相似度距离;直方图
期刊:
网络安全技术与应用
ISSN:
1009-6833
年:
2015
期:
3
页码:
58-59
DOI:
10.3969/j.issn.1009-6833.2015.03.039
机构署名:
本校为第一机构
院系归属:
计算机与信息工程学院
摘要:
现有文本复制检测技术均基于相似度计算,针对其模型特征表示高维稀疏、算法设计复杂低效等问题,本文提出了一种新的基于汉字部件直方图的文本复制检测算法。其基本原理是根据汉字的数学表达式理论将文本中的所有汉字进行部件拆分,对部件频率进行统计,构造文本汉字部件直方图,以其作为文本的特征表示并将其间的相似度距离值作为复制检测评估依据。通过实验确定了巴氏距离为直方图相似度距离的计算公式。对比实验结果表明本算法查准率、召回率、F1值方面具有可取性。
反馈
产权有误:本人成果被他人认领
数据有误:数据基本信息有误
归属有误:成果的院系归属、机构署名归属有误
其他原因:
验证码:
看不清楚,换一个
确定
取消
成果认领
标题:
用户
作者
通讯作者
--
请选择
请选择
--
确定
取消
提示
该栏目需要登录且有访问权限才可以访问
如果您有访问权限,请直接
登录访问
如果您没有访问权限,请
联系管理员
申请开通
管理员联系邮箱:
yun@hnwdkj.com