版权说明 操作指南
首页 > 成果 > 成果详情

一种改进整词二分法的中文分词词典设计

认领
导出
下载 Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
论文标题(英文):
Design of Chinese word segmentation dictionary based on traditional dictionary
作者:
谭骏珊;吴惠雄
作者机构:
中南林业科技大学计算机科学学院,长沙,410004
[谭骏珊; 吴惠雄] 中南林业科技大学
语种:
中文
关键词:
汉语分词;词典查询;中文信息处理
关键词(英文):
search dictionary;Chinese information processing
期刊:
信息技术
ISSN:
1009-2552
年:
2009
期:
5
页码:
40-42,45
机构署名:
本校为第一机构
院系归属:
计算机与信息工程学院
摘要:
汉语自动分词是汉语信息处理的前提,词典是汉语自动分词的基础,分词词典机制的优劣直接影响到中文分词的速度和效率。针对常用的分词方法——正向匹配分词法的特征,在已有整词二分词典的基础上加以改进,设计了一种基于Hash索引、二叉树以及动态一维数组结构的中文分词词典,相对于传统的基于Hash索引的分词词典,减小了词典的空间复杂度,提高了汉语分词的速度,最主要的是改进后的词典在增添新词时比以往的词典更为容易。
摘要(英文):
Chinese word segmentation dictionary is the important base of Chinese information processing system. The arithmetic of the dictionary influences the speed and efficiency of segmentation. This paper designs a new Chinese word segmentation dictionary based on the improved traditional binary-seek-by-word dictionary. The dictionary uses less memory. The experiment shows that the di...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com