中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于N—Gram模型的高速汉字编码识别系统

文献类型:期刊论文

作者李继锋; 刘群
刊名计算机工程与应用
出版日期2004
卷号40.0期号:003页码:39
关键词编码识别 n元语法模型 一元语法模型 N—Gram模型 自动识别文档 汉字编码
ISSN号1002-8331
英文摘要该文提出了一个应用n元语法模型(N—Gram)自动识别文档中汉字编码的方法,并介绍了一个已投入使用的汉字编码自动识别系统的设计和具体实现。该系统采用的是以字为基本单位的一元语法模型Uni—Gmm,建立在语料库的基础上,仅用输入前N个字的字频计算输入串的生成概率,可以高速、准确识别。
语种英语
源URL[http://119.78.100.204/handle/2XEOYT63/35581]  
专题中国科学院计算技术研究所期刊论文_中文
作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
李继锋,刘群. 基于N—Gram模型的高速汉字编码识别系统[J]. 计算机工程与应用,2004,40.0(003):39.
APA 李继锋,&刘群.(2004).基于N—Gram模型的高速汉字编码识别系统.计算机工程与应用,40.0(003),39.
MLA 李继锋,et al."基于N—Gram模型的高速汉字编码识别系统".计算机工程与应用 40.0.003(2004):39.

入库方式: OAI收割

来源:计算技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。