中国科学院机构知识库网格系统: 基于标记的规则统计模型与未登录词识别算法

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

基于标记的规则统计模型与未登录词识别算法

文献类型：期刊论文


作者	苏菲 ; 王丹力 ; 戴国忠
刊名	计算机工程与应用
出版日期	2004
卷号	40 期号:15 页码:43-45,91
关键词	歧义标记规则统计模型 n元语法词加权算法
其他题名	a rule-statistic model based on tag and an algorithm to recognize unknown words
中文摘要	该文针对小型词库,提出了基于规则统计模型的消歧方法和识别未登录词的词加权算法.通过大量语料库学习获取歧义高频字,作为歧义标记,利用规则统计模型对标记的上下文信息分类处理,剩下的部分进行正向或逆向动态最大匹配,对连续单字串使用词加权算法来判断其是否为未登录多字词.经过实验测试,该系统的准确率为98.88%,召回率为98.32%.
收录类别	CSCD
语种	中文
CSCD记录号	CSCD:1617481
公开日期	2010-06-01
源URL	[http://124.16.136.157/handle/311060/2106]
专题	软件研究所_人机交互技术与智能信息处理实验室_期刊论文
推荐引用方式 GB/T 7714	苏菲,王丹力,戴国忠. 基于标记的规则统计模型与未登录词识别算法[J]. 计算机工程与应用,2004,40(15):43-45,91.
APA	苏菲,王丹力,&戴国忠.(2004).基于标记的规则统计模型与未登录词识别算法.计算机工程与应用,40(15),43-45,91.
MLA	苏菲,et al."基于标记的规则统计模型与未登录词识别算法".计算机工程与应用 40.15(2004):43-45,91.

入库方式： OAI收割

来源：软件研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。