中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于标记的规则统计模型与未登录词识别算法

文献类型:期刊论文

作者苏菲 ; 王丹力 ; 戴国忠
刊名计算机工程与应用
出版日期2004
卷号40期号:15页码:43-45,91
关键词歧义标记 规则统计模型 n元语法 词加权算法
其他题名a rule-statistic model based on tag and an algorithm to recognize unknown words
中文摘要该文针对小型词库,提出了基于规则统计模型的消歧方法和识别未登录词的词加权算法.通过大量语料库学习获取歧义高频字,作为歧义标记,利用规则统计模型对标记的上下文信息分类处理,剩下的部分进行正向或逆向动态最大匹配,对连续单字串使用词加权算法来判断其是否为未登录多字词.经过实验测试,该系统的准确率为98.88%,召回率为98.32%.
收录类别CSCD
语种中文
CSCD记录号CSCD:1617481
公开日期2010-06-01
源URL[http://124.16.136.157/handle/311060/2106]  
专题软件研究所_人机交互技术与智能信息处理实验室_期刊论文
推荐引用方式
GB/T 7714
苏菲,王丹力,戴国忠. 基于标记的规则统计模型与未登录词识别算法[J]. 计算机工程与应用,2004,40(15):43-45,91.
APA 苏菲,王丹力,&戴国忠.(2004).基于标记的规则统计模型与未登录词识别算法.计算机工程与应用,40(15),43-45,91.
MLA 苏菲,et al."基于标记的规则统计模型与未登录词识别算法".计算机工程与应用 40.15(2004):43-45,91.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。