基于标记的规则统计模型与未登录词识别算法
文献类型:期刊论文
| 作者 | 苏菲 ; 王丹力 ; 戴国忠 |
| 刊名 | 计算机工程与应用
![]() |
| 出版日期 | 2004 |
| 卷号 | 40期号:15页码:43-45,91 |
| 关键词 | 歧义标记 规则统计模型 n元语法 词加权算法 |
| 其他题名 | a rule-statistic model based on tag and an algorithm to recognize unknown words |
| 中文摘要 | 该文针对小型词库,提出了基于规则统计模型的消歧方法和识别未登录词的词加权算法.通过大量语料库学习获取歧义高频字,作为歧义标记,利用规则统计模型对标记的上下文信息分类处理,剩下的部分进行正向或逆向动态最大匹配,对连续单字串使用词加权算法来判断其是否为未登录多字词.经过实验测试,该系统的准确率为98.88%,召回率为98.32%. |
| 收录类别 | CSCD |
| 语种 | 中文 |
| CSCD记录号 | CSCD:1617481 |
| 公开日期 | 2010-06-01 |
| 源URL | [http://124.16.136.157/handle/311060/2106] ![]() |
| 专题 | 软件研究所_人机交互技术与智能信息处理实验室_期刊论文 |
| 推荐引用方式 GB/T 7714 | 苏菲,王丹力,戴国忠. 基于标记的规则统计模型与未登录词识别算法[J]. 计算机工程与应用,2004,40(15):43-45,91. |
| APA | 苏菲,王丹力,&戴国忠.(2004).基于标记的规则统计模型与未登录词识别算法.计算机工程与应用,40(15),43-45,91. |
| MLA | 苏菲,et al."基于标记的规则统计模型与未登录词识别算法".计算机工程与应用 40.15(2004):43-45,91. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。

