基于统计的汉语词性标注方法的分析与改进
文献类型:期刊论文
作者 | 魏欧 ; 吴健 ; 孙玉芳 |
刊名 | 软件学报
![]() |
出版日期 | 2000 |
卷号 | 11期号:4页码:473 |
关键词 | 词性标注 n元语法 语料 语法属性 |
ISSN号 | 1000-9825 |
其他题名 | analysis and improvement of statistics-based chinese part-of-speech tagging |
中文摘要 | 从词性概率矩阵与词汇概率矩阵的结构和数值变化等方面 ,对目前常用的基于统计的汉语词性标注方法中训练语料规模与标注正确率之间所存在的非线性关系作了分析 .为了充分利用训练语料库 ,提高标注正确率 ,从利用词语相关的语法属性和加强对未知词的处理两个方面加以改进 ,提高了标注性能 .封闭测试和开放测试的正确率分别达到 96.5%和 96% . |
收录类别 | wanfang,cscd,cnki |
资助信息 | 中国中文信息学会 |
语种 | 中文 |
公开日期 | 2010-08-24 |
源URL | [http://124.16.136.157/handle/311060/4092] ![]() |
专题 | 软件研究所_开放系统与中文信息处理小组_期刊论文 |
推荐引用方式 GB/T 7714 | 魏欧,吴健,孙玉芳. 基于统计的汉语词性标注方法的分析与改进[J]. 软件学报,2000,11(4):473. |
APA | 魏欧,吴健,&孙玉芳.(2000).基于统计的汉语词性标注方法的分析与改进.软件学报,11(4),473. |
MLA | 魏欧,et al."基于统计的汉语词性标注方法的分析与改进".软件学报 11.4(2000):473. |
入库方式: OAI收割
来源:软件研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。