中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于统计的汉语词性标注方法的分析与改进

文献类型:期刊论文

作者魏欧 ; 吴健 ; 孙玉芳
刊名软件学报
出版日期2000
卷号11期号:4页码:473
关键词词性标注 n元语法 语料 语法属性
ISSN号1000-9825
其他题名analysis and improvement of statistics-based chinese part-of-speech tagging
中文摘要从词性概率矩阵与词汇概率矩阵的结构和数值变化等方面 ,对目前常用的基于统计的汉语词性标注方法中训练语料规模与标注正确率之间所存在的非线性关系作了分析 .为了充分利用训练语料库 ,提高标注正确率 ,从利用词语相关的语法属性和加强对未知词的处理两个方面加以改进 ,提高了标注性能 .封闭测试和开放测试的正确率分别达到 96.5%和 96% .
收录类别wanfang,cscd,cnki
资助信息中国中文信息学会
语种中文
公开日期2010-08-24
源URL[http://124.16.136.157/handle/311060/4092]  
专题软件研究所_开放系统与中文信息处理小组_期刊论文
推荐引用方式
GB/T 7714
魏欧,吴健,孙玉芳. 基于统计的汉语词性标注方法的分析与改进[J]. 软件学报,2000,11(4):473.
APA 魏欧,吴健,&孙玉芳.(2000).基于统计的汉语词性标注方法的分析与改进.软件学报,11(4),473.
MLA 魏欧,et al."基于统计的汉语词性标注方法的分析与改进".软件学报 11.4(2000):473.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。