中国科学院机构知识库网格系统: 基于统计的汉语词性标注方法的分析与改进

中国科学院机构知识库网格

Chinese Academy of Sciences Institutional Repositories Grid

基于统计的汉语词性标注方法的分析与改进

文献类型：期刊论文


作者	魏欧 ; 吴健 ; 孙玉芳
刊名	软件学报
出版日期	2000
卷号	11 期号:4 页码:473
关键词	词性标注 n元语法语料语法属性
ISSN号	1000-9825
其他题名	analysis and improvement of statistics-based chinese part-of-speech tagging
中文摘要	从词性概率矩阵与词汇概率矩阵的结构和数值变化等方面 ,对目前常用的基于统计的汉语词性标注方法中训练语料规模与标注正确率之间所存在的非线性关系作了分析 .为了充分利用训练语料库 ,提高标注正确率 ,从利用词语相关的语法属性和加强对未知词的处理两个方面加以改进 ,提高了标注性能 .封闭测试和开放测试的正确率分别达到 96.5%和 96% .
收录类别	wanfang,cscd,cnki
资助信息	中国中文信息学会
语种	中文
公开日期	2010-08-24
源URL	[http://124.16.136.157/handle/311060/4092]
专题	软件研究所_开放系统与中文信息处理小组_期刊论文
推荐引用方式 GB/T 7714	魏欧,吴健,孙玉芳. 基于统计的汉语词性标注方法的分析与改进[J]. 软件学报,2000,11(4):473.
APA	魏欧,吴健,&孙玉芳.(2000).基于统计的汉语词性标注方法的分析与改进.软件学报,11(4),473.
MLA	魏欧,et al."基于统计的汉语词性标注方法的分析与改进".软件学报 11.4(2000):473.

入库方式： OAI收割

来源：软件研究所

浏览0

下载0

收藏0

其他版本

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。