中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
蒙古语有向图形态分析器的判别式词干词缀切分

文献类型:期刊论文

作者姜文斌1; 吴金星1; 乌日力嘎1; 那顺乌日图2; 刘群1
刊名中文信息学报
出版日期2011
卷号25.0期号:004页码:30
关键词蒙古语 词法分析 词性标注 词干提取 有向图 判别式
ISSN号1003-0077
英文摘要蒙古语形态分析中,我们之前的有向图模型取得了较高的性能。这种建模方式以图状结构刻画句中词干和词缀之间的概率关系,从而借助上下文信息为每个词确定最佳的切分标注候选。为每个词尽可能地枚举出所有合法的切分标注候选,是有向图模型有效工作的前提。该文提出了一种基于判别式分类的词干词缀切分策略,与之前基于词干表和词缀表的枚举方案相比,该方法对于词中含有未登录词干的情形具有更好的泛化能力。以20万词规模的三级标注人工语料库为训练数据,采用判别式词干词缀切分的有向图形态分析器,对于含有未登录词干的情形,词级切分标注正确率提高了7个百分点。
语种英语
源URL[http://119.78.100.204/handle/2XEOYT63/30897]  
专题中国科学院计算技术研究所期刊论文_中文
作者单位1.中国科学院计算技术研究所
2.内蒙古大学蒙古学学院
推荐引用方式
GB/T 7714
姜文斌,吴金星,乌日力嘎,等. 蒙古语有向图形态分析器的判别式词干词缀切分[J]. 中文信息学报,2011,25.0(004):30.
APA 姜文斌,吴金星,乌日力嘎,那顺乌日图,&刘群.(2011).蒙古语有向图形态分析器的判别式词干词缀切分.中文信息学报,25.0(004),30.
MLA 姜文斌,et al."蒙古语有向图形态分析器的判别式词干词缀切分".中文信息学报 25.0.004(2011):30.

入库方式: OAI收割

来源:计算技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。