中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于CRF的蒙古文人名自动识别研究

文献类型:期刊论文

作者吴金星1; 那顺乌日图1; 杨振新2
刊名计算机应用研究
出版日期2016
卷号033
关键词蒙古文人名 识别 条件随机场 特征
ISSN号1001-3695
其他题名Recognition method of Mongolian person names based on conditional random fields
英文摘要以蒙古文人名识别为目的,实现了基于条件随机场模型的人名自动识别。从蒙古语黏着性特点分析入手,研究了蒙古语语料库中人名的存在形式以及各类人名的特点,针对蒙古语语料库中人名的特点,在词汇特征、词性特征和指示词特征等基本特征基础上引入了汉语姓氏特征、人名词典特征、兼类人名特征以及双词根特征。以内蒙古大学开发的100万词规模的标注语料库为训练数据,该模型的人名识别性能达到了94.56%的准确率,90.60%的召回率和92.54%的F值。该方法比起以往的基于规则的系统取得了较好的结果。
语种中文
CSCD记录号CSCD:5779436
源URL[http://ir.hfcas.ac.cn:8080/handle/334002/94087]  
专题中国科学院合肥物质科学研究院
作者单位1.内蒙古大学蒙古学学院
2.内蒙古大学蒙古学学院
3.中国科学院合肥智能机械研究所
推荐引用方式
GB/T 7714
吴金星,那顺乌日图,杨振新. 基于CRF的蒙古文人名自动识别研究[J]. 计算机应用研究,2016,033.
APA 吴金星,那顺乌日图,&杨振新.(2016).基于CRF的蒙古文人名自动识别研究.计算机应用研究,033.
MLA 吴金星,et al."基于CRF的蒙古文人名自动识别研究".计算机应用研究 033(2016).

入库方式: OAI收割

来源:合肥物质科学研究院

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。