基于CRF的蒙古文人名自动识别研究
文献类型:期刊论文
作者 | 吴金星1; 那顺乌日图1; 杨振新2 |
刊名 | 计算机应用研究
![]() |
出版日期 | 2016 |
卷号 | 033 |
关键词 | 蒙古文人名 识别 条件随机场 特征 |
ISSN号 | 1001-3695 |
其他题名 | Recognition method of Mongolian person names based on conditional random fields |
英文摘要 | 以蒙古文人名识别为目的,实现了基于条件随机场模型的人名自动识别。从蒙古语黏着性特点分析入手,研究了蒙古语语料库中人名的存在形式以及各类人名的特点,针对蒙古语语料库中人名的特点,在词汇特征、词性特征和指示词特征等基本特征基础上引入了汉语姓氏特征、人名词典特征、兼类人名特征以及双词根特征。以内蒙古大学开发的100万词规模的标注语料库为训练数据,该模型的人名识别性能达到了94.56%的准确率,90.60%的召回率和92.54%的F值。该方法比起以往的基于规则的系统取得了较好的结果。 |
语种 | 中文 |
CSCD记录号 | CSCD:5779436 |
源URL | [http://ir.hfcas.ac.cn:8080/handle/334002/94087] ![]() |
专题 | 中国科学院合肥物质科学研究院 |
作者单位 | 1.内蒙古大学蒙古学学院 2.内蒙古大学蒙古学学院 3.中国科学院合肥智能机械研究所 |
推荐引用方式 GB/T 7714 | 吴金星,那顺乌日图,杨振新. 基于CRF的蒙古文人名自动识别研究[J]. 计算机应用研究,2016,033. |
APA | 吴金星,那顺乌日图,&杨振新.(2016).基于CRF的蒙古文人名自动识别研究.计算机应用研究,033. |
MLA | 吴金星,et al."基于CRF的蒙古文人名自动识别研究".计算机应用研究 033(2016). |
入库方式: OAI收割
来源:合肥物质科学研究院
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。