中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
条件随机场与领域本体元素集相结合的未登录词识别研究

文献类型:期刊论文

作者段宇锋; 朱雯晶; 陈巧; 刘伟; 刘凤红
刊名现代图书情报技术
出版日期2015
期号04页码:41-49
关键词条件随机场 领域本体 未登录词识别
ISSN号1003-3513
英文摘要【目的】建立未登录词识别模型,提升发现自然科学领域文本中未登录词的能力,同时降低人工干预成本。【方法】在假设的基础上,构建条件随机场(CRFs)与领域本体元素集相结合的未登录词识别模型。以生物多样性文本为样本,通过比较不同模型性能的差异,检验假设,验证模型的合理性。【结果】实验结果表明,CRFs模型选择单纯的字、字词混合序列、字词混合序列及默认词性、字词混合序列及含自定义语义功能标记的词性为特征时,未登录词识别能力依次提升。该结果证明研究假设为真,本文建立的模型科学、合理。【局限】模型标注未登录词的准确性有待提升。【结论】该模型具有更强的未登录词识别能力,同时可以极大地降低人工建立训练集的成本。
语种中文
资助机构国家社会科学基金一般项目“基于无监督语义标注的网络中文学术信息抽取研究”(项目编号:11BTQ024)的研究成果之一
源URL[http://ir.ibcas.ac.cn/handle/2S10CLM1/25497]  
专题植物研究所_光合作用研究中心_光合作用研究中心_学位论文
作者单位1.中国科学院植物研究所
2.上海财经大学公共经济与管理学院
3.上海图书馆
4.华东师范大学商学院
推荐引用方式
GB/T 7714
段宇锋,朱雯晶,陈巧,等. 条件随机场与领域本体元素集相结合的未登录词识别研究[J]. 现代图书情报技术,2015(04):41-49.
APA 段宇锋,朱雯晶,陈巧,刘伟,&刘凤红.(2015).条件随机场与领域本体元素集相结合的未登录词识别研究.现代图书情报技术(04),41-49.
MLA 段宇锋,et al."条件随机场与领域本体元素集相结合的未登录词识别研究".现代图书情报技术 .04(2015):41-49.

入库方式: OAI收割

来源:植物研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。