条件随机场与领域本体元素集相结合的未登录词识别研究
文献类型:期刊论文
| 作者 | 段宇锋; 朱雯晶; 陈巧; 刘伟; 刘凤红 |
| 刊名 | 现代图书情报技术
![]() |
| 出版日期 | 2015 |
| 期号 | 04页码:41-49 |
| 关键词 | 条件随机场 领域本体 未登录词识别 |
| ISSN号 | 1003-3513 |
| 英文摘要 | 【目的】建立未登录词识别模型,提升发现自然科学领域文本中未登录词的能力,同时降低人工干预成本。【方法】在假设的基础上,构建条件随机场(CRFs)与领域本体元素集相结合的未登录词识别模型。以生物多样性文本为样本,通过比较不同模型性能的差异,检验假设,验证模型的合理性。【结果】实验结果表明,CRFs模型选择单纯的字、字词混合序列、字词混合序列及默认词性、字词混合序列及含自定义语义功能标记的词性为特征时,未登录词识别能力依次提升。该结果证明研究假设为真,本文建立的模型科学、合理。【局限】模型标注未登录词的准确性有待提升。【结论】该模型具有更强的未登录词识别能力,同时可以极大地降低人工建立训练集的成本。 |
| 语种 | 中文 |
| 资助机构 | 国家社会科学基金一般项目“基于无监督语义标注的网络中文学术信息抽取研究”(项目编号:11BTQ024)的研究成果之一 |
| 源URL | [http://ir.ibcas.ac.cn/handle/2S10CLM1/25497] ![]() |
| 专题 | 植物研究所_光合作用研究中心_光合作用研究中心_学位论文 |
| 作者单位 | 1.中国科学院植物研究所 2.上海财经大学公共经济与管理学院 3.上海图书馆 4.华东师范大学商学院 |
| 推荐引用方式 GB/T 7714 | 段宇锋,朱雯晶,陈巧,等. 条件随机场与领域本体元素集相结合的未登录词识别研究[J]. 现代图书情报技术,2015(04):41-49. |
| APA | 段宇锋,朱雯晶,陈巧,刘伟,&刘凤红.(2015).条件随机场与领域本体元素集相结合的未登录词识别研究.现代图书情报技术(04),41-49. |
| MLA | 段宇锋,et al."条件随机场与领域本体元素集相结合的未登录词识别研究".现代图书情报技术 .04(2015):41-49. |
入库方式: OAI收割
来源:植物研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。

