中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于模式和投影学习的领域概念上下位关系自动识别研究

文献类型:期刊论文

作者王思丽1,2; 祝忠明1,2; 杨恒2; 刘巍2
刊名数据分析与知识发现
出版日期2020-08-05
卷号4期号:11页码:15-25
关键词Hearst模式 投影学习 词嵌入 领域概念 上下位关系
ISSN号2096-3467
DOI10.11925/infotech.2020.0299
产权排序1
英文摘要

[目的]实现对领域概念上下位关系的自动识别,以解决领域本体自动化构建中领域概念间语义关系的自动获取和确立问题。[方法]将传统无监督的基于模式的方法和当前先进的有监督的基于投影学习的方法有机结合起来应用于领域概念上下位关系自动识别,并进行了试验研究。[结果]能识别出领域概念的上位词集合,在医学领域的识别精度为0.88,通用领域的识别精度为0.83,在评估基准集BLESS上的平均精度为0.85。[局限]受句法歧义、语料集的质量等影响,模型精度尚未达到峰值,存在错误识别的情况。[结论]可发现同一概念词的不同意义的上位词,对低频词和命名实体也具有较好识别效果。未来可考虑从对高频顶层上位词进行适当减权、提升有监督语料集的质量等方面进行优化。 

URL标识查看原文
语种中文
源URL[http://ir.las.ac.cn/handle/12502/11263]  
专题文献情报中心_中国科学院兰州文献情报中心_信息系统部
作者单位1.中国科学院大学
2.中国科学院西北生态环境资源研究院文献情报中心
推荐引用方式
GB/T 7714
王思丽,祝忠明,杨恒,等. 基于模式和投影学习的领域概念上下位关系自动识别研究[J]. 数据分析与知识发现,2020,4(11):15-25.
APA 王思丽,祝忠明,杨恒,&刘巍.(2020).基于模式和投影学习的领域概念上下位关系自动识别研究.数据分析与知识发现,4(11),15-25.
MLA 王思丽,et al."基于模式和投影学习的领域概念上下位关系自动识别研究".数据分析与知识发现 4.11(2020):15-25.

入库方式: OAI收割

来源:文献情报中心

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。