中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
一种基于聚类与分类结合的汉语隐喻短语识别方法

文献类型:期刊论文

作者符建辉; 王石; 曹存根
刊名中文信息学报
出版日期2018
卷号32.0期号:002页码:22
关键词隐喻短语识别 中文隐喻短语 短语聚类
ISSN号1003-0077
英文摘要隐喻识别是自然语言处理的一个重要研究分支。目前人们越来越清楚地认识到隐喻在思维及语言中所处的重要地位。本研究在前人工作的实验和考察基础上,发现基于分类器来识别隐喻的方法存在数据稀疏的问题,即当训练语料中缺少需要识别的源域词数据时,分类的结果将不会太好。应对数据稀疏问题,该文提出了一种基于聚类与分类结合的隐喻短语获取方法。该方法将包含源域词S的短语进行聚类。将聚类的结果作为分类的一类特征。实验表明,使用聚类产生的特征训练出来的分类器,不仅能很好地识别训练语料中存在源域词数据的情况,也能很好地识别训练语料中缺少源域词数据的情况,具有很高的召回率。
语种英语
源URL[http://119.78.100.204/handle/2XEOYT63/37073]  
专题中国科学院计算技术研究所期刊论文_中文
作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
符建辉,王石,曹存根. 一种基于聚类与分类结合的汉语隐喻短语识别方法[J]. 中文信息学报,2018,32.0(002):22.
APA 符建辉,王石,&曹存根.(2018).一种基于聚类与分类结合的汉语隐喻短语识别方法.中文信息学报,32.0(002),22.
MLA 符建辉,et al."一种基于聚类与分类结合的汉语隐喻短语识别方法".中文信息学报 32.0.002(2018):22.

入库方式: OAI收割

来源:计算技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。