基于预训练表示模型的英语词语简化方法
文献类型:期刊论文
作者 | 强继朋; 钱镇宇; 李云; 袁运浩; 朱毅 |
刊名 | 自动化学报
![]() |
出版日期 | 2022 |
卷号 | 48期号:8页码:2075-2087 |
关键词 | 词语简化 候选词生成 候选词排序 预训练语言表示模型 |
ISSN号 | 0254-4156 |
DOI | 10.16383/j.aas.c200723 |
英文摘要 | 词语简化是将给定句子中的复杂词替换成意义相等的简单替代词,从而达到简化句子的目的.已有的词语简化方法只依靠复杂词本身而不考虑其上下文信息来生成候选替换词,这将不可避免地产生大量的虚假候选词.为此,提出了一种基于预语言训练表示模型的词语简化方法,利用预训练语言表示模进行候选替换词的生成和排序.基于预语言训练表示模型的词语简化方法在候选词生成过程中,不仅不需要任何语义词典和平行语料,而且能够充分考虑复杂词本身和上下文信息产生候选替代词.在候选替代词排序过程中,基于预语言训练表示模型的词语简化方法采用了5个高效的特征,除了常用的词频和词语之间相似度特征之外,还利用了预训练语言表示模的预测排名、基于基于预语言训练表示模型的上、下文产生概率和复述数据库PPDB三个新特征.通过3个基准数据集进行验证,基于预语言训练表示模型的词语简化方法取得了明显的进步,整体性能平均比最先进的方法准确率高出29.8%. |
源URL | [http://ir.ia.ac.cn/handle/173211/56310] ![]() |
专题 | 自动化研究所_学术期刊_自动化学报 |
推荐引用方式 GB/T 7714 | 强继朋,钱镇宇,李云,等. 基于预训练表示模型的英语词语简化方法[J]. 自动化学报,2022,48(8):2075-2087. |
APA | 强继朋,钱镇宇,李云,袁运浩,&朱毅.(2022).基于预训练表示模型的英语词语简化方法.自动化学报,48(8),2075-2087. |
MLA | 强继朋,et al."基于预训练表示模型的英语词语简化方法".自动化学报 48.8(2022):2075-2087. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。