中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于深度学习的相似语言短文本的语种识别方法

文献类型:期刊论文

作者张琳琳; 杨雅婷; 陈沾衡; 潘一荣; 李毓
刊名计算机应用与软件
出版日期2020
卷号37期号:2页码:124-129+176
关键词语种识别 相似语言 短文本 神经网络 文本分类
ISSN号1000-386X
英文摘要

在语种识别中,传统的N-Gram方法对文本长度依赖度高,因而无法有效地对短文本进行语种识别。现有的基于神经网络的模型无法同时考虑词本身信息和词间组合信息,从而降低了短文本语种识别的质量。针对以上问题,提出一种基于深度学习的字符级短文本语种识别方法。采用卷积神经网络从字符向量中获取词中字符组合信息;通过长短期记忆网络获取词与词之间的特征信息;使用全连接网络实现相似语言的语种识别。在维吾尔语、哈萨克语以及DSL2017数据集上的实验结果表明,该方法可以有效地提高相似语言短文本的识别精度。

源URL[http://ir.xjipc.cas.cn/handle/365002/7285]  
专题新疆理化技术研究所_多语种信息技术研究室
作者单位1.新疆理化技术研究所新疆民族语音语言信息处理实验室
2.中国科学院大学
3.中国科学院新疆理化技术研究所
推荐引用方式
GB/T 7714
张琳琳,杨雅婷,陈沾衡,等. 基于深度学习的相似语言短文本的语种识别方法[J]. 计算机应用与软件,2020,37(2):124-129+176.
APA 张琳琳,杨雅婷,陈沾衡,潘一荣,&李毓.(2020).基于深度学习的相似语言短文本的语种识别方法.计算机应用与软件,37(2),124-129+176.
MLA 张琳琳,et al."基于深度学习的相似语言短文本的语种识别方法".计算机应用与软件 37.2(2020):124-129+176.

入库方式: OAI收割

来源:新疆理化技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。