用于文本分类的局部化双向长短时记忆
文献类型:期刊论文
作者 | 万圣贤; 兰艳艳; 郭嘉丰; 徐君; 庞亮; 程学旗 |
刊名 | 中文信息学报
![]() |
出版日期 | 2017 |
卷号 | 31.0期号:003页码:62 |
关键词 | 文本分类 深度学习 长短时记忆 卷积 |
ISSN号 | 1003-0077 |
英文摘要 | 近年来,深度学习越来越广泛地应用于自然语言处理领域,人们提出了诸如循环神经网络(RNN)等模型来构建文本表达并解决文本分类等任务。长短时记忆(long short term memory,LSTM)是一种具有特别神经元结构的RNN。LSTM的输入是句子的单词序列,模型对单词序列进行扫描并最终得到整个句子的表达。然而,常用的做法是只把LSTM在扫描完整个句子时得到的表达输入到分类器中,而忽略了扫描过程中生成的中间表达。这种做法不能高效地提取一些局部的文本特征,而这些特征往往对决定文档的类别非常重要。为了解决这个问题,该文提出局部化双向LSTM模型,包括MaxBiLSTM和ConvBiLSTM。MaxBiLSTM直接对双向LSTM的中间表达进行max pooling。ConvBiLSTM对双向LSTM的中间表达先卷积再进行max pooling。在两个公开的文本分类数据集上进行了实验。结果表明,局部化双向LSTM尤其是ConvBiLSTM相对于LSTM有明显的效果提升,并取得了目前的最优结果。 |
语种 | 英语 |
源URL | [http://119.78.100.204/handle/2XEOYT63/36335] ![]() |
专题 | 中国科学院计算技术研究所期刊论文_中文 |
作者单位 | 中国科学院计算技术研究所 |
推荐引用方式 GB/T 7714 | 万圣贤,兰艳艳,郭嘉丰,等. 用于文本分类的局部化双向长短时记忆[J]. 中文信息学报,2017,31.0(003):62. |
APA | 万圣贤,兰艳艳,郭嘉丰,徐君,庞亮,&程学旗.(2017).用于文本分类的局部化双向长短时记忆.中文信息学报,31.0(003),62. |
MLA | 万圣贤,et al."用于文本分类的局部化双向长短时记忆".中文信息学报 31.0.003(2017):62. |
入库方式: OAI收割
来源:计算技术研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。