序列标注中的神经网络方法研究
文献类型:学位论文
作者 | 吴惠甲![]() |
答辩日期 | 2017-05 |
授予单位 | 中国科学院研究生院 |
授予地点 | 北京 |
导师 | 宗成庆 |
关键词 | 序列标注 范畴标注 动态窗口 跨层连接 长效短期记忆网络 |
英文摘要 |
序列标注是自然语言处理和机器学习领域中的一项重要的基础性工作,是
近年来的一个研究热点。本论文研究序列标注中的神经网络方法,具有理论意
义和应用价值。
论文的主要工作和创新点归纳如下:
1、提出了一种基于多层感知机的序列解码方法
该方法首先将词、词性和标签信息用预训练的实值向量表示,然后引入前
词的标签信息,在解码时利用柱搜索方法,在一定程度上捕捉标签之间的依赖
关系。在汉语和英语范畴标注任务上的实验表明,该方法有效提高了范畴标注
的准确率。
2、提出了一种动态窗口序列标注模型
多层感知机需要用固定窗口来获取上下文特征,但是窗口的大小不易选
取,且不同的词所需要的窗口信息也可能不同,本文设计了动态窗口模型来解
决这一问题。该模型借鉴长效短期记忆(LSTM)网络中的门机制,通过设计
的过滤门来动态提取上下文窗口中的信息,利用基于位置的注意力机制聚焦窗
口内容。实验表明,该模型可有效提升现有神经网络方法在范畴标注任务上的
性能。
3、提出了一种跨层堆叠的双向长效短期记忆标注模型
该模型针对层数过深会导致网络难以训练的问题,借鉴残差网络的思想,
引入了跨层连接方法以加速收敛,并提出了在双向网络上三种基本的跨层连接
方式,以寻找最优传输通道。此外,针对跨层连接会带来额外的迭代计算开销
的问题,设计了一种跨层模块来优化跨层的信息传输结构,把长效短期记忆网
络细胞模块中的自连接部分用跨层连接替代,因此无需保留自连接部分,从而
降低了迭代计算开销。在范畴标注和词性标注任务上证实了跨层模块的性能要
好于普通的跨层连接,并且在范畴标注任务上达到了目前的最好水平。 |
源URL | [http://ir.ia.ac.cn/handle/173211/14649] ![]() |
专题 | 毕业生_博士学位论文 |
作者单位 | 中国科学院自动化研究所 |
推荐引用方式 GB/T 7714 | 吴惠甲. 序列标注中的神经网络方法研究[D]. 北京. 中国科学院研究生院. 2017. |
入库方式: OAI收割
来源:自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。