中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
基于深度学习的时序数据预测算法研究及应用

文献类型:学位论文

作者陶涛
答辩日期2019-05-23
授予单位中国科学院大学
授予地点中国科学院新疆理化技术研究所
导师周喜
关键词加油站时序数据 预测算法 深度学习 seq2seq 双向LSTM
学位名称硕士
学位专业计算机技术
英文摘要

近年来,随着物联网技术的日趋成熟,人类已迈进信息大爆炸的时代,大量数据利用数据采集设备通过互联网传递并聚集形成海量的数据,物联网大数据也随之成为重要的研究课题。由于数据采集设备分布数量众多、采集数据时间间隔较短、采集频率较快,所以能够在短时间内获取丰富的数据资源,这些数据具有按照时间序列排布、数据维度高且依赖性强以及数据分布模型较为复杂等特点。其中时间序列表示在同一种场景下观测记录到的一组按照时间顺序排列的统计数据,通过对时间序列进行预测研究能够寻找发现数据内部蕴含的规律,对物联网大数据中的时间序列数据进行预测分析具有重要的应用价值,例如对加油站的时间序列数据进行及时精准的预测能够对加油行为实现有效的监察,提高整个加油站点的管理效率,为保障区域性社会稳定和促进经济发展奠定基础。目前关于时序数据预测的方法有很多种,并且已经取得一定的研究成果,然而这些方法往往侧重于数据的统计学建模而忽略了数据的时间相关性。故对于数据特征排列较为稀疏,而且相关性特征较为稀少的时间序列数据来说,现有的时序数据预测算法存在预测误差过大以及忽略关键性特征等缺陷,使其未能达到较好的预期效果,甚至有的算法并不适用。针对现有预测算法存在的缺陷,为了更为精准地分析大规模稀疏时间序列数据的趋势和变化,本文侧重于数据的时序性针对时间序数据提出一种基于深度学习的方法(Time-Series Based DeepLearning,TS-DL)来预测数据。首先利用自动编码机从原始数据中提取特征,然后结合实际场景构造切实相关的外部特征,最终利用深度学习强大的特征学习以及信息记忆能力来对输入的时间序列数据进行预测。在加油数据集以及货币汇率数据集上的实验验证了本文方法的有效性和通用性,并且相较于现有方法在加油数据集上预测误差降低了21.1%,在货币汇率数据集上预测准确率达到99.6%。因此,本文提出的模型能够有效应用于加油站时序数据的预测分析,可以为实际场景中加油站的安全预警以及效益预判提供决策支持和辅助,从而提高加油站的管理和运营效率,并且对于类似场景的实际问题也具有一定参考意义。研究成果丰富了物联网大数据场景下的时序数据预测理论,具有一定的理论意义以及应用价值。本文的主要贡献在于结合实际对大规模稀疏的时间序列数据进行分析,在深度学习的支撑下构建切实有效的预测模型,具体的创新点如下:1. 利用自动编码机(AutoEncoder)从某省加油数据集中提取有效特征。2. 结合实际场景构造与加油预测任务相关联的外部特征。3.在最小化预测误差优化前提下,基于创新点1中提取的有效特征以及创新点2中人为构造的衍生特征建立嵌入双向长短期记忆(Bi-directional long-short term memory,BiLSTM)的seq2seq模型,并预测包含上述特征的时间序列数据。

页码53
源URL[http://ir.xjipc.cas.cn/handle/365002/5973]  
专题新疆理化技术研究所_多语种信息技术研究室
推荐引用方式
GB/T 7714
陶涛. 基于深度学习的时序数据预测算法研究及应用[D]. 中国科学院新疆理化技术研究所. 中国科学院大学. 2019.

入库方式: OAI收割

来源:新疆理化技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。