电网大数据预处理算法研究与实现
文献类型:学位论文
作者 | 付亚同1,2 |
答辩日期 | 2020-05-26 |
授予单位 | 中国科学院沈阳自动化研究所 |
授予地点 | 沈阳 |
导师 | 王忠锋 |
关键词 | 电网数据 数据质量 数据清洗 数据规约 |
学位名称 | 专业学位硕士 |
学位专业 | 机械工程 |
其他题名 | Research and Implementation of Big Data Preprocessing Algorithm in Power Grid |
英文摘要 | 随着信息通信技术的迅速发展,各行各业产生的数据量急剧增加,人类迈入大数据时代,数据已经成为行业重要资产和竞争资源。大数据同样对电力行业产生了重大影响,为了获取海量电力数据所带来的行业增益,数据分析、数据挖掘等数据处理技术已逐步引入到电力系统中。电网中产生的原始数据往往存在着很多“脏数据”,这些“脏数据”会为后续数据分析工作带来困难。为了消除“脏数据”带来的不良影响,需要对采集到的原始数据进行数据预处理,以提高数据质量。目前在电网数据处理的实际应用中,缺乏切实可行的数据预处理算法,很多数据处理算法仍旧处于探索阶段。为了解决上述问题,本文设计了适合电力系统的数据预处理算法,包含三个主要流程,通过三个算法来提高数据质量,最终可以得到高质量的数据。本文的主要工作有:1、针对电网数据质量判别问题,提出了四个常用的数据质量指标计算公式 和提升方法,为了确定有效的数据处理顺序提出了一种基于贪心策略的数 据质量提升算法,有效提升数据质量,降低计算成本和处理时间。2、针对电网数据异常值检测,采用单分类支持向量机对数据进行异常值识 别,对粒子群算法进行改进用于参数寻优,并使用基于改进粒子群算法的单 分类支持向量机进行电网数据异常值检测,提高了异常值检测的精度。3、针对电网数据规约,提出了一种基于影响因子的自适应自编码器算法, 降低了自编码器的误差,提高了数据降维效果,最终得到了高性能的数据降 维模型。 针对以上研究工作,本文进行了验证实验,证明了本文所提出的数据预处理算法的有效性,为下一步的数据分析挖掘工作奠定了良好基础。 |
语种 | 中文 |
产权排序 | 1 |
页码 | 58页 |
源URL | [http://ir.sia.cn/handle/173321/27154] ![]() |
专题 | 沈阳自动化研究所_工业控制网络与系统研究室 |
作者单位 | 1.中国科学院大学 2.中国科学院沈阳自动化研究所; |
推荐引用方式 GB/T 7714 | 付亚同. 电网大数据预处理算法研究与实现[D]. 沈阳. 中国科学院沈阳自动化研究所. 2020. |
入库方式: OAI收割
来源:沈阳自动化研究所
浏览0
下载0
收藏0
其他版本
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。