中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
电网大数据预处理算法研究与实现

文献类型:学位论文

作者付亚同1,2
答辩日期2020-05-26
授予单位中国科学院沈阳自动化研究所
授予地点沈阳
导师王忠锋
关键词电网数据 数据质量 数据清洗 数据规约
学位名称专业学位硕士
学位专业机械工程
其他题名Research and Implementation of Big Data Preprocessing Algorithm in Power Grid
英文摘要随着信息通信技术的迅速发展,各行各业产生的数据量急剧增加,人类迈入大数据时代,数据已经成为行业重要资产和竞争资源。大数据同样对电力行业产生了重大影响,为了获取海量电力数据所带来的行业增益,数据分析、数据挖掘等数据处理技术已逐步引入到电力系统中。电网中产生的原始数据往往存在着很多“脏数据”,这些“脏数据”会为后续数据分析工作带来困难。为了消除“脏数据”带来的不良影响,需要对采集到的原始数据进行数据预处理,以提高数据质量。目前在电网数据处理的实际应用中,缺乏切实可行的数据预处理算法,很多数据处理算法仍旧处于探索阶段。为了解决上述问题,本文设计了适合电力系统的数据预处理算法,包含三个主要流程,通过三个算法来提高数据质量,最终可以得到高质量的数据。本文的主要工作有:1、针对电网数据质量判别问题,提出了四个常用的数据质量指标计算公式 和提升方法,为了确定有效的数据处理顺序提出了一种基于贪心策略的数 据质量提升算法,有效提升数据质量,降低计算成本和处理时间。2、针对电网数据异常值检测,采用单分类支持向量机对数据进行异常值识 别,对粒子群算法进行改进用于参数寻优,并使用基于改进粒子群算法的单 分类支持向量机进行电网数据异常值检测,提高了异常值检测的精度。3、针对电网数据规约,提出了一种基于影响因子的自适应自编码器算法, 降低了自编码器的误差,提高了数据降维效果,最终得到了高性能的数据降 维模型。 针对以上研究工作,本文进行了验证实验,证明了本文所提出的数据预处理算法的有效性,为下一步的数据分析挖掘工作奠定了良好基础。
语种中文
产权排序1
页码58页
源URL[http://ir.sia.cn/handle/173321/27154]  
专题沈阳自动化研究所_工业控制网络与系统研究室
作者单位1.中国科学院大学
2.中国科学院沈阳自动化研究所;
推荐引用方式
GB/T 7714
付亚同. 电网大数据预处理算法研究与实现[D]. 沈阳. 中国科学院沈阳自动化研究所. 2020.

入库方式: OAI收割

来源:沈阳自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。