中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
一种基于日志结合分析的集群系统失效预测方法

文献类型:期刊论文

作者付晓毓; 任睿; 詹剑锋; 孙凝晖
刊名高技术通讯
出版日期2016
卷号26.0期号:006页码:519
关键词大规模集群系统 系统日志 作业日志 日志分析 失效预测
ISSN号1002-0470
英文摘要研究了大规模超级计算机群系统的失效预测.针对现有的单一分析系统日志的方法不仅需要复杂的分布式数据挖掘技术,而且失效预测的召回率普遍不高的问题,提出了一种通过将记载集群系统负载变化的作业日志同系统日志结合起来分析来进行失效预测的方法.该方法的原理如下:首先,通过对原始系统日志和作业日志进行预处理和过滤,分别得到细粒度的二维的事件序列和作业序列;然后从中抽取出在系统日志的失效事件发生前作业日志所表现出的三种典型失效征兆;最后,利用失效征兆进行失效预测.在真实的IBM BlueGene/P系统的系统日志和作业日志上的实验结果表明,基于两种日志结合分析的方法能以较高的准确率和召回率实现细粒度的失效预测.
语种英语
源URL[http://119.78.100.204/handle/2XEOYT63/35989]  
专题中国科学院计算技术研究所期刊论文_中文
作者单位中国科学院计算技术研究所
推荐引用方式
GB/T 7714
付晓毓,任睿,詹剑锋,等. 一种基于日志结合分析的集群系统失效预测方法[J]. 高技术通讯,2016,26.0(006):519.
APA 付晓毓,任睿,詹剑锋,&孙凝晖.(2016).一种基于日志结合分析的集群系统失效预测方法.高技术通讯,26.0(006),519.
MLA 付晓毓,et al."一种基于日志结合分析的集群系统失效预测方法".高技术通讯 26.0.006(2016):519.

入库方式: OAI收割

来源:计算技术研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。