中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
GOTOBLAS一般矩阵乘法高效实现机制的研究

文献类型:期刊论文

作者蒋孟奇 ; 张云泉 ; 宋刚 ; 李玉成
刊名计算机工程
出版日期2008
卷号34期号:7页码:84
关键词GOTOBLAS库 一般矩阵乘法 存储层次 分块算法 计算模型 GOTOBLAS general matrix-matrix multiplication hierarchical memory blocking algorithm computational models
ISSN号1000-3428
其他题名research on high performance implementation mechanism of gotoblas general matrix-matrix multiplication
中文摘要对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析.结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度.对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库.证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性.
收录类别wanfang,cscd,cnki
语种中文
公开日期2010-08-24
附注This paper analyses the implementation mechanism of GOTOBLAS library, especially the high performance implementation of its General Matrix-matrix Multiplication(GEMM) routines, and shows how to achieve high performance. It can be concluded that the effects of hierarchical memory on application performance are brought into the design of new computational models. Experimental results verifies the high performance of GOTOBLAS compared with public domain available BLAS, and testifies the important effect of hierarchical memory on algorithm performance.
源URL[http://124.16.136.157/handle/311060/4298]  
专题软件研究所_并行计算实验室 _期刊论文
推荐引用方式
GB/T 7714
蒋孟奇,张云泉,宋刚,等. GOTOBLAS一般矩阵乘法高效实现机制的研究[J]. 计算机工程,2008,34(7):84.
APA 蒋孟奇,张云泉,宋刚,&李玉成.(2008).GOTOBLAS一般矩阵乘法高效实现机制的研究.计算机工程,34(7),84.
MLA 蒋孟奇,et al."GOTOBLAS一般矩阵乘法高效实现机制的研究".计算机工程 34.7(2008):84.

入库方式: OAI收割

来源:软件研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。