帮助 本站公告
您现在所在的位置:网站首页 > 知识中心 > 文献详情
文献详细Journal detailed

基于龙芯2F体系结构的BLAS库优化
Optimization of BLAS based on Loongson 2F architecture

作  者: ; ; ; ;

机构地区: 中国科学技术大学计算机科学与技术学院

出  处: 《中国科学技术大学学报》 2008年第7期854-859,共6页

摘  要: 在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性代数问题的子程序集合BLAS,提出了新的优化技术,充分发挥龙芯2F处理器的性能,实现了高性能的BLAS.实际测试表明,高性能BLAS在750 MHz的龙芯2F处理器(双精度浮点峰值3 Gflops)上HPL实测峰值达到1.47 GHz,比原始BLAS提高了6倍以上,比ATLAS提高了45%. BLAS are standard operations to efficiently solve the linear algebra problems on high performance computers. Some new optimization technologies on data prefetch and instruction scheduling developed specifically for Loongson 2F characteristics were proposed based on normal optimization technologies to give full play to develop the performance of Loongson 2F processer and implement a high performance BLAS on KD-50-Ⅰ platform. According to the experiments, the actual double float operation peak of high performance BLAS on 750 MHz Loongson 2F processor(double float peak 3 Gflops) can reach 1.47 GHz, which is more than 6 times higher than BLAS, and 45% higher than ATLAS.

关 键 词: 龙芯 数据预取 指令调度

领  域: [自动化与计算机技术] [自动化与计算机技术]

相关作者

作者 高志平
作者 张方群
作者 徐朝晖
作者 王志高
作者 金素荣

相关机构对象

机构 中山大学
机构 广东工业大学
机构 华南师范大学
机构 华南理工大学
机构 广东培正学院

相关领域作者

作者 李文姬
作者 邵慧君
作者 杜松华
作者 周国林
作者 邢弘昊