收藏本站
收藏 | 投稿 | 论文排版

基于CPU+GPU异构并行的广义共轭余差算法性能优化

黄东强  黄建强  贾金芳  吴利  刘令斌  王晓英  
【摘要】:为了提高GRAPES数值天气预报模式的计算效率,改善动力框架部分的性能,针对广义共轭余差算法(GCR)求解赫姆霍兹方程在GRAPES模式中耗时较大的问题,提出了一种基于CPU+GPU异构并行的预处理广义共轭余差算法。采用不完全LU分解对系数矩阵进行预处理来减少迭代次数,在此基础上实现了OpenMP的细粒度并行和MPI粗粒度并行,OpenMP并行主要是采用循环展开的方式对程序中无数据依赖的循环体使用编译制导来提高程序的性能;MPI并行主要是将数据划分给各个进程,采用非阻塞通信和优化进程通信数据量的方式来提高并行程序的可拓展性。实现了MPI+CUDA异构并行,MPI负责节点间进程通信以及迭代控制,CUDA负责处理计算密集型任务,将GCR中耗时较大的矩阵计算部分移植到GPU上处理,采用访存优化和数据传输优化来减少CPU和GPU间的数据传输开销。实验结果表明:与串行程序相比,OpenMP并行加速比为2.24,MPI并行加速比为3.32,MPI+CUDA异构并行加速比为4.69,实现了异构平台上的广义共轭余差算法性能优化,提高了程序的计算效率。

知网文化
【相似文献】
中国期刊全文数据库 前4条
1 淡嘉;郑昊;徐诚;宋雯雯;;四川省气象预警决策发布系统负载均衡实现与性能优化[J];中低纬山地气象;2021年06期
2 赵永明;;气象远程教育培训在线考试系统性能优化设计与实现[J];电子技术与软件工程;2020年05期
3 陈德花,卫敏玲;Hadley环流数模所用的假设之一——简化的经向运动方程精度的估计[J];热带气象学报;2001年04期
4 王卓薇;许先斌;赵武清;何水兵;张玉萍;;基于GPU的GRAPES模型并行加速及性能优化[J];计算机研究与发展;2013年02期
中国硕士学位论文全文数据库 前1条
1 杨磊;通信避免的广义共轭余差算法[D];中国气象科学研究院;2019年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978