GPU集群是一个计算机集群,其中每个节点配备有图形处理单元(GPU)。通过图形处理单元(GPGPU)上的通用计算来利用现代GPU的计算能力,可以使用GPU集群执行非常快速的计算。

硬件(GPU)

GPU集群可以使用来自两个主要独立硬件供应商的硬件(AMDnVidia)。[1]

硬件(其他)

互联

除了计算机节点及其各自的GPU之外,还需要足够快的互连以便在节点间传送数据。互连的类型在很大程度上取决于存在的节点数量。互连的一些例子包括千兆以太网无限带宽

供应商

NVIDIA提供专用特斯拉首选合作伙伴(TPP)中列表,能够使用Tesla 20系列GPGPU构建和交付完全配置的GPU集群。AMAX信息技术公司,戴尔,惠普和Silicon Graphics是为数不多的几家提供完整GPU集群和系统的公司之一。[2]

软件

制造许多配备GPU的机器所需的软件组件包括:

  1. 操作系统[3]
  2. GPU驱动程序,用于每个群集节点中存在的每种类型的GPU
  3. 集群API(如消息传递接口,MPI)
  4. VirtualCL(VCL)[2]集群平台是OpenCL™的一个包装,允许大多数未修改的应用程序透明地利用集群中的多个OpenCL设备,就像所有设备都在本地计算机上一样。

算法映射

映射算法以运行GPU群集有点类似于映射算法以在传统计算机群集上运行。例如:不是从RAM分配数组的片段,而是在GPU群集的节点之间划分纹理。[4]

参考资料

  1. ^ 用於高性能計算的GPU集群 (PDF). [2018-06-19]. (原始内容存档 (PDF)于2013-08-18). 
  2. ^ 2.0 2.1 合作夥伴. NVIDIA. 2017-05-14 [2018-06-19]. (原始内容存档于2012-05-06) (美国英语). 
  3. ^ GPU核心溫度監測. [2021-02-06]. (原始内容存档于2021-01-31). 
  4. ^ Are Magnus Bruaset, Aslak Tveito. 並行计算机中偏微分方程的數值解法. Birkhäuser. 2006. ISBN 3-540-29076-1.