顶点

美国超级计算机

顶点(英语:Summit,亦有翻译为“高峰”)超级计算机,实验室代号“OLCF-4”,是IBM美国能源部旗下橡树岭国家实验室开发建造的超级计算机。机组于2018年6月8日落成,理论运算能达200 PFLOPS(浮点运算速度每秒20亿亿次),超过峰值运算性能125 PFLOPS的神威·太湖之光,被认为有可能成为世界上最快的超级计算机。[2][3][4][5][6]2018年6月25日正式获TOP500认证为全球最快的超级计算机。[7]

高峰
承建商美国能源部、IBM
作业管理者美国能源部
架构9,216颗POWER9 22核心CPU
27,648块NVIDIA Tesla V100 GPGPU运算加速卡[1]
最大消耗功率15百万瓦
内部存储器RAM:512 GiB × 4,608 节点
NVRAM缓存:800 GB × 4,608 节点
外部存储器250 PB
运算速率理论:200 PFLOPS
造价2亿美元
用途科学研究
官方网站www.olcf.ornl.gov/olcf-resources/compute-systems/summit/
高峰超级计算机的一部分机组。

设计

高峰一共有4,608个运算节点,每节点就是一台主机,每个节点内仍然使用与泰坦类似的CPU+GPU异质运算体系,由两颗POWER9 CPU以及六块NVIDIA Tesla V100运算加速卡组成,CPU与GPU之间的连接采用的是英伟达(NVIDIA)开发的NVLink总线而非常见的PCIe[8],每个节点的CPU和GPU共享一共512GiB的一致性存储器(GPU拥有的第二代高带宽内存,加上CPU拥有的多通道DDR4存储器),CPU和GPU可相互直接访问这个存储器空间以共享资料,另外还配备了容量高达800GB的非易失性随机存储器(NVRAM)作为突发性缓存或扩展存储器容量之用。[9]

每个节点之间的连接采用的是双路InfiniBand互联,并使用非阻塞胖树拓扑(non-blocking fat-tree topology)交换结构英语Switched fabric,每路带宽为200Gb/s。容量高达250PB的分布式存储系统也使用InfiniBand与运算节点连接。

本机组另建于新机房内,该机房占地有约两个网球场的面积(约522平方米),与橡树岭国家实验室已有的泰坦不同,泰坦使用大型空冷系统冷却,而高峰则是使用液冷系统,每分钟流量高达4,000加仑,4,608台主机连同液冷系统的整机组全速运行时的功率就高达一千五百万瓦,几乎是泰坦的两倍。本机组仅GPGPU部分的双精度浮点数的运算性能就高达215 PFLOPS;Tesla V100内置有用于深度学习运算的Tensor Core,因此每颗GPGPU也能提供约125 TFLOPS的混合精度浮点数性能,而全机组的更高达3.3 EFLOPS(1 EFLOPS=1000 PFLOPS)。[2]

应用

与泰坦等精于气象的运算不同,高峰更精于人工智能机器学习深度学习方面的平行运算,实验室将其运用于动物健康、物理、气候模型等运算,会获得与运行同样项目的泰坦还要更细致的运算推演。未来还会加入天体额元素分析、超导体、新型材料等方面的研究。[10]

另见

参考资料

  1. ^ ORNL Launches Summit Supercomputer. [2018-06-18]. (原始内容存档于2019-08-08). 
  2. ^ 2.0 2.1 Summit Up and Running at Oak Ridge, Claims First Exascale Application. TOP500 Supercomputer Sites. [2018-06-13]. (原始内容存档于2020-11-09) (英语). 
  3. ^ R. Johnson, Colin. IBM vs. Intel in Supercomputer Bout. EE Times. 2015-04-15 [2015-12-29]. (原始内容存档于2015-12-16). 
  4. ^ Shankland, Steven. IBM, Nvidia land $325M supercomputer deal. C|Net. 2015-09-14 [2015-12-29]. (原始内容存档于2016-03-03). 
  5. ^ Noyes, Katherine. IBM, Nvidia rev HPC engines in next-gen supercomputer push. PC World. 2015-03-16 [2015-12-29]. (原始内容存档于2015-12-21). 
  6. ^ Lohr, Steve. You’d Need 63 Billion Years to Do What This Supercomputer Can Do in a Second. New York Times. 2018-06-08 [2018-12-08]. (原始内容存档于2018-06-10). 
  7. ^ US Regains TOP500 Crown with Summit Supercomputer, Sierra Grabs Number Three Spot. [2018-06-25]. (原始内容存档于2021-03-25). 
  8. ^ Summit and Sierra Supercomputers: An Inside Look at the U.S. Department of Energy's New Pre-Exascale Systems (PDF). 2014-11-01. (原始内容存档 (PDF)于2017-04-21). 
  9. ^ Lilly, Paul. NVIDIA 12nm FinFET Volta GPU Architecture Reportedly Replacing Pascal In 2017. HotHardware. 2017-01-25. (原始内容存档于2017-04-17). 
  10. ^ 美國重奪最強超級電腦之名. Engadget 中文版. [2018-06-18]. (原始内容存档于2019-06-08) (中文(台湾)). 
纪录
前任者:
神威·太湖之光
世界最强的超级计算机
2018年6月25日 – 2020年6月23日
继任者:
富岳