转载

美国封锁对华超算技术出口:出什么事了?(上)

  文/王强

  美国封锁对华超级计算机关键技术出口的消息,让超算这个词汇又成了媒体关注的焦点。

  虽然国产超算“天河 2 号”已经数度夺得全球性能冠军,但是为之自豪的网民还很少对“超级计算机”这个概念有比较深入的了解。本文将先为大家介绍超级计算机相关的背景知识,而续篇则会探讨美国技术封锁政策对我国超算发展的影响。

  什么是超算?

  超级计算机,又称高性能计算,英文名 High Performance Computing,简称超算/HPC。HPC 是为了解决工业界对大规模计算能力的需求而诞生的技术,现代超算本质上是将大量配置接近普通家用电脑/商用工作站的主机通过高速网络连接起来的主机集群。它运行的是专用操作系统,每台主机是一个运算节点;大量节点的运算能力叠加起来,就获得了远超单台或几台普通 PC 的计算能力。

  超算的技术特点

  经常在超算相关的新闻下面看到这样的评论:“这么强,跑 xxx 游戏卡不卡?”普通消费者对“运算速度”的概念通常就是玩一些大型游戏有多少帧率、画面细节能达到什么档次。有趣的是,超算执行的任务与 3D 游戏有不少相似之处。

  计算机世界中,“计算”可以分为整数和浮点计算两大类。8X4 是整数运算,而 1.5912/0.4 就是浮点计算。我们常见的大多数程序都是以整数计算为主,辅之以少量浮点部分;但 3D 游戏、图像渲染、视频特效这类工作则会大量应用浮点代码。

  在科学和工程领域常见的计算任务都是偏浮点化的:典型如大气模拟、材料应力计算、蛋白质分子模拟、地质模型分析等。这些领域中整数运算所占的比例较小,与我们常见的 PC 程序有较大差异。

  浮点运算任务的一大特点是很容易高度并行化。简单来说就是一段计算可以拆分给许许多多的计算核心来完成,不像整数计算那样很多时候只能分给少量几个核心。另外,密集浮点程序可以大量使用高级浮点指令—例如 AVX、FMA 等来明显提升运算速度。相比之下一般消费者使用的程序往往只能用到老旧的 SSE、SSE2,不太容易从新指令中获得加速效果。

  因为上述特点,高性能计算领域的应用可以很容易地从 CPU 的浮点运算能力改进中得益。下图是 Intel 几代 Xeon CPU 的理论浮点性能对比,可以看出受益于高级指令的增加,每代新品的性能都提升 1 倍以上;我们普通消费者很难感受到这么大幅度的进步,但科学和工程计算程序就获益匪浅。

美国封锁对华超算技术出口:出什么事了?(上)

  偏重浮点性能、可以大规模并行化的特点使科学计算应用很适合跑在 GPU 上。GPU 可以看作是有很多小核心的一种 CPU,牺牲整数性能和单核心性能换来整块芯片超强的浮点性能。CPU 和 GPU 联合执行科学计算的方式被称为异构计算,最近几年异构计算开始逐渐在业界推广。

  除了执行运算的 CPU、GPU 核心,超算的另外两大关键技术是内存和互联网络。高性能计算任务通常需要大量的内存,而且所需的空间随计算核心数量的增多而增加;此外,这些内存还要有很高的带宽来迅速将数据传递给处理器核心。互联网络则是将成千上万的主机搭建成超算系统的关键,主机数量越多,对网络的带宽、延迟和稳定性要求就越高。

  超算技术发展现状

  从前面的介绍我们可以知道,超算需要的是浮点性能很强、内存带宽和容量很高的计算芯片,以及高性能的大规模互联网络。高性能芯片的技术被四大巨头垄断:Intel、IBM、Nvidia 和 AMD。其中,Intel 和 IBM 一方面生产 CPU,另一方面研制出了类似 GPU 的超多核心芯片。例如 Intel 的新一代 Xeon Phi 处理器就是将数十颗特别加强了浮点性能的 Atom 核心集成到一起,配上带宽达到数百 GB/s的 3D 封装内存制造而成的。一颗新版 Xeon Phi 的性能达到每秒 2 万亿次浮点运算,相当于最快的 Xeon CPU 的 3 倍。Nvidia 和 AMD 则在自家 GPU 的基础上生产专用计算卡 Tesla 和 FirePro,其浮点性能也达到2-3 万亿次每秒的水平。

美国封锁对华超算技术出口:出什么事了?(上)

  由于制造技术与成本的限制,Tesla 和 Xeon Phi 这样的芯片的内存不能做到很大容量,无法执行那些需要庞大内存空间的代码,这也限制了这类芯片的普及率。但由于这些芯片的性能相比一般 CPU 有明显优势,且几大企业都在努力解决内存空间的问题,未来它们会是业界的主流选择。Intel 希望自己的 Xeon Phi 在未来能一统天下;Nvidia 与 IBM 合作,将推出 Power CPU+Tesla 计算卡的异构解决方案;AMD 则力推自家的 HSA 异构方案,希望 Opteron CPU+FirePro 计算卡的组合能占据一席之地。目前来看 Intel 的优势比较大,而 Nvidia/IBM 的联盟也能拿下一定的份额。

  互联网络方面的技术不像计算芯片那样高度垄断。目前有不少企业都在提供超算网络解决方案,我国在这方面也具备世界一流水平。最先进的超算网络可以让数万计算节点以高达 100Gbps 的带宽通信,同时保证稳定性和低延时。

  超算对国家的意义

  一如前文所述,超算技术主要是服务工业和科学研究的。强大的计算能力对企业、学校和国防研究都有很大的帮助,甚至可以说是不可或缺的。当年美国宣布终止核试验,其底气就是超算模拟核试验技术已经足够成熟。由于投入巨大、回报周期较长,各国的超算项目主要由政府实施或资助。如今,超算技术和资源水平已经成为一国科研实力的重要指标之一。

  中国的超算技术近年来发展迅速,曙光、天河前后多次登上全球超算性能排行榜冠军。如今美国宣布对华超算技术禁运,无疑是感到了中国在这一领域的威胁。那么美国的禁运政策将对中国有什么影响呢?请看下一篇文章的具体分析。

  相关新闻:

  美国禁止向中国出口与超级计算机有关技术

正文到此结束
Loading...