英伟达三芯策略初见成效 ISC 2022中国自主光刻机引领未来科研人员期待新时代的突破

英伟达的“三芯”策略初见成效,CPU与GPU的协同工作引领未来:中国自主光刻机展现新时代的技术突破

在过去几年的讨论中,人们主要关注的是GPU,而现在,随着英伟达推出CPU和DPU,这家系统公司能够谈论的话题变得更加丰富。近期在Computex和ISC 2022(国际超级计算机大会)的展览上,英伟达展示了其最新的合作成果,这些成果大幅度地证明了英伟达“三芯”策略已经取得初步成功。

除了混合量子计算领域外,英伟达CEO黄仁勋也强调了公司作为全栈方案提供者,为客户提供从硬件到系统软件的一体化解决方案。这意味着客户可以根据自己的需求选择产品,加速计算世界与CPU截然不同,而英伟达独特的产品和方案为此提供支持。

那么,“三芯”是如何加速那些速度最快的加速系统?独特的CPU+GPU组合正是答案。虽然市场上有许多优秀的CPU产品,但Grace CPU在这样的背景下推出,让人感到意外,也让人好奇它有什么不同之处。在回答这个问题时,黄仁勋表示:“Grace旨在比传统CPU更好地解决与数据处理有关的问题,它能更高效地处理大量数据,并且与我们的GPU紧密结合,更好地完成AI任务。”

Grace CPU是一款集成了两个基于Arm架构设计、拥有多达144个高性能Arm Neoverse核心并带有可伸缩矢量扩展以及1 TB/s内存子系统、支持最新PCIe Gen5协议,可以实现最高性能连接,同时还能连接NVIDIA ConnectX-7智能网卡以及NVIDIA BlueField-3 DPU。这表明,在设计过程中,英伟达就非常明确要将所有硬件产品之间进行良好的互联。这也是由于摩尔定律放缓后的异构计算成为未来趋势,以及作为提供高性能计算产品公司,英伟達这样的布局十分合理。

美国阿拉莫斯国家实验室宣布,将率先采用NVIDIA Grace CPU技术的一代新系统Venado,其AI性能预计超过10 exaflops(10^18次方)。另一个率先采用这两款超级芯片的是瑞士国家计算中心新建的大型通用系统Alps。此外,还有源讯、戴尔科技、技嘉科技、慧与、浪潮、联想和超微计划部署基于Grace CPU和Hopper GPU服务器。

DPU是一个新的概念,由于其通信负载卸载功能,从而获得巨大的性能提升。不过DPU能够带来的具体提升仍需通过实践来验证。通过ISC 2022给出的案例显示了DPU对于提高网络应用程序性能潜力的巨大优势,如LANL使用BlueField及DOCA软件框架提高30倍多物理应用中的性能,加速闪存盒将固态存储与DPU相结合,以Linux文件系统关键部分为目标进行加速;俄亥俄州立大学研究人员利用DPU提高P3DFFT运行速度21%;欧洲多个研究团队正在利用BlueField DPU以实现MPI等HPC工作负载加速。

总结来说,不仅英国北部大学开发了一款用于16节点集群上的BlueField DPU负载均衡软件,而且剑桥大学、三一学院等其他机构都在使用这些设备。而且这些设备不仅限于HPC仿真,还被用于分子动力学研究、中气候学、大数据分析以及更多前沿科学领域如AI等,其中包括使用新一代BlueField-3 DPU核心功能。

最后,在量子计算方面,一些组织已开始使用NVIDIA cuQuantum软件开发套件在GPU上加速其量子电路模拟,比如AWS展示了cuQuantum如何对quantum machine learning workload进行900倍加速。因此,无论是在经典还是量子层面,都可以看出 英偉達通過豐富硬體產品與軟體生態保持競爭力,並準備迎接未來技術挑戰。