当前位置：值得买 > 科技数码 > 正文

NVIDIA公布最新MLPerf成绩，加入Stable-Diffusion测试，成绩依然稳坐第一

beauty 发布于 2023-12-28
分类：科技数码
阅读(409)

MLPerf AI性能的测试基准在3.1更新版中加入Stable Diffusion训练测试，而NVIDIA也在最新公布的结果取得好成绩。

没有最强只有更强

MLPerf是行业用于衡量AI性能的测试基准，包括Amazon、Arm、Baidu、Google、Intel、Meta、Microsoft，以及哈佛大学、斯坦福大学、多伦多大学在内的众多业者与学术单位皆支持这项标准。

这次发表的最大亮点在于使用由10,752组H100 GPU搭配Quantum-2 InfiniBand网络互连技术的NVIDIA Eos人工智能超级计算机，它在短短3.9分钟完成拥有1,750组个参数的GPT-3模型训练，与NVIDIA在不到6个月前甫推出时仅使用3,584组H100 GPU的10.9分钟纪录相比提升约2.8倍。至于其他成绩信息与图表则整理于下。

▲MLPerf在3.1更新版中加入Stable Diffusion文字对图像生成模型的训练测试。

▲ 目前NVIDIA已可组成共有10,752组H100 GPU的超大型运算丛集。

▲ NVIDIA Eos人工智能超级计算机由10,752组H100 GPU，AI算力高达42.6EFLOPS。

▲ NVIDIA Eos人工智能超级计算机由10,752组H100 GPU，AI算力高达42.6EFLOPS。

▲ NVIDIA Eos人工智能超级计算机由10,752组H100 GPU，AI算力高达42.6EFLOPS。

▲ 受益于新款GPU带来的Scale-Up与更多GPU组成丛集带来的Scale-Out效益，让GPT-3 175B模型的训练时间度量从年缩短到月，再缩短到日。

▲ 运算丛集的H100 GPU数量由3,584组扩充至3倍的10,752组，而效能提升约2.8倍，换算之下Scale-Out的效率高达93%。

▲ 由10,752组H100 GPU组成的Microsoft Azure云服务器效能表现与Eos人工智能超级计算机效能相差不到2%，展现在数据中心和公有云部署的高效率。

▲ 在同样使用64组GPU / 加速器的条件下，H100的Stable Diffusion训练测试速度大约为Intel Gaudi 2的2倍。

▲ NVIDIA的MLPerf HPC（高效能运算）测试成绩较最初有10~16倍不等的表现（注：使用的软硬件并不相同），而在新加入的OpenFold氨基酸序列预测蛋白质3D结构模型测试中也有长足进步。

由于多数药物皆作用于蛋白质，因此OpenFold是协助科学家了解蛋白质的结构，并快速研发有效药物的关键。在最新测试中，H100 GPU在7.5分钟内完成OpenFold模型训练相较于2年前AlphaFold训练使用128个加速器并耗时11天，能够明显提升工作效率。

未经允许不得转载：值得买 » NVIDIA公布最新MLPerf成绩，加入Stable-Diffusion测试，成绩依然稳坐第一

相关推荐

作者：beauty

为了让老板过上他想要的生活，我在零上几十度和零下十几度的天气说起就起，翻身就前往打工的路上，早安，打工人