您的位置:首页 > 互联网

11分钟训完GPT-3!英伟达H100 横扫MLPerf 8项基准测试,下一代显卡25年发布

发布时间:2023-06-29 17:32:47  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】黄老板又赢麻了!在最新的MLPerf基准测试中,H100成功创下8项测试纪录。而外媒透露,下一代消费级显卡或在2025发布。

最新MLPerf训练基准测试中,H100GPU在所有的八项测试中都创下了新纪录!

如今,NVIDIA H100几乎已经统治了所有类别,并且是新LLM基准测试中使用的唯一 的GPU。

图片

3,584个H100GPU群在短短11分钟内完成了基于GPT-3的大规模基准测试。

MLPerf LLM基准测试是基于OpenAI的GPT-3模型进行的,包含1750亿个参数。

Lambda Labs估计,训练这样一个大模型需要大约3.14E23FLOPS的计算量。

图片

11分钟训出GPT-3的怪兽是如何构成的

我想看余承东

在LLM和BERT自然语言处理 (NLP) 基准测试中排名最高的系统,是由NVIDIA和Inflection AI联合开发。

由专门从事企业级GPU加速工作负载的云服务提供商CoreWeave托管。

该系统结合了3584个NVIDIA H100加速器和896个Intel Xeon Platinum8462Y+处理器。

图片

因为英伟达在H100中引入了新的Transformer引擎,专门用于加速Transformer模型训练和推理,将训练速度提高了6倍。

CoreWeave从云端提供的性能与英伟达从本地数据中心运行的AI超级计算机所能提供的性能已经非常接近了。

这得益于CoreWeave使用的NVIDIA Quantum-2InfiniBand网络具有低延迟网络。

随着参与训练的H100GPU从数百个扩展到3000多个。

良好的优化使得整个技术堆栈在要求严苛的LLM测试中实现了近乎线性的性能扩展。

如果将GPU的数量降低到一半,训练相同的模型时间会增加到24分钟。

说明整个系统的效率潜力,随着GPU的增加,是超线性的。

最主要的原因是,英伟达从GPU设计之初就考虑到了这个问题,使用NVLink技术来高效实现了GPU之间的通信。

图片

在参与测试的90个系统中,有82个系统都使用了英伟达的GPU进行加速。

图片

单卡训练效率

图片

系统集群训练时间对比

英特尔参加测评的系统使用64到96个不等的Intel Xeon Platinum8380处理器和256到389个不等的Intel Habana Gaudi2加速器。

然而,英特尔提交的GPT-3的训练时间为311分钟。

成绩和英伟达相比就稍微有点惨不忍睹了。

分析师:英伟达优势过大

行业分析师认为,英伟达的在GPU上的技术优势是非常明显的。

而它作为AI基础设施提供商,在行业中的主导地位还体现在英伟达多年建立起来的生态系统粘性上。

AI社区对英伟达的软件的依赖性也非常强。

几乎所有AI框架都基于英伟达提供的底层CUDA库和工具。

图片

而且它还能提供全堆栈的AI工具和解决方案。

除了为AI开发人员提供支持之外,英伟达还继续投资用于管理工作负载和模型的企业级工具。

soul捏脸搞怪

在可预见的未来,英伟达在行业的领先地位将会非常稳固。

分析师还进一步指出。

MLPerf测试结果中所展现的,NVIDIA系统在云端进行AI训练的强大功能和效率,才是英伟达「战未来」的最大本钱。

图片

下一代Ada Lovelace GPU,2025年发布

Tom's Hardware自由撰稿人Zhiye Liu也于近日发文,介绍了下一代英伟达Ada Lovelace显卡的计划。

H100训练大模型的能力,毋庸置疑。

只用3584个H100,短短11分钟内,就能训练出一个GPT-3模型。

在最近的新闻发布会上,英伟达分享了一份新路线图,详细介绍了下一代产品,包括GeForce RTX40系列Ada Lovelace GPU的继任者,而前者,是当今最好的游戏显卡。

图片

根据路线图,英伟达计划在2025年推出「Ada Lovelace-Next」显卡。

如果继续沿用当前的命名方案,下一代GeForce产品应该是作为GeForce RTX50系列上市。

根据南美黑客组织LAPSU$得到的信息,Hopper Next很可能被命名为Blackwell。

在消费级显卡上,英伟达保持着两年一更新的节奏。

他们在2016年推出了Pascal,在2018年推出了Turing,在2020年推出了Ampere,在2022年推出了Ada Lovelace。

如果这次Ada Lovelace的继任者会在2025年推出,英伟达无疑就打破了通常的节奏。

最近的AI大爆发,产生了对英伟达GPU的巨大需求,无论是最新的H100,还是上一代的A100。

根据报道,某大厂今年就订购了价值10亿美元的Nvidia GPU。

尽管有出口限制,但我国仍然是英伟达在全世界最大的市场之一。

(据说,在深圳华强北电子市场,就可以买到少量英伟达A100,每块售价为2万美元,是通常价格的两倍。)

对此,英伟达已经对某些AI产品做了微调,发布了H100或A800等特定SKU,以满足出口要求。

Zhiye Liu对此分析道,换个角度看,出口法规其实是有利于英伟达的,因为这意味着芯片制造商客户必须购买更多原版GPU的变体,才能获得同等的性能。

这也就能理解,为什么英伟达会优先考虑生成计算GPU,而非游戏GPU了。

最近的报道显示,英伟达已经增加了计算级GPU的产量。

没有面临来自AMD的RDNA3产品堆栈的激烈竞争,英特尔也没有对GPU双头垄断构成严重威胁,因此,英伟达在消费侧可以拖延。

最近,Nvidia通过GeForce RTX4060和GeForce RTX4060Ti,将其GeForce RTX40系列产品堆栈又扩大了。

GeForce RTX4050以及顶部的RTX4080Ti或GeForce RTX4090Ti等,都有潜力。

华为hms最新sdk

如果迫不得已,英伟达还可以从旧的Turing版本中拿出一个产品,更新Ada Lovelace,给它封个「Super」待遇,进一步扩展Ada阵容。

最后,Zhiye Liu表示,至少今年或明年,Lovelace架构不会真正更新。

参考资料:

https://blogs.nvidia.com/blog/2023/06/27/generative-ai-debut-mlperf/


返回网站首页

本文评论
BOSS直聘《2021应届生秋招早鸟报告》 计算机软件行业博士生平均月薪达41709元
9月17日消息,金九银十,又到了秋招的季节,根据BOSS直聘研究院发布的《2021应届生秋招早鸟报告》显示,自7月以来,各大企业的博士招聘需求同比激增71.5%。据了解,近几年,科技企业与学...
日期:08-01
供应链筑底,国美打响“产销并驱”进军战(国美的供应链)
  随着时代发展,主流消费观念更迭,零售行业在竞争激烈的当下,成本也愈发高企,导致一众企业回报率低下,如今普遍面临着扩张难的问题。   深耕行业34年的国美零售,在过去几十年...
日期:01-18
鲍尔默对微软的贡献_鲍尔默承认微软在移动OS市场上排名第五
6月5日消息,据国外媒体报道,微软首席执行官史蒂夫·鲍尔默在洛杉矶举行D8技术会议上在回答有关微软及其移动战略的问题时说,我们在这次游戏中曾经领先,现在我们发现我们在这个...
日期:07-29
工信部将适时开展智能网联汽车准入试点_工信部加强智能网联汽车生产企业及产品准入管理
IT之家 9 月 4 日消息,据央视新闻,工业和信息化部装备工业一司副司长郭守刚在中国汽车产业发展国际论坛上表示,下一步我国将发布汽车产业绿色低碳发展路线图;加快制定《道路机动...
日期:09-08
科大讯飞刘聪:中国造大模型或在某些领域超越ChatGPT「科大讯飞 刘磊」
快科技4月8日消息,科大讯飞研究院院长刘聪在人工智能大模型发展论坛上表示,认知智能大模型改变了信息分发获取模式、革新了内容生产模式、在万物互联时代实现全新人机交互方式...
日期:04-08
快手开展“2023年春节网络环境整治”专项行动 重点整治六大行为_快手平台治理
1月19日 消息:快手发布了关于开展“清朗·2023年春节网络环境整治”专项行动的公告。公告称,为落实“清朗·2023年春节网络环境整治”专项行动要求,切实履行平台主体责任,快手...
日期:01-19
硅谷五巨头“最惨一季”:赚钱变难,裁员继续_硅谷三巨头
声明:本文来自于微信公众号 深燃(ID:shenrancaijing),作者 | 王敏 编辑 | 金玙璠,授权转载发布。不出意料,裁员潮下,硅谷科技巨头们接连交出了不太好看的财报。北美东部时间2月2日...
日期:02-06
卖旧手机又不想泄露数据,只恢复出厂设置可不行_旧手机回收恢复出厂设置会不会泄露隐私
较真要点全身长满石头的男孩01仅通过手机恢复出厂设置不能保障信息安全,稳妥的办法是在手机恢复出厂设置并重启后,通过多次拷贝视频、下载软件等方式,把原有手机存储内存占满,覆...
日期:09-09
5天辗转8城!MAXHUB新品品鉴盛大开启 推动数字化办公协同创新
  在新一代信息技术和智能科技的支撑和引领下,传统办公场景的数字化升级正为越来越多的企业机构带来提效新机。为让更多企业感知到智能办公的科技赋能,7月20日-7月24日,MAXH...
日期:07-14
苹果手机怎么录屏操作方法「苹果手机怎么录屏」
苹果手机怎么录屏?这可能是许多iPhone用户的疑问。事实上,录制屏幕在iOS设备上是一项非常简单的任务,以下是一些方法。方法一:使用系统自带的功能进行录屏苹果的iOS系统自带了录...
日期:05-29
2022元宇宙共享大会|郑纬民携手各界送上祝福
央链直播报道, 2022 年 8 月 16 日,“开放与兼容” 2022 元宇宙共享大会暨《元宇宙十大技术》图书首 发仪式,及元宇宙产业委第 一届第二次全体委员大会,在北京西山国管局杏林山...
日期:09-01
2010年网络安全盘点之:最易让网民丢钱的十件事_世界网络安全事件
  春节临近,网上办年货、订机票火车票回家已成为许多网民的过年必备。然而,伴随着网上消费的火爆,网银、第三方支付账户等网民的“网上钱包”,也成为木马和钓鱼欺诈网站窥伺...
日期:07-26
医疗器械公司排名2020_2020医疗器械制造ERP系统十大品牌排行榜
  医疗器械制造ERP系统,是ERP系统的一个分支。医疗器械产品种类多,涉及原材料多,随着新技术应用,产品迭代越来越快,设计、生产周期越来越短,大量产品积压在仓库、渠道。面对内...
日期:01-12
微博网页版上线无障碍模式!支持语音朗读、字体放大:网友点赞
  喜欢刷微博的同学有没有发现,今天的新浪微博首页有些不同?   今日,新浪微博网页版正式上线“无障碍”模式,在首页右上角点击“无障碍”即可进入,该功能将为视障用户提供...
日期:07-17
周鸿祎宣布将要去东方甄选做一场直播带货
讯 8月5日晚间消息,360董事长周鸿祎在直播中和新东方董事长俞敏洪对话。周鸿祎宣布自己即将开始在东方甄选做一场直播带货,本来他想主要卖360产品和汽车,但不符合东方甄选的定...
日期:08-06
诺基亚型号手机怎么解锁密码「诺基亚所有型号手机」
作为一家久负盛名的手机制造商,诺基亚推出了许多经典且备受欢迎的手机产品,如今已成为时代的回忆。在这篇文章中,我们将介绍诺基亚的所有型号手机,回顾这个品牌传奇的历程。1....
日期:05-31
医院药的价格高多少违法「大幅提高药品价格 一药房违法被罚30万」
凤凰网科技讯 12月26日消息,天眼查App显示,近日,北京源通百姓平安大药房有限公司因违反价格法,被北京市市场监督管理局警告并罚款30万元。据悉,当事人竟然将采购价格为每盒18.5元...
日期:12-26
清洁能源充电功能上线 iOS 16.1 Beta5推送_ios充电更新
中关村在线消息:近日,苹果向开发人员们推送了iOS 16.1的第5个Beta测试版,新增了live Activity等全新功能,详细内容如下:live Activity是一种显示在锁屏界面上的交互式通知,让用户...
日期:10-15
微型颗粒制作方法_微小颗粒中流动科技 原装耗材技术详解
4月7日,惠普公司在泉城济南举办了一场原装耗材百家讲坛,现场通过视频分享、幻灯片讲解、互动游戏、趣味问答等环节,向媒体生动形象地介绍了原装耗材与兼容耗材在打印质量、打...
日期:07-27
AI席卷游戏业,玩家的“黑暗森林”、厂商的明日曙光?「黑暗明日公司」
声明:本文来自于微信公众号 刺猬公社(ID:ciweigongshe),文|星晖 编|石灿,授权转载发布。坦诚地讲,更早之前AI绘画工具飞速迭代时,美术从业者们就已嗅到了风雨欲来的不安气息。但那...
日期:04-11