您的位置:首页 > 互联网

老黄深夜炸场,世界最强AI芯片H200震撼发布!性能飙升90%,Llama 2推理速度翻倍,大批超算中心来袭

发布时间:2023-11-14 09:31:49  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】刚刚,英伟达发布了目前世界最强的AI芯片H200,性能较H100提升了60%到90%,还能和H100兼容。算力荒下,大科技公司们又要开始疯狂囤货了。

英伟达的节奏,越来越可怕了。

就在刚刚,老黄又一次在深夜炸场——发布目前世界最强的AI芯片H200!

台积电史上最惨芯片制程工艺

较前任霸主H100,H200的性能直接提升了60%到90%。

不仅如此,这两款芯片还是互相兼容的。这意味着,使用H100训练/推理模型的企业,可以无缝更换成最新的H200。

全世界的AI公司都陷入算力荒,英伟达的GPU已经千金难求。英伟达此前也表示,两年一发布的架构节奏将转变为一年一发布。

就在英伟达宣布这一消息之际,AI公司们正为寻找更多H100而焦头烂额。

英伟达的高端芯片价值连城,已经成为贷款的抵押品。

谁拥有H100,是硅谷最引人注目的顶级八卦

至于H200系统,英伟达表示预计将于明年二季度上市。

同在明年,英伟达还会发布基于Blackwell架构的B100,并计划在2024年将H100的产量增加两倍,目标是生产200多万块H100。

而在发布会上,英伟达甚至全程没有提任何竞争对手,只是不断强调英伟达的AI超级计算平台,能够更快地解决世界上一些最重要的挑战。

随着生成式AI的大爆炸,需求只会更大,而且,这还没算上H200呢。赢麻了,老黄真的赢麻了!

141GB超大显存,性能直接翻倍!

H200,将为全球领先的AI计算平台增添动力。

它基于Hopper架构,配备英伟达H200Tensor Core GPU和先进的显存,因此可以为生成式AI和高性能计算工作负载处理海量数据。

英伟达H200是首款采用HBM3e的GPU,拥有高达141GB的显存。

与A100相比,H200的容量几乎翻了一番,带宽也增加了2.4倍。与H100相比,H200的带宽则从3.35TB/s增加到了4.8TB/s。

英伟达大规模与高性能计算副总裁Ian Buck表示——

要利用生成式人工智能和高性能计算应用创造智能,必须使用大型、快速的GPU显存,来高速高效地处理海量数据。借助H200,业界领先的端到端人工智能超算平台的速度会变得更快,一些世界上最重要的挑战,都可以被解决。

Llama2推理速度提升近100%

跟前代架构相比,Hopper架构已经实现了前所未有的性能飞跃,而H100持续的升级,和TensorRT-LLM强大的开源库,都在不断提高性能标准。

H200的发布,让性能飞跃又升了一级,直接让Llama270B模型的推理速度比H100提高近一倍!

H200基于与H100相同的Hopper架构。这就意味着,除了新的显存功能外,H200还具有与H100相同的功能,例如Transformer Engine,它可以加速基于Transformer架构的LLM和其他深度学习模型。

HGX H200采用英伟达NVLink和NVSwitch高速互连技术,8路HGX H200可提供超过32Petaflops的FP8深度学习计算能力和1.1TB的超高显存带宽。

当用H200代替H100,与英伟达Grace CPU搭配使用时,就组成了性能更加强劲的GH200Grace Hopper超级芯片——专为大型HPC和AI应用而设计的计算模块。

下面我们就来具体看看,相较于H100,H200的性能提升到底体现在哪些地方。

首先,H200的性能提升最主要体现在大模型的推理性能表现上。

如上所说,在处理Llama2等大语言模型时,H200的推理速度比H100提高了接近1倍。

因为计算核心更新幅度不大,如果以训练175B大小的GPT-3为例,性能提升大概在10%左右。

显存带宽对于高性能计算(HPC)应用程序至关重要,因为它可以实现更快的数据传输,减少复杂任务的处理瓶颈。

对于模拟、科学研究和人工智能等显存密集型HPC应用,H200更高的显存带宽可确保高效地访问和操作数据,与CPU相比,获得结果的时间最多可加快110倍。

相较于H100,H200在处理高性能计算的应用程序上也有20%以上的提升。

而对于用户来说非常重要的推理能耗,H200相比H100直接腰斩。

这样,H200能大幅降低用户的使用成本,继续让用户买的越多,省的越多!

上个月,外媒SemiAnalysis曾曝出一份英伟达未来几年的硬件路线图,包括万众瞩目的H200、B100和X100GPU。

而英伟达官方,也公布了官方的产品路线图,将使用同一构架设计三款芯片,在明年和后年会继续推出B100和X100。

B100,性能已经望不到头了

这次,英伟达更是在官方公告中宣布了全新的H200和B100,将过去数据中心芯片两年一更新的速率直接翻倍。

以推理1750亿参数的GPT-3为例,今年刚发布的H100是前代A100性能的11倍,明年即将上市的H200相对于H100则有超过60%的提升,而再之后的B100,性能更是望不到头。

至此,H100也成为了目前在位最短的旗舰级GPU。

如果说H100现在就是科技行业的黄金,那么英伟达又成功制造了铂金和钻石。

H200加持,新一代AI超算中心大批来袭

云服务方面,除了英伟达自己投资的CoreWeave、Lambda和Vultr之外,亚马逊云科技、谷歌云、微软Azure和甲骨文云基础设施,都将成为首批部署基于H200实例的供应商。

此外,在新的H200加持之下,GH200超级芯片也将为全球各地的超级计算中心提供总计约200Exaflops的AI算力,用以推动科学创新。

在SC23大会上,多家顶级超算中心纷纷宣布,即将使用GH200系统构建自己的超级计算机。

德国尤里希超级计算中心将在超算JUPITER中使用GH200超级芯片。

这台超级计算机将成为欧洲第一台超大规模超级计算机,是欧洲高性能计算联合项目(EuroHPC Joint Undertaking)的一部分。

Jupiter超级计算机基于Eviden的BullSequana XH3000,采用全液冷架构。

它总共拥有24000个英伟达GH200Grace Hopper超级芯片,通过Quantum-2Infiniband互联。

每个Grace CPU包含288个Neoverse内核, Jupiter的CPU就有近700万个ARM核心。

它能提供93Exaflops的低精度AI算力和1Exaflop的高精度(FP64)算力。这台超级计算机预计将于2024年安装完毕。

由筑波大学和东京大学共同成立的日本先进高性能计算联合中心,将在下一代超级计算机中采用英伟达GH200Grace Hopper超级芯片构建。

作为世界最大超算中心之一的德克萨斯高级计算中心,也将采用英伟达的GH200构建超级计算机Vista。

伊利诺伊大学香槟分校的美国国家超级计算应用中心,将利用英伟达GH200超级芯片来构建他们的超算DeltaAI,把AI计算能力提高两倍。

此外,布里斯托大学将在英国政府的资助下,负责建造英国最强大的超级计算机Isambard-AI——将配备5000多颗英伟达GH200超级芯片,提供21Exaflops的AI计算能力。

英伟达、AMD、英特尔:三巨头决战AI芯片

GPU竞赛,也进入了白热化。

面对H200,而老对手AMD的计划是,利用即将推出的大杀器——Instinct MI300X来提升显存性能。

MI300X将配备192GB的HBM3和5.2TB/s的显存带宽,这将使其在容量和带宽上远超H200。

而英特尔也摩拳擦掌,计划提升Gaudi AI芯片的HBM容量,并表示明年推出的第三代Gaudi AI芯片将从上一代的96GB HBM2e增加到144GB。

英特尔Max系列目前的HBM2容量最高为128GB,英特尔计划在未来几代产品中,还要增加Max系列芯片的容量。

H200价格未知

所以,H200卖多少钱?英伟达暂时还未公布。

要知道,一块H100的售价,在25000美元到40000美元之间。训练AI模型,至少需要数千块。

此前,AI社区曾广为流传这张图片《我们需要多少个GPU》。

GPT-4大约是在10000-25000块A100上训练的;Meta需要大约21000块A100;Stability AI用了大概5000块A100;Falcon-40B的训练,用了384块A100。

根据马斯克的说法,GPT-5可能需要30000-50000块H100。摩根士丹利的说法是25000个GPU。

Sam Altman否认了在训练GPT-5,但却提过OpenAI的GPU严重短缺,使用我们产品的人越少越好。

我们能知道的是,等到明年第二季度H200上市,届时必将引发新的风暴。


返回网站首页

本文评论
印度芯片产量「产品在国内被审查 美光投建印度芯片厂:砸近70亿元」
快科技4月25日讯,前不久,官方宣布对美光公司在华销售的产品实施网络安全审查。据最新消息,美光公司正加快在印度投资建厂的步伐,一家造价10亿美元(约超69亿元人民币)的新工厂呼之...
日期:04-25
戴尔边缘创新联合实验室启动
【】4月7日消息,戴尔科技集团在沪正式启动戴尔边缘创新联合实验室,旨在借助业界领先的边缘产品组合,帮助企业客户简化边缘部署,加速数智创新,通过建设强大的边缘计算生态,更好地助...
日期:10-04
8.5代液晶面板生产线_大陆8.5代液晶面板线:或遭遇“投产即亏损”
  中国大陆平板彩电企业在全球产业链中曾一度被形容为“缺芯少屏”,而随着自主投资建设的两条8.5代TFT-LCD液晶面板生产线于近期启动投产,长久困扰国内彩电企业的“缺屏之...
日期:07-22
长虹智能手机「长虹智能手机遥控器」
是长虹公司在智能手机领域的产品。长虹公司作为国内知名的电子企业,其在智能手机领域也应有尽有:从早期的Windows Mobile时代,到后来的Android及基于其上的可定制化ROM,再到今天...
日期:05-31
苹果可能向欧盟第三方应用商店开放iOS 17「ioss 欧盟」
据分析师称,苹果可能向第三方应用商店开放iOS 17,但仅限于欧盟,原因是《数字市场法》的规定。此举是在与Epic Games发生法律的纠纷之后,Epic Games于2020年起诉苹果反竞争行为。...
日期:04-25
李东生出席夏季达沃斯:企业全球化为世界经济复苏注入新动力「李东辉 ceo」
6 月 27 至 29 日,世界经济论坛第十四届新领军者年会(夏季达沃斯论坛)在天津举行。TCL创始人、董事长李东生作为中国科技制造业代表受邀参会并出席论坛重要环节,分享TCL在全球...
日期:06-28
践行碳中和使命 太太乐全面推行净零碳路线规划
  气候变化始终是当今社会面临的最大挑战之一,世界各国都在倡导减少碳排放,最终实现“净零”(net zero)排放。碳中和已成为全球性的呼声,被视为遏制气候变化和减少自然灾害...
日期:07-17
11.83亿元_极兔100%完成收购顺丰旗下丰网公司
7月4日消息,据工商资料显示,近日深圳市丰网信息技术有限公司发生工商变更。顺丰旗下深圳市丰网控股有限公司退出股东,新增极兔速递旗下深圳极兔供应链有限公司为股东并全资持股...
日期:09-22
iPhone SE4屏幕升级!小屏旗舰来了「iphone se 大屏」
iPhone SE4迎来新的消息,一位显示器分析师表示,苹果已经在考虑iPhone SE4的屏幕尺寸和屏幕材料,包括两家供应商的6.1英寸有机发光二极管显示屏和两家供应商的5.7-6.1英寸液晶显...
日期:11-08
大企业采购电脑不犯难,联想E采帮你一站搞定_企业采购* 联想e采
  经济全球化使得全采购行业都发生了巨大变革。一方面,大企业采购从默默付出的幕后走到了光鲜亮丽的台前,为企业运转提供了重要动力支持;另一方面,与以往相比,大企业采购更加...
日期:07-10
破20万!一图看懂比亚迪9月汽车销量:汉首破3万 宋4.6万新高「比亚迪宋累计销量」
9月份的比亚迪继续高歌猛进,单月销量首次突破20万辆,达到201259辆,同比暴涨151.2%,再次创下单月销量历史新高。其中乘用车销量200973辆(含出口7736辆),同比增长154.3%。按动力分,DM...
日期:10-05
最强小折叠屏!OPPO Find N3 Flip外观首曝:天玑9200 加持_oppo三折叠手机
快科技8月15日消息,社交平台上曝光了OPPO Find N3 Flip外观设计图。上海商派网络科技有限公司地址曝iphone14pro摄像头抖动如图所示,OPPO Find N3 Flip背部潜入了一块超大号副...
日期:08-15
孟羽童有没有在格力就职「孟羽童再发文辟谣离职格力传闻」
11月8日 消息:近日,有消息称孟羽童已“离职格力”、“被移出公司通讯录”,孟羽童则“辟谣”回应,“谁再说我离职我真的会揍人”。辟谣后,孟羽童晒出受邀参加2022娇兰晚宴的照片,...
日期:11-12
继小米13Ultra之后 小米宣布为小米13推出同源定制色
5月5日 消息:继小米13Ultra之后,今日小米宣布为小米13推出同源定制色,后盖采用第二代科技纳米皮材质,搭配高亮黑色金属中框,将于5月6日10点在小米商城发售。同样有星空蓝、赤霞...
日期:05-05
四核手机有哪些型号「四核手机」
是一种拥有四颗处理器核心的手机,也被称为四核处理器手机。与双核手机相比,拥有更快的处理速度和更好的多任务处理能力,可以更流畅地运行多种应用程序。的优点1.更快的处理速度...
日期:05-31
比特币价格再次跌破2万美元 和去年3月相比下跌58.9%_比特币价格大跌
9月19日 消息:比特币价格又跌了!美国时间周日,比特币价格下跌至19804美元,与上一个交易日结束时相比价格下跌310美元。根据报价平台CoinDesk的数据,北京时间9月19日8时20分,比特...
日期:09-24
东方甄选自己搞直播了!「东方臻选纯债债券a怎么样」
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:村长住在十里村,授权转载发布。各位村民好,我是村长。7月5日-7月9日,东方甄选开启了甘肃文化、旅游、带货之旅,并且在东方甄选...
日期:07-06
Intel 13代酷睿国行价格公布!有的涨400、有的降100「国内酷睿十代降价计划」
Intel今天正式发布了Raptor Lake 13代酷睿处理器、Z790主板芯片组,国行价格也已公开。13代酷睿首发还是六款K、KF系列无锁频版本,具体价格如下——- i5-13600KF:2499元- i5-13600...
日期:10-11
Eclipse Theia 1.0 正式发布:云端和桌面 IDE 框架,支持 Visual Studio Code 扩展
  Eclipse 基金会于近日推出 Eclipse Theia 1.0 稳定版,并宣称其为 Visual Studio Code 的真正开源替代方案(a True Open Source Alternative to Visual Studio Code)。Th...
日期:04-03
叮当猫原名叫什么「太突然!电竞选手“叮当猫”去世:一路走好」
7月24日晚,工作组发表声明:CF的职业选手eStar叮当猫去世。叮当猫微博发文:我们很悲伤也很遗憾地告知大家,我们亲密的伙伴、穿越火线职业选手叮当猫已经永远地离开了我们。我们在...
日期:07-25