您的位置:首页 > 智能设备

英伟达ai芯片gpu-h100「比英伟达H100快90%!最强大模型AI芯片来了,首搭141GB HBM3e」

发布时间:2023-11-27 18:46:23  来源:互联网     背景:

本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。



作者 | 程茜
编辑 | 心缘

抢购switch

谁是雅虎现任的ceo尔雅

智东西11月14日消息,昨日晚间,英伟达在国际超算大会SC23上宣布推出新一代AI计算平台NVIDIA HGX H200。

H200 GPU重点升级如下:

→跑70B Llama 2,推理速度比H100快90%;

→跑175B GPT-3,推理速度比H100快60%;

→首撘141GB HBM3e,是H100显存容量的近1.8倍;带宽4.8TB/s,是H100带宽的1.4倍;

→2024年第二季度发货。



▲H200完整参数表

需注意的是,虽然都是“200”,但与此前英伟达发布的GH200 Grace Hopper超级芯片不同,GH200是英伟达Grace CPU与H100 GPU的组合版,而H200是新一代GPU芯片,为大模型与生成式AI而设计,因此相比H100主要优化的是显存和带宽,算力则与H100基本持平。

agm手机5g

一、内置全球最快内存,大模型推理成本大降

HGX H200支持NVIDIA NVLink和NVSwitch高速互连,可支持超过1750亿参数规模模型的训练和推理,相比于H100,H200的性能提升了60%到90%。英伟达高性能计算和超大规模数据中心业务副总裁Ian Buck将其描述为“世界领先的AI计算平台”。



这也是首款内置全球最快内存HBM3e的GPU,英伟达的新闻稿写道,GPT-3的推理表现中,H100的性能比A100提高了11倍,H200 Tensor Core GPU的性能比A100提高到了18倍。

Buck称,英伟达将在未来几个月内继续增强H100和H200的性能,2024年发布的新一代旗舰AI芯片B100将继续突破性能与效率的极限。



英伟达推出新款ai芯片h200算力

在生成式AI基准测试中,H200 Tensor Core GPU每秒在Llama2-13B大型语言模型上每秒快速通过1.2万个tokens。





在HBM3e的助攻下,NVIDIA H200能以每秒4.8TB的速度提供141GB内存,与NVIDIA A100相比,容量几乎翻倍,且带宽增加了2.4倍。

二、兼容H100,明年第二季度开始供货

英伟达还展示了一个服务器平台,可以通过NVIDIA NVLink互连连接四个NVIDIA GH200 Grace Hopper超级芯片,其具有四路和八路配置。

其中,四路配置在单个计算节点中配备了多达288个Arm Neoverse内核和16PetaFLOPS的AI性能,以及高达2.3TB的高速内存。



八路配置的HGX H200提供超过32PetaFLOPS的FP8深度学习计算和1.1TB聚合高带宽内存,可在生成式AI和HPC应用中实现最高性能。

当与具有超快NVLink-C2C互连的NVIDIA Grace CPU配合使用时,H200还创建了带有HBM3e的GH200 Grace Hopper超级芯片,这是可以服务于大规模HPC和AI应用的集成模块。

这些服务器主板与HGX H100系统的硬件和软件兼容。它还可用于英伟达8月份发布的采用HBM3e的新一代NVIDIA GH200 Grace Hopper超级芯片中。

基于此,H200可以部署在各种类型的数据中心中,包括本地、云、混合云和边缘。包括华硕、戴尔科技、惠普等在内的英伟达全球生态系统合作伙伴服务器制造商也可以使用H200更新其现有系统。

H200将于2024年第二季度开始向全球系统制造商和云服务提供商供货。

除了AI算力和云服务公司CoreWeave、亚马逊无服务器计算服务Lambda和云平台Vultr之外,AWS、谷歌云、微软Azure和甲骨文云将从明年开始成为首批部署基于H200实例的云服务提供商。

三、全球TOP 500超算榜,基于英伟达技术的系统达379个

此外,基于10月英伟达发布的TensorRT-LLM开源库,英伟达GH200超级芯片的速度是双插槽x86 CPU系统的110倍,能效是x86 CPU + H100 GPU服务器的近2倍。



在全球TOP 500超算榜中,得益于由NVIDIA H100 Tensor Core GPU提供支持的新系统,英伟达在这些系统中提供了超过2.5ExaFLOPS的HPC性能,高于5月份排名中的1.6ExaFLOPS。

同时,新的全球TOP 500超算榜名单中包含了有史以来使用英伟达技术数量最多的系统为379个,而5月份的榜单中为372个,其中还包括了38台超级计算机。

英伟达加速计算平台还提供了强大的软件工具支持,能使开发人员和企业构建和加速从AI到HPC的生产就绪型应用程序,其中包括用于语音、推荐系统和超大规模推理等工作负载的NVIDIA AI Enterprise软件套件。

结语:围绕大模型核心痛点,剑指加速计算需求

英伟达推出新款ai芯片h200算力

生成式AI催生的大量加速计算需求仍然在不断增长,大模型开发和部署带来的算力需求也成为企业的核心痛点,性能更强的AI芯片仍然是当下大模型企业竞争的重点之一。

如今,英伟达再次围绕着生成式AI的开发和部署甩出了一系列硬件基础设施和软件工具,帮助企业突破大模型开发和部署的核心痛点,并且通过在数值、稀疏性、互联、内存带宽等方面的革新,不断巩固其在AI时代的霸主地位。


返回网站首页

本文评论
荣耀X40再预热:等效19GB智慧运存 256GB超大内存「荣耀x40是什么时间上市的」
  今晚19:30,荣耀秋季新品发布会将正式举办,届时全新的九年里程碑之作荣耀X40将闪亮登场。距离新品发布会开始还有数小时,荣耀手机官方再次对这款手机进行了预热,放出了官宣视...
日期:09-15
华为p50pro参数和配置「华为新款P50 Pocket爆料:或6000元左右 配骁龙778G」
  近年来,随着用户对屏幕的要求越来越高,而传统智能手机屏幕的增大已经接近极限,折叠屏手机成为了当前手机市场的新风向。在国内的折叠屏手机市场,华为可以称得上领跑者。近段...
日期:10-22
苹果专利解析「风向变了?苹果公布全新专利,网友:这是“割韭菜”的新招数吗?」
近日,苹果发布了一项新专利,和无线充电有关,可以给不同的无线充电器制造配件盒。事实上,在苹果被欧盟以及工信部多次“警告”要统一USB-C接口后,苹果就有了全面推进无线充电的计...
日期:03-24
小米civi1s哪个颜色好看「全系配色亮相,小米Civi 2“朦朦黑”版本外观公布」
  今日下午,小米手机官方正式公布了小米 Civi 2 全系配色外观,包括小白裙、怦怦粉、冰冰蓝、朦朦黑四款配色。这也是小米 Civi 2“朦朦黑”配色版本首次亮相。  此外,小米...
日期:10-02
售价高达999元 华为Mate 50 5G手机壳套装上架中国电信「最新华为mate50pro上市时间」
近日,中国电信上架华为Mate 50/50 Pro两款机型的5G手机壳套装,一共两款机型,四种规格可选,其中包含:Mate 50 8+256(6498元,单机身官网售价5499元)和8+512G(7498元,单机身官网售价6499...
日期:09-21
vivo最新款手机2022款折叠屏_vivo X Fold+折叠屏手机发布:升级骁龙8+ 售价9999元起
  新浪数码讯 9月26日晚间消息,智能手机品牌vivo召开线上发布会,正式推出新一代折叠屏手机vivo X Fold+。新机搭载高通骁龙8+定制SPU安全芯片,还进一步增强了产品的续航能力,...
日期:09-27
锤子骁龙855_锤子宣布8月20日发布新机:将搭载骁龙710!
  就在刚刚,锤子手机正式宣布,8月20日19:30在北京凯迪拉克中心(原五棵松体育馆)举行夏季新品发布会,而本次发布会的门票,将在今天下午13点于大麦网开始发售。  至于这次要发布...
日期:07-23
三星Galaxy S23 Ultra渲染图流出,或将配备2亿像素摄像头「三星s23 ultra被曝改动大吗」
  本文来自太平洋电脑网  近日@OnLeaks博主放出了三星GalaxyS23Ultra的渲染图,整体外观设计上与S22相比并没有太大区别。(图来源于网络)  据消息透露,三星将会淘汰从Galax...
日期:10-15
iOS 16键盘触感功能可提升打字手感,但苹果称可能会影响续航「ios 16键盘震动使用感受」
  iOS 16 为默认键盘引入了一个新的键盘触感功能。启用后,iPhone 在打字时每敲击一个键都会产生轻微的振动,提供按键被按下的物理确认,提升打字手感。该功能还是比较好用的,但...
日期:09-22
可穿戴设备兴起:盘点几款热门智能手表与手环_运动手环与智能手表
  【TechWeb报道】继笔记本、平板、智能手机风靡之后,IT业界的一个新的爆发点已经到来,这就是智能穿戴。现在,整个IT业界都在谈论可穿戴设备,但是到现在为止,还没有人能够真正...
日期:07-27
海盗船展示vengeance系列ddr5内存「海盗船统治者泰坦 DDR5 内存上架:DDR5-7200 16G*2,1849 元」
IT之家 9 月 30 日消息,海盗船日前发布的统治者泰坦 DDR5 内存现已上架京东,可选多种频率和容量规格。苹果13pro和小米11ultra哪个好DDR5-6000 16G*2:1449 元DDR5-6400 16G*2:15...
日期:10-01
华为Mate 50四款新机齐曝光:7.2寸巨屏机皇或回归_华为新款最大屏幕7.2
  既然iPhone 14是四款的话,那么华为Mate 50也是四款也不难吧,这样全方位对决是不是更直接一点呢?现在,网上又有消息称,华为可能会为Mate 50系列增加一款巨屏机皇,最终被冠以M...
日期:08-13
阿尔忒弥斯1号任务还未升空 NASA已敲定2.2亿美元宇航服合同「NASA的阿尔忒弥斯计划」
9月8日消息,当地时间周三,美国国家航空航天局(NASA)宣布,已确定由总部位于休斯顿的公理航天(Axiom Space)公司为阿尔忒弥斯3号任务制造登月宇航服。NASA预计于2025年或2026年开展...
日期:09-09
千元5G新机火爆热销中,真我V20轻薄和长续航兼得
  6月21日,真我realme千元5G新机——真我V20迎来热销。凭借国潮设计和敢越级的产品力,真我V20成为千元5G手机的新标杆,赢得众多用户的青睐,销量持续走高。oppo手机天玑1200NVM...
日期:07-19
近半数安卓用户考虑转投苹果:安全和隐私成主要原因
近日,信息安全服务公司Beyond Identy发起了一项调查,结果显示,有49%安卓用户正在考虑转而使用iPhone,手机的安全与隐私问题则是主要原因。   这项调查随机考察了1003名用户的...
日期:08-17
全新第12代英特尔酷睿标压处理器_消息称英特尔下一代消费级纯小核处理器代号为 Twin Lake
IT之家 9 月 3 日消息,据消息人士 @Raichu 爆料,英特尔下一代消费级纯小核处理器(即 Alder Lake-N 的继任者)代号为 Twin Lake。IT之家注:新一代 Alder Lake-N超低功耗移动平台处...
日期:09-03
15代酷睿什么时候发布_15代酷睿将采用Intel 3工艺 核显性能堪比RTX 3060
芯研所9月22日消息,代号为Arrow Lake的15代酷睿预计将于2024年面世,采用3D Foveros封装。CPU模块将会使用20A工艺,这是首款埃米级的CPU工艺,支持RibbonFET和PowerVia两项技术,每...
日期:09-23
微软产品布局「微软打响ChatGPT产品第一枪!微软CEO:执掌微软9年来的最大事件」
官宣!微软正式将 ChatGPT引入必应:“搜索引擎开启新时代” (来源:界面新闻) 2月8日消息,美国当地时间周二,微软宣布推出新版必应搜索引擎,并将...
日期:02-08
真我软件总监:下周公布realme UI 4.0适配“路线图”「realme UI2.0发布会」
  8月30日,真我手机官方正式宣布,realme UI 4.0将于9月发布,系统基础体验将迎来全面提升,全新的UI设计和智能交互体验。9月2日上午,realme软件总监陈雷透露了一些关于realme UI...
日期:09-03
支付宝苹果专区icloud50g领取活动_支付宝福利:苹果iCloud从5GB升级到50GB 免费4个月
苹果不同存储容量的机型差价很大,以iPhone 14 Pro为例,128GB版7999元,256GB版8899元,直接贵了900元。512GB版10699元,比256GB版又贵了1800元,这价格可以买一部不错的安卓手机了。...
日期:09-27