您的位置:首页 > 互联网

老黄深夜炸场,AIGC进入iPhone时刻!Hugging Face接入最强超算,神秘显卡胜过A100

发布时间:2023-08-09 13:13:34  来源:互联网     背景:

编辑总结:英伟达在 SIGGRAPH 会议上推出了一系列重磅更新,包括下一代 GH200 超级芯片平台、RTX 工作站、OVX 服务器等。GH200 平台具有连接多个 GPU 的能力,能处理复杂的生成式工作负载。RTX 工作站推出了四款新品,包括性能最强的 RTX6000。OVX 服务器搭载 L40S GPU,性能超过 A100。此外,英伟达还发布了 AI Workbench 和 ChatUSD 等工具,提供定制生成式 AI 应用的支持。同时,Hugging Face 接入英伟达超算,加速 AI 模型的训练和微调。

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】昨天深夜,重返SIGGRAPH舞台的老黄,再次给全世界带来了「亿点点」震撼。

生成式AI的时代已经来临,属于它的iPhone时刻到了!

就在8月8日,英伟达CEO黄仁勋,再次登上了世界顶级计算机图形学会议SIGGRAPH的舞台。

一系列重磅更新接踵而至——下一代GH200超级芯片平台、AI Workbench、OpenUSD……

而英伟达也借此将过去数十年的所有创新,比如人工智能、虚拟世界、加速、模拟、协作等等,一举融合到一起。

在这个LLM大爆炸的时代,老黄依然敢大胆放话:「买得越多,省得越多!」

英伟达最强AI超算再升级

在5年前的SIGGRAPH上,英伟达通过将人工智能和实时光线追踪技术引入GPU,重新定义了计算机图形学。

老黄表示:「当我们通过AI重新定义计算机图形学时,我们也在为AI重新定义GPU。」

随之而来的,便是日益强大的计算系统。比如,集成了8个GPU并拥有1万亿个晶体管的NVIDIA HGX H100。

显卡,英伟达,RTX40

就在今天,老黄再次让AI计算上了一个台阶——

除了为NVIDIA GH200Grace Hopper配备更加先进的HBM3e内存外,下一代GH200超级芯片平台还将具有连接多个GPU的能力,从而实现卓越的性能和易于扩展的服务器设计。

而这个拥有多种配置的全新平台,将能够处理世界上最复杂的生成式工作负载,包括大语言模型、推荐系统和向量数据库等等。

比如,双核心方案就包括一台配备了144个Arm Neoverse核心并搭载了282GB HBM3e内存的服务器,可以提供8petaflops的AI算力。

其中,全新的HBM3e内存要比当前的HBM3快了50%。而10TB/sec的组合带宽,也使得新平台可以运行比上一版本大3.5倍的模型,同时通过3倍更快的内存带宽提高性能。

据悉,该产品预计将在2024年第二季度推出。

RTX工作站:绝佳刀法,4款显卡齐上新

苹果ipad新品发布会一般在几月

这次老黄的桌面AI工作站GPU系列也全面上新,一口气推出了4款新品:RTX6000、RTX5000、RTX4500和RTX4000。

如果H100以及配套的产品线展示的是英伟达GPU性能的天际线的话,针对桌面和数据中心推出的这几款产品,则是老黄对成本敏感客户秀出的绝佳「刀法」。

在发布这新GPU的时候,现场还出现了一个意外的小花絮。

老黄从后台拿出第一块GPU的时候,似乎不小心在镜面面板上沾了指纹。

老黄发现后觉得可能是自己搞砸了,就很不好意思地和现场观众说对不起,表示这次产品发布可能是有史以来最差的一次。

看来就算开发布会熟练如老黄,也会有翻车的时刻。

而如此可爱的老黄,也惹得在场观众不断发笑。

言归正传,作为旗舰级专业卡,RTX6000的性能参数毫无疑问是4款新品中最强的。

凭借着48GB的显存,18176个CUDA核心,568个Tensor核心,142个RT核心,和高达960GB/s的带宽,它可谓是一骑绝尘。

图片

RTX5000配备了32GB显存,12800个CUDA核心,400个Tensor核心,100个RT核心。

图片

RTX4500配备了24GB显存,7680个CUDA核心,240个Tensor核心,60个RT核心。

图片

RTX4000配备了20GB显存,6144个CUDA核心,192个Tensor核心,48个RT核心。

图片

基于新发布的4张新的GPU,针对企业客户,老黄还准备一套一站式解决方案—— RTX Workstation。

图片

支持最多4张RTX6000GPU,可以在15小时内完成8.6亿token的GPT3-40B的微调。

还能让Stable Diffusion XL每分钟生成40张图片,比4090快5倍。

OVX服务器:搭载L40S,性能小胜A100

而专为搭建数据中心而设计的NVIDIA L40S GPU,性能就更加爆炸了。

基于Ada Lovelace架构的L40S,配备有48GB的GDDR6显存和846GB/s的带宽。

在第四代Tensor核心和FP8Transformer引擎的加持下,可以提供超过1.45petaflops的张量处理能力。

对于算力要求较高的任务,L40S的18,176个CUDA核心可以提供近5倍于A100的单精度浮点(FP32)性能,从而加速复杂计算和数据密集型分析。

此外,为了支持如实时渲染、产品设计和3D内容创建等专业视觉处理工作,英伟达还为L40S 还配备了142个第三代RT核心,可以提供212teraflops的光线追踪性能。

图片

对于具有数十亿参数和多种模态的生成式AI工作负载,L40S相较于老前辈A100可实现高达1.2倍的推理性能提升,以及高达1.7倍的训练性能提升。

图片

在L40S GPU的加持下,老黄又针对数据中心市场,推出了最多可搭载8张L40S的OVX服务器。

图片

对于拥有8.6亿token的GPT3-40B模型,OVX服务器只需7个小时就能完成微调。

对于Stable Diffusion XL模型,则可实现每分钟80张的图像生成。

AI Workbench:加速定制生成式AI应用

除了各种强大的硬件之外,老黄还重磅发布了全新的NVIDIA AI Workbench,来帮助开发和部署生成式AI模型。

概括来说,AI Workbench为开发者提供了一个统一且易于使用的工具包,能够快速在PC或工作站上创建、测试和微调模型,并无缝扩展到几乎任何数据中心、公有云或NVIDIA DGX Cloud上。

图片

具体而言,AI Workbench的优势如下:

-易于使用

AI Workbench通过提供一个单一的平台来管理数据、模型和计算资源,简化了开发过程,支持跨机器和环境的协作。

- 集成AI开发工具和存储库

AI Workbench与GitHub、NVIDIA NGC、Hugging Face等服务集成,开发者可以使用JupyterLab和VS Code等工具,并在不同平台和基础设施上进行开发。

- 增强协作

AI Workbench采用的是以项目为中心的架构,便于开发者进行自动化版本控制、容器管理和处理机密信息等复杂任务,同时也可以支持团队之间的协作。

- 访问加速计算资源

AI Workbench部署采用客户端-服务器模式。团队可以现在在本地计算资源上进行开发,然后在训练任务变得更大时切换到数据中心或云资源上。

图片

Stable Diffusion XL自定义图像生成

首先,打开AI Workbench并克隆一个存储库。

图片

接下来,在Jupyter Notebook中,从Hugging Face加载预训练的Stable Diffusion XL模型,并要求它生成一个「太空中的Toy Jensen」。

然而,根据输出的图像可以看出,模型并不知道Toy Jensen是谁。

图片

这时就可以通过DreamBooth,并使用8张Toy Jensen的图片对模型进行微调。

图片

最后,在用户界面上重新运行推理。

现在,知道了Toy Jensen是谁的模型,就可以生成切合需求的图像了。

图片

Hugging Face一键访问最强算力

作为最受AI开发者喜爱的平台之一,拥有200万用户、超25万个模型,以及5万个数据集的Hugging Face,这次也与英伟达成功达成了合作。

现在,开发者可以通过Hugging Face平台直接获得英伟达DGX Cloud AI超算的加持,从而更加高效地完成AI模型的训练和微调。

其中,每个DGX Cloud实例都配备有8个H100或A10080GB GPU,每个节点共有640GB显存,可满足顶级AI工作负载的性能要求。

此外,英伟达还将联合Hugging Face推出全新的「Training Cluster as a Service」服务,简化企业创建和定制生成式AI模型的过程。

图片

对此,老黄激动得表示:「这次,Hugging Face和英伟达将世界上最大的AI社区与全球领先的云AI计算平台真正地连接在了一起。Hugging Face的用户只需点击一下,即可访问英伟达的最强AI算力。」

AI Enterprise4.0:定制企业级生成式AI

为了进一步加速生成式AI的应用,英伟达也将其企业级平台NVIDIAAI Enterprise升级到了4.0版本。

目前,AI Enterprise4.0不仅可以为企业提供生成式AI所需的工具,同时还提供了生产部署所需的安全性和API稳定性。

- NVIDIA NeMo

一个用于构建、定制和部署大语言模型的云原生框架。借助NeMo,英伟达AI Enterprise可以为创建和定制大语言模型应用提供了端到端的支持。

- NVIDIA Triton管理服务

帮助企业进行自动化和优化生产部署,使其在Kubernetes中能够自动部署多个推理服务器实例,并通过模型协调实现可扩展A 的高效运行。

- NVIDIA Base Command Manager Essentials集群管理软件

帮助企业在数据中心、多云和混合云环境中最大化AI服务器的性能和利用率。

除了英伟达自己,AI Enterprise4.0还将集成到给其他的合作伙伴,比如Google Cloud和Microsoft Azure等。

此外,MLOps提供商,包括Azure Machine Learning、ClearML、Domino Data Lab、Run:AI和Weights & Biases,也将与英伟达AI平台进行无缝集成,从而简化生成式AI模型的开发。

Omniverse:在元宇宙中加入大语言模型

最后,是NVIDIA Omniverse平台的更新。

在接入了OpenUSD和AIGC工具之后,开发者可以更加轻松地生成模拟真实世界的3D场景和图形。

图片

就像它的名字一样,Omniverse的定位是一个集合了各种工具的3D图形制作协作平台。

图片

3D开发者可以像文字编辑们在飞书或者钉钉中一样,在Omniverse上共同制作3D图形和场景。

而且可以将不同的3D制作工具制作出来的成果直接整合在Omniverse之内,将3D图形和场景的制作工作流彻底打通,化繁为简。

OpenUSD

而这次更新中,接入的OpenUSD是什么东西?

图片

OpenUSD(Universal Scene Description)提供了一个开源,通用的场景描述格式,使不同品牌、不同类型的3D设计软件可以无障碍的协作。

Omnivers本身就是建立在USD体系之上的,这次Omniverse针对OpenUSD的升级,使得Omniverse能为开发者,企业推出了更多的框架和资源服务。

图片

基于OpenUSD这个开源的3D图像编辑格式,5家公司(苹果,皮克斯,Adobe,Autodesk,英伟达)成立了AOUSD联盟,进一步推动了3D图像业界采用OpenUSD格式。

而且,借助AOUSD联盟的成立,Omniverse的开发者也可以方便的创建各种兼容于苹果的ARKit或者是RealityKit的素材和内容,更新后Omniverse也支持OpenXR的标准,使得Omniverse能够支持HTC VIVE,Magic Leap,Vajio等VR头显设备。

API,ChatUSD和其他更新

此外,英伟达还发布了新的Omniverse Cloud API,让开发者可以更加无缝地部署OpenUSD管线和应用程序。

图片

而最引人瞩目的,就是支持基于大语言模型的ChatUSD的支持。

图片

基于大语言模型技术的ChatUSD能像Github Copilot一样,在Omniverse平台中回答开发者的相关问题,或者自动生成Python-USD的代码,让开发人员效率暴增。

总而言之,英伟达再次用暴力的产品,令人惊叹的技术,高瞻远瞩的洞见,让全世界再次看到,它未来将如何引领世界AI和图形计算的新浪潮。

在老黄的经典名言「the more you buy,the more you save!」中,老黄缓缓走下舞台,却把现场气氛推向了最高潮。


返回网站首页

本文评论
美股周五:纳指实现六连涨,热门中概股多数上涨,阿里涨逾3%_美股三大指数集体收涨,中概股普遍大涨
美国时间周五,美股收盘主要股指全线上涨,纳指实现连续第六个交易日上涨。投资者关注多家华尔街大银行发布的第四季度财报,以及最新的消费者信心和通胀预期数据。道琼斯指数收于...
日期:01-14
美团联合苏宁易购:近3000个SKU商品最快30分钟外卖送达
10 月 21 日消息,今日,美团闪购对外宣布,与苏宁易购正式达成战略合作。截至目前,首批 175 城市 600 余家苏宁易购门店已入驻美团。后续,双方还将继续深化合作,计划在 2023 年入驻...
日期:10-26
微信视频号是实时更新吗_重磅更新:微信视频号支持发布长达 1 小时的视频
  9 月 7 日消息 微信的视频号在上线之初,只支持发布 1 分钟以内的视频,后来,无论是移动端还是 PC 端,发布超过 1 分钟的视频需要选择“1 分钟”或者“完整视频”,之后的更新...
日期:07-17
双屏远控双屏,向日葵远程控制功能升级「向日葵远程控制两个屏幕」
远程控制电脑如何控制双屏?以往远控这种多屏设备,需要在主控端时常切换主副屏,非常不方便。尤其是想要把一个窗口从主屏拖拽到副屏时,非常麻烦。现在使用向日葵多屏远控就变得方...
日期:05-30
iphone128g升级到256g多少钱「苹果iPhone 14太能吸金 128G升级256GB赚走90%利润」
在智能手机行业,苹果是标杆性的存在,虽然全球销量干不过三星,只能位居第二,然而他们一家就能赚走整个行业大部分利润,吸金能力爆表,苹果对赚钱的算计几乎体现在每个细节上,比如升级...
日期:10-02
国家级出行平台“强国交通”完成内测即将上线「大国出行APP」
1月19日 消息:据证券时报报道,国内首个国家级交通出行平台“强国交通”近日完成内测即将上线。目前“约车”服务已开通运营测试,已接入数十家网约车运力公司,未来预计接入运力...
日期:01-19
家教机防雷指南:讯飞智能学习机对比步步高家教机S5 Pro(科大讯飞和步步高家教机的区别)
  今年对于很多学生和家长来说,是紧张焦灼的一年,因为疫情的影响,本该今年6月参加高考的考生将考期延长一个月,这是高考史上鲜有出现的情况。也给更多家长打了一个预防针——...
日期:07-14
淘宝“闪电发货”升级  充值1小时未到账可获额外赔付_淘宝退货闪电到账
6月1日起,淘宝网将升级消费者保障计划中“虚拟物品闪电发货”服务,消费者购买带有闪电发货标志的消保商品,如果付款1小时后仍未充值到账,可在随后到账或退款的基础上,获得额外赔...
日期:07-29
小米上半年少卖2500万台手机,让雷军焦虑的不止于此「小米除了雷军啥都卖」
如果说2021年手机行业可以概括为“华为跌倒,小米猛跑”,那么2022年上半年的小米财报,说的就是“荣耀起跑,小米摔倒”的故事。 作者丨林夏淅 编辑丨刘肖迎 在雷军8月11日晚的年...
日期:09-20
华为新折叠屏手机曝光:本月发布 仅6000多元「华为折叠屏新款上市手机」
“华为P50 Pocket new”手机又传来新消息,新版的折叠屏手机将在本月发布,而价格方面也有惊喜,开售到手只要6000多元,还有赠品并且货源充足。红米k50的配置怎么通知员工打新冠疫...
日期:10-14
2021年首个台风「今年登陆我国的首个台风要来了!命名“泰利” 最强可达14级」
据中央气象台最新预报,南海热带低压已于今天上午加强为今年第4号台风泰利”(英文名:Talim,名字来源:菲律宾,意义:尖锐或锋利的意思)。预计泰利”未来还将迅速增强,最强可达强台风级(14...
日期:07-16
360校园行走过半个中国 义诊上万台电脑
  “360校园行‘电脑义诊’活动开始半个月,走遍了半个中国,已经维修的电脑数量超过一万台,效果好到我们自己都想不到。”360校园行活动负责人兴奋地说。   原来,自12月8日...
日期:07-25
每日优鲜 倒闭「每日优鲜拖欠272万服务费被起诉」
  天眼查App显示,近日,广东省深圳市南山区人民法院向北京每日优鲜电子商务有限公司等5家每日优鲜公司公告送达合同纠纷案件起诉状副本、开庭传票等。公告详情显示,原告深圳市...
日期:10-02
美团两天蒸发4052亿_美团大跌后腾讯辟谣清仓,今年已遭沈南鹏8次减持
作者:陆涵之;;责编:宁佳彦   8月16日,有消息称,腾讯控股(00700.HK)将出售美团(03690.HK)股票,对此腾讯集团市场与公关部总经理张军进行了辟谣。今日港股,包括美团在内的腾讯系股票均...
日期:08-17
淘宝商城双11单日33.6亿 497品牌店单日销售过百万_淘宝双11订单量
  11月11日晚零时,一年一度的淘宝商城光棍节活动拉开帷幕。官方数据显示,上午10点09分,交易额跨过10亿,超过了去年光棍节同样由淘宝商城创下的单日9.36亿的交易记录。最终,淘...
日期:07-24
中国科大成功研发新型量子机器学习技术:实现数据特征提取(量子科技研究(以及其他科技前沿成果))
  8 月 24 日消息 据中国科学技术大学官方微博,中国科学技术大学成功研发新型量子机器学习技术,实现数据特征提取。   中国科学技术大学中国科学院微观磁共振重点实验室...
日期:07-17
瑞典快时尚品牌zara前两年_瑞典快时尚品牌H&M天猫旗舰店恢复
近日,瑞典快时尚品牌H&M天猫旗舰店恢复,消费者搜索全称“HM官方旗舰店”可获得旗舰店入口。华硕proart创16评测视频极米h3s安装app金山手机安全卫士官网华为鲲鹏生态创新中心...
日期:08-16
天猫回应罗永浩入驻淘宝直播:双11有很多新主播加入「罗永浩淘宝直播叫什么」
10 月 20 日讯:针对“罗永浩入驻淘宝直播”一事,天猫方面回应,“今年双11,天猫有很多新主播、新商家和新品牌加入,这让双 11 更丰富、更有乐趣。”iphone6销售量iphone12pro max...
日期:10-21
余承东已用上华为新机 明晚正式发布「华为余承东最新消息」
中关村在线消息:有网友发现,目前华为常务董事余承东的“微博小尾巴”已经换成了HUAWEI Pocket S,该机将与一系列全场景新品一同于11月2日晚19:00的发布会上正式发布。苹果太空...
日期:11-10
特福莱誉为青年创业投资者首选品牌(福莱特主营业务)
  什么行业最有发展潜力?什么创业项目最具亮点?哪些项目最适合青年人创业?答案就在身边。生活水平提高了,个性化的服务需求就增加;崇尚以人为本的观念,各类生活顾问就有了市场...
日期:07-29