您的位置:首页 > 互联网

英伟达的ai是世界第一吗?「AI的决定性时刻,英伟达“赢麻了”」

发布时间:2023-03-23 23:13:03  来源:互联网     背景:


出品|虎嗅科技组

作者|齐健

编辑|陈伊凡

头图|英伟达

“切勿错过AI的决定性时刻!”这是英伟达2023年GTC大会的广告语。不知英伟达所说的“决定性时刻”是指黄仁勋在GTC大会主题演讲中三次强调的“AI的iPhone时刻”,还是说本届GTC大会就是AI的“决定性”时刻。

当然,今时今日可能确实是AI的决定性时刻。

从上周三到现在,一系列或惊艳,或不那么惊艳的最前沿AI技术接二连三地刷爆科技新闻版面。从OpenAI发布GPT-4,到百度发布文心一言,再到微软发布Office的AI助手Microsoft 365 Copilot,以及Midjourney发布能“画手指”的V5版本,甚至几个小时前,谷歌也上线了Bard聊天机器人接受排队测试。

在这样的AI关键时刻,手握GPU算力技术的英伟达自然不会缺席,毕竟在大模型军备竞赛中,作为“军火商”的英伟达,已经赢了。

北京时间3月21日晚11点,2023春季GTC大会正式上线,在大会的主题演讲中,黄仁勋围绕AI、量子计算、芯片等前沿科技,发布了一系列前沿技术和产品。


ChatGPT专用GPU可提速10倍

围绕AI的发布自然少不了GPU的提速,在黄仁勋的主题演讲中发布了全新的GPU推理平台,该平台包括4种不同配置,针对不同工作负载进行优化,分别对应了AI视频加速、图像生成加速、大型语言模型(LLM)加速和推荐系统和LLM数据库。包括:L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超级芯片。


其中,H100 NVL是专门为LLM设计的GPU,采用了Transformer加速解决方案,可用于处理ChatGPT。相比于英伟达HGX A100,一台搭载四对H100和双NVLINK的标准服务器速度能快10倍,可以将大语言模型的处理成本降低一个数量级。此外,H100 NVL配备94GB HBM3显存的PCIe H100 GPU,采用双GPU NVLink,支持商用PCIe服务器轻松扩展。

L4是针对AI生成视频的通用GPU,用于加速AI视频,可以提供比CPU高120倍的性能,能效提升约99%。可以优化视频解码与转码、视频内容审核、视频通话等性能,一台8-GPU L4服务器可以取代100多台用于处理AI视频的双插槽CPU服务器。目前,英伟达GPU在AI视频生产技术供应商Runway的产品中已经提供了相应的技术支持。

长江存储闪存颗粒

英伟达ai技术

L40则是用于图像生成,针对2D、3D图像生成进行优化,并可以结合Omniverse,直接生成3D内容,甚至是元宇宙内容。该平台推理性能是英伟达的云推理GPU T4的10倍。

此外,Grace Hopper超级芯片是为推荐系统和大型语言模型AI数据库设计的。可用于图推荐模型、向量数据库和图神经网络。它可以通过900GB/s的高速一致性芯片到芯片接口连接英伟达Grace CPU和Hopper GPU。

计算光刻技术提速40倍

黄仁勋带来的另一项革命性技术,也关乎英伟达自身的产品研发,是一项聚焦先进芯片设计制造的技术——NVIDIA cuLitho的计算光刻库。

NVIDIA cuLitho计算光刻库可以通过计算技术大幅优化芯片制造流程,利用GPU技术实现计算光刻,可以使传统光刻技术提速40倍以上,为2nm及更先进芯片的生产提供助力。


事实上,英伟达的计算光刻库在研发过程中,已经与3家全球顶尖的芯片制造厂商开展了长达4年的合作。包括晶圆制造巨头台积电、光刻机制造商阿斯麦,以及EDA巨头新思科技,目前3家厂商均已开始将该技术引入芯片设计和制造流程。

“计算光刻是芯片设计和制造领域中最大的计算工作负载,每年消耗数百亿CPU小时。”黄仁勋介绍说,大型数据中心24x7全天候运行,以便创建用于光刻系统的掩膜板。这些数据中心是芯片制造商每年投资近2000亿美元的资本支出的一部分。

NVIDIA H100需要89块掩膜板,在CPU上运算时,处理单个掩膜板,当前需要2周时间。如果在GPU上运行cuLitho则只需8小时即可处理完一个掩膜板。黄仁勋说:“台积电可以通过在500个DGX H100系统上使用cuLitho加速,将功率从35MW降至5MW,替代用于计算光刻的40000台CPU服务器。”

GPU&量子计算

除了AI和芯片以外,英伟达还在研究另一项前沿科技——量子计算。

本次GTC上宣布的第一个全新产品就是与Quantum Machines合作的NVIDIA DGX Quantum。该产品结合了通用量子控制系统Quantum Machines OPX+和NVIDIA Grace Hopper超级芯片,这个平台可以为高性能和低延迟量子经典计算的研究人员提供了一种革命性的新架构。


谁买了马斯克的房子

据黄仁勋介绍,NVIDIA DGX Quantum是全球首个GPU加速的量子计算系统,可以实现GPU和量子处理单元(QPU)之间的亚微秒级延迟。这种组合使研究人员能够建立强大的应用,实现校准、控制、量子纠错和混合算法,将量子计算与最先进的经典计算相结合。

DGX Quantum还为开发人员配备了统一软件栈,混合GPU-Quantum编程模型NVIDIA CUDA Quantum,能够在同一系统中整合和编程QPU、GPU和CPU,是一个混合型量子经典计算平台。目前,CUDA Quantum已经开放了源代码,为开发者提供了更多的支持。

AI超级计算上云

本次GTC的另一个重头戏是云。

英伟达发布的DGX Cloud云服务,提供了专用的NVIDIA DGX AI超级计算集群,搭配NVIDIA AI软件,使每个企业都可以使用简单的网络浏览器访问AI超算,消除了获取、部署和管理本地基础设施的复杂性。

该服务目前已经与Microsoft Azure、Google GCP和Oracle OCI开展合作。每个DGX Cloud实例都具有八个H100或A100 80GB Tensor Core GPU,每个节点共有640GB GPU内存。


使用NVIDIA Networking构建的高性能、低延迟结构,可以确保工作负载跨互连系统集群扩展,允许多个实例充当一个巨大的GPU,以满足高级AI训练的性能要求。

目前,英伟达开放的首个NVIDIA DGX Cloud,是与Oracle Cloud Infrastructure(OCI)合作的云服务。用户可以租用DGX Cloud的月租为36999美元起。

AI工厂智制造

除了算力以外,英伟达还想要通过云服务,把制造大模型的能力交给更多的用户。

黄仁勋带来的另一项关于云的重磅发布是NVIDIA AI Foundations,旨在为用户提供定制化的LLM和生成式AI解决方案。该服务包括语言模型NEMO、视觉模型PICASSO和生物学模型BIONEMO。


其中,NEMO是用于自然语言文本的生成式模型,可以提供80亿、430亿、5300亿参数的模型,且会定期更新额外的训练数据,可以帮助企业为客服、企业搜索、聊天机器人、市场分析等场景定制生产生成式AI模型。

PICASSO则用于制作视觉模型,可以用于训练包括图像、视频和3D应用的生成式AI模型。PICASSO可以通过高文本提示和元数据用DGX Cloud上的模型创造AI模型。目前英伟达已经与Shutterstock合作,开发了Edify-3D生成式AI模型。

本次GTC英伟达还着重关注生物制药领域。BIONEMO是专门为用户提供创建、微调、提供自定义模型的平台,包括AlphaFold、ESMFold、OpenFold等蛋白质预测模型。生物圈的热门方向是利用生成式AI发现疾病靶因、设计新分子或蛋白类药物等。

此外,英伟达还与Adobe合作,将生成式AI融入营销人员和创意人士的日常工作流程,并开展了对于艺术家版权保护的工作。

有人将GPU在深度学习方面的成功比作是中了技术的彩票,但黄仁勋并不这么认为。他曾多次表示自己在10年前就已经看到了AI行业的发展潜力,以及GPU对AI的决定性作用。英伟达正是看好这点,才孤注一掷地投入力量开发更适合AI的GPU产品。

OpenAI在2018年推出的GPT-1,只有1.2亿参数量,而最后一个公布了参数量的GPT-3则有1750亿,虽然有一些专家认为ChatGPT和GPT-4的参数量有可能更小,但业界多数的声音认为,更强大的模型就意为这更大的参数规模,且要消耗更多的算力。

OpenAI已公布的信息显示,在训练上一代的GPT-3时,使用了数千个NVIDIA V100 GPU。

调研机构TrendForce在一份报告中提到,GPT-3训练时大概用到了20000个NVIDIA A100 GPU左右的算力,而ChatGPT商业化后所需的GPU数量将达到30000个以上。

某AI芯片专家告诉虎嗅,目前OpenAI公布的技术细节不多,前期的训练又都是在英伟达的显卡上做的。“这给了英伟达更多针对Transformer的GPU实验数据,从一定程度上造成了英伟达对ChatGPT和GPT-4的技术垄断,从市场竞争的角度说,对其他AI芯片很不利。”

英伟达ai芯片

事实上,谷歌此前曾推出过针对TenserFlow的TPU产品,然而,英伟达此次发布的GPU推理平台针对时下火热的GPT大模型,进行了Transformer架构优化,则似乎又领先了谷歌一步。


返回网站首页

本文评论
爱普生将于2026年停止销售激光打印机_爱普生打印机最新上市
DoNews11 月 25 日消息,日前,爱普生宣布将于 2026 年停止销售激光打印机,该公司将把重心放在自身擅长的耗电量低的喷墨式产品上。据悉,喷墨方式耗电量可比激光方式降低 8 成左右...
日期:11-27
掌阅《絮集》创新内容项目联合中国移动发起“笔尖下的5G故事”
  2月初,掌阅携手中国移动共创“笔尖下的5G故事”,此次活动是由掌阅2021年全年主推的创新项目之一《絮集》发起,围绕《我们,江湖未有期》、《婆娑行》、《青萍》三本书展开“...
日期:07-16
上海迪士尼:重启握手拥抱合影 游客可近距离互动「上海迪士尼组队」
3月6日 消息:上海迪士尼度假区宣布,根据相关指导意见和全球迪士尼乐园的成功经验,将逐步恢复与迪士尼朋友的近距离互动。游客可以与喜爱的迪士尼朋友亲切互动,签名和进餐体验也...
日期:03-06
官方揭秘中国空间站:13年前秘密启动!至少用10年
2022年,中国完成了空间站的在轨建造,转入应用阶段,取得了举世瞩目的航天成就。新年到来之际,中国载人航天官方刊文,回顾了我国空间站的研制、建造进展过程。据介绍,中国天宫空间站...
日期:01-18
iPhone 6被苹果列为“过时产品”_现在用苹果6过时吗
今天一早,苹果官方的最新过时设备名单中,出现了iPhone 6系列,当列入到此名单中,就意味着用户无法从苹果或其服务提供商那里获得任何硬件服务,用户手中的手机坏了只能找第三方店铺...
日期:10-04
百度健康疫情指数:我国2~3个月后或将出现疫情高峰「全国疫情新进展,全国疫情指数」
步入十二月,随着“新十条”重磅发布,我国的疫情形势可能会如何发展?疫情峰值大概出现在什么时段?百度健康医典结合百度搜索大数据和百度指数,预测后续流行趋势。根据预测,在“放开...
日期:12-18
网友高喊真我GT Neo5 2599元!徐起:我劝你善良
今日消息,有网友在realme副总裁徐起微博下喊8+256售价2599”,徐起回复:我劝你善良。马斯克 推特ceo据悉,真我GT Neo5有240W和150W两种版本,240W版本配备4600mAh电池,150W版本配备5...
日期:02-03
华为中兴考虑重返利比亚通讯市场参与重建项目_华为收购中兴通讯
  利比亚前领导人卡扎菲的死亡宣告这个北非国家将翻开新的篇章,目前就中国企业应该何时回到这一盛产石油的国家,多方焦点争议不断。《人民日报》日前报道称,华为和中兴通讯...
日期:07-24
周鸿祎否认360不能卸载:繁琐卸载过程是为了防止黑客(卸载360会有影响吗)
IT之家8 月 9 日消息,8 月 5 日,新东方创始人俞敏洪在《老俞闲话》节目中对话 360 集团创始人、董事长周鸿祎,俞敏洪问周鸿祎:“怎么用 360 卸载 360?”周鸿祎表示 360 不能自己...
日期:08-10
抖音电商新增客服主动“催拍催付”功能 有频次限定_催单话术抖音
2月21日 消息:近日,抖音小店IM客服系统飞鸽系统新增了客服“催拍催付”功能。飞鸽提供催拍催付功能,商家客服可在回答完用户问题后,选择用户感兴趣的商品,使用“邀请下单”,针对...
日期:02-22
打破版权桎梏 斗鱼二季度重回盈利轨道_斗鱼上半年营收
8月15日,斗鱼发布了2022年第二季度财报。报告期内,斗鱼实现营收18.33亿元,非美国通用会计准则下的净利润为2350万元,同比扭亏为盈。   对斗鱼而言,二季度的财务表现至关重要,面...
日期:08-19
微念全资入股山外山文化公司  后者成立于2021年
2月9日 消息:近日,企查查APP显示,杭州山外山文化发展有限公司发生了工商变更,股东由周秋群、章静变更为杭州微念品牌管理有限公司,持股比例为100%。据了解,该公司成立于2021年6月...
日期:02-09
摩拜单车改为美团单车_摩拜单车已全面接入美团APP  未来将更名为美团单车
  1月23日消息,美团联合创始人、高级副总裁王慧文发布内部信,宣布摩拜已全面接入美团APP,摩拜单车将成为美团LBS平台单车事业部,由他本人兼任事业部总经理。   王慧文在内...
日期:08-10
相伴20载,新一代数据中心首次换新标
  2019年10月9日,IDC圈华南地区的佼佼者——新一代数据中心(GZIDC)正式更换企业LOGO,以全新面貌展示企业新形象。   新一代数据中心于2000年成立,凭借优秀的运营团队、...
日期:05-02
世界杯烧钱「谁在靠世界杯搞钱?」
声明:本文来自于微信公众号深燃(shenrancaijing),作者 | 邹帅,编辑 | 唐亚华,授权转载发布。长城汽车对保定的贡献今年的世界杯频频爆冷,夺冠热门阿根廷一球之差输给沙特,日本二比...
日期:11-29
愚人节诈骗电话版本_愚人节防骗手册待查收,小心“整蛊玩笑”变电信网络诈骗
  一年一度的愚人节到了,朋友同事之间开启了“整人”较量。愚人节是从19世纪开始在西方兴起流行的民间节日,在这一天人们以各种方式互相欺骗和捉弄,往往在玩笑的最后才揭穿...
日期:07-14
拼多多Q2在线营销服务和其他业务营收251.727亿元,同比增长39%_快看 | 拼多多第二季度营收72.9亿元,月活用户数3.66亿
  讯 北京时间8月29日晚间消息,拼多多(Nasdaq:PDD)今日发布了截至6月30日的2022年第二季度财报。财报显示,拼多多第二季度总营收为314.396亿元(约46.938亿美元),与上年同期的230....
日期:09-05
英特尔披露下一代安腾处理器Poulson新功能
8月22日消息,据国外媒体报道,英特尔在斯坦福大学举行的热芯片会议上发布了即将推出的代号为“Poulson”的安腾处理器的新架构特点。这些新特点包括英特尔指令重放技术、改进...
日期:07-22
全汉推出全球首款 SFX 12VO 750W 电源:24pin 变为 10pin,有效降低待机功耗
  11 月 26 日消息,根据全汉官方的消息,全汉企业推出全球首发 SFX 12VO 电源供应器 FSP750-27SCB,官方称其可让 PC 系统符合 2021 年 7 月 1 日美国加州能效法规所公告的 CE...
日期:07-17
微软Viva月度活跃用户超千万(viva 微软)
  2 月 7 日消息,微软推出集成在 Microsoft Teams 中的员工工作体验平台 Viva 已经一年了,该公司刚刚分享了该服务背后的一些新数字。   微软现在说,Viva 现在有 1000 万...
日期:01-07