您的位置:首页 > 互联网

云算力官网「云算力之外,一场始于AI的秘密战争」

发布时间:2023-05-30 12:07:13  来源:互联网     背景:

声明:本文来自于微信公众号解码Decode(ID:kankeji001),作者:解码工作室,授权转载发布。

今年3月,面对汹涌而来的AI潮,“硅谷刀王”一改往日本色,主动站到台前,宣布推出DGX云,把AI专用的GPU放到云上「出租」。

以往,出售算力这种事都是云计算公司在干。它们购买多种型号显卡与人工智能加速器,根据硬件性能或使用时长等方式定价,然后租给下游客户。

这个过程中,英伟达将GPU要么卖给云计算平台,要么直接出售给AI公司,比如第一台NVIDIA DGX超级计算机就是2016年老黄亲自交付给OpenAI的,并没有直接出售算力,顶多算「卖铲人」。

而DGX上云这个事,虽然英伟达仍需要将其托管到云平台,但本质上已经是跨越边界了。

一向屈居幕后的英伟达,这次为何要走向台前?

本轮AI潮英伟达毫无疑问是最大的受益者,甚至可以没有之一。

用于训练AI的GPU芯片价格疯长,海外A100和H100的每片价格分别涨到了1.5万美元和4万美元,国内一台配置8颗A100和80G存储空间的AI服务器,价格也从去年中旬的8万/台飙升至当前的165万/台。

但这些钱并没有都流入英伟达的口袋,溢价都被渠道拿走了,关键是这种倒买倒卖英伟达还一点办法没有。

DGX云就在这种情况下应运而生,关键价格看似还很便宜。配备8个H100GPU模组的DGX云,每月套餐费只要3.7万美元,相当于单片H100的价格。

云算力官方

对于急需算力资金又捉襟见肘的AI公司来说,DGX云无疑是渴睡时天降的一个枕头;对英伟达而言,出售云算力既能赚钱又绑定了客户。

而看似双赢的背后,却隐藏着一场始于AI的秘密战争。

1

算力平权

从产业特点看,今天基于云算力的AIGC和曾经的加密资产挖矿极其相似,但需要的资源远高于后者。

国盛证券曾在《Web3视角下的AIGC算力进化论》中,比较了加密资产挖矿和AIGC产业的异同点:

1AIGC产业耗电量大约会在1.6-7.5年间超过当前比特币挖矿产业耗电量,主要驱动因素是GPT类大语言模型在模型参数、日活和模型数量上的高速增长;

2和比特币挖矿类似,AIGC产业由算力驱动的内容处于高强度竞争中,参与者只有持续、快速生产出高质量内容,才能保证自己获取到的用户注意力不会下降。

这就导致AIGC产业的两大特点:高成本和持续性。

其中,成本侧不止是耗电量,当然耗电量可以作为一个非常直观的证据。比如百度用于训练推理文心一言的阳泉超算中心,每小时耗电64000kW·h(度),按照0.45元/kW·h的商业用电标准,一年电费就达到2.5亿。

而更大的成本则是来自算力投入。

以ChatGPT为例,不考虑与日活高度相关推理过程所需的算力,仅考虑训练过程,根据测算,1750亿参数的GPT-3训练一次大约需要6000张英伟达A100显卡,如果考虑互联损失,大约需要上万张A100。

云算力官方

按单张A100芯片10万计算,大规模训练就需要投入约10亿,一般厂商根本承担不起。而GPT-4的模型参数更大,训练的标识符更多,所需算力更为可观。

并且,随着更多AIGC大模型的发布,其所需算力直线狂飙。

根据OpenAI测算,自2012年至2018年,用于训练AI所需要的算力大约每隔3-4个月翻倍,总共增长了30万倍(而摩尔定律在相同时间只有7倍的增长), 每年头部训练模型所需算力增长幅度高达10倍,整体呈现指数级上涨。

云算力什么意思

这个时候就体现出云算力的优势了,总结下来可以归结为8个字:化整为零,按需付费。

云算力能让AIGC大模型厂商无需购买英伟达A100显卡等硬件,而直接按需租用云算力平台提供的算力,这使得初创企业或非头部模型厂商也能尝试进入AIGC领域。

甚至这种“化整为零”的方式,对产业链各方都有益处:

1)对上游算力生产商而言,在算力硬件进入淡季、库存趋增时,能通过售卖云算力的方式,平滑收入的波动,并为旺季储备“有生”力量,及时满足回弹的市场需求;

2)对中游云服务厂商而言,则有助于增加客流;

3) 对下游算力需求方而言,能最大化降低使用算力的门槛,驱动全民AIGC 时代降临。

如果AIGC大模型厂商愿意让渡更多资源,还可以更深入地与云平台合作。这方面的典型案例是微软云与OpenAI的合作,两者的合作没有停留在算力租用上,而深入到了股权与产品的融合。

另外,在大模型竞赛中,除了显性的硬件投入成本,还有一个隐形的时间成本。

一般而言,大模型对于算力的需求分为两个阶段,一是训练出类ChatGPT大模型的过程;二是将这个模型商业化的推理过程。

而且这个过程越持续大模型就越好。所以现在再来看英伟达DGX云,就不难搞懂老黄干了一件什么事。

我国首次发射三颗卫星

用云的方式把用于AI训练的GPU价格打下来,算力平权笼络中小公司,再基于大模型训练的持续性因素绑定客户,“硅谷刀王”一举两得。

小米平板miui6

2

受益的未必是英伟达

从去年12月开始,英伟达A100的价格5个月累计涨幅达到37.5%,同期A800价格累计涨幅也达到了20.0%。

GPU价格暴涨无疑增加了AIGC训练大模型的门槛,但对于头部厂商而言,涨多少价GPU都是要买的。但对于腰部公司来说,不涨价可能咬咬牙还能下单,一涨价就只能望GPU兴叹了,王慧文创业拿到的5000万美金融资,可能连训练所需的显卡都买不全。

所以,老黄在这个时候拿出DGX云,就像开了一家豪车租赁公司,让买不起的人也能租用。

当然,这背后英伟达的另一层考量,即抢在竞争对手前面,绑定更多的中小客户。

本轮AI热潮中除OpenAI外,最出圈的AI公司非Midjourney和Authropic莫属了。前者是一款AI绘图应用,最近同QQ频道合作开启了国内业务,后者的创始人则是出自OpenAI,其对话机器人Claude直接对标ChatGPT。

这两家公司有一个相同点,就是都没有购买英伟达GPU搭建超算,而是使用Google的算力服务。

该服务由一个集成4096块TPU v4的超算系统提供,重点是Google自研。

另外一家搞自研芯片的巨头是本轮AI浪潮的引领者微软,传闻这款名叫Athena的芯片采用5nm先进制程,由台积电代工,研发团队人数已经接近300人。

很明显,这款芯片目标就是替代昂贵的A100/H100,给OpenAI提供算力引擎,并最终一定会通过微软的Azure云服务来抢夺英伟达的蛋糕。

除了云计算公司的背刺,英伟达的大客户特斯拉也要自己单干。

2021年8月,马斯克就向外界展示了用3000块自家D1芯片搭建的超算Dojo ExaPOD。其中D1芯片由台积电代工,采用7nm工艺,3000块D1芯片直接让Dojo成为全球第五大算力规模的计算机。

相较之下,受禁令影响的国内公司虽也有替代计划,但短期内仍严重依赖英伟达。

国产芯片可以做对信息颗粒度要求没有那么高的云端推理工作,但大多目前无法处理超高算力需求的云端训练。

燧原科技、壁仞科技、天数智芯、寒武纪等公司都推出了自己的云端产品,且理论性能指标不弱。

据此前曝光的信息,百度用于训练推理文心一言的阳泉超算中心,除了A100还用了一些国产化的产品,比如百度自研的昆仑芯和寒武纪的思元590,其中有消息显示2023年采购计划思元大概占10%-20%。

其中,文心一言的芯片层核心能力来自昆仑芯2代AI芯片,其采用自研XPU-R架构、7nm工艺和GDDR6高速显存,通用性和性能显著提升;具有256TOPS@INT8和128TFLOPS@FP16的算力水平,较一代提升2-3倍。

今年3月,李彦宏也在亚布力中国企业家论坛上分享,昆仑芯片现在很适合做大模型的推理,将来会适合做训练。

3

尾声

从RIVA128开始,英伟达就展示了自己惊人的市场观察能力。过去的十几年里,从加密货币挖矿到元宇宙,再到AI潮,英伟达顺势将显卡的客户从游戏玩家拓展到了科技巨头。

伴随着战火蔓延,英伟达市值也一路高歌,从一个二线芯片公司变成了全行业的No.1。只是,黄仁勋说AI的iPhone时刻已到来,那么诺基亚都被苹果打败,英伟达又怎能是无敌的呢。


返回网站首页

本文评论
华为Atlas 900 AI集群获GSMA GLOMO未来技术大奖
  [英国,伦敦,2020年2月25日] 今日,GSMA宣布华为Atlas 900 AI集群荣获Global Mobile Awards 2020 (GLOMO奖项)未来技术大奖。经过权威评委团的严格评审,Atlas 900凭借其全球...
日期:04-24
2023年央视春晚直播收视率达20.23%:1.79亿人用竖屏观看_2020央视春晚收视率最高的节目
1月21日晚20:00,中央广播电视总台《2023年春节联欢晚会》如约而至,据央视新闻消息,据初步统计,截至1月21日24时,2023年央视春晚电视端直播平均收视率达20.23%。新媒体直播用户规...
日期:01-22
企业微信「今天,第一批公司都开始向企微交费了」
声明:本文来自于微信公众号见实(ID:jianshishijie),作者:见实,授权转载发布。今天,一家公司告诉见实,他们向企业微信交纳了4万多元的“外部联系人规模”费用——或是业界俗称的私...
日期:05-09
微软Windows 8将预装杀毒软件_windows8自带杀毒软件在哪里
  微软在Build 2011开发者大会表示,Windows 8操作系统将会配备防病毒软件出货,消费者不需要另外下载或购买新的杀毒软件,就可以对电脑进行保护。   微软表示,Windows 8操作...
日期:07-23
kpl成都ag和深圳dyg回放_KPL顶级战队DYG落户深圳 电竞主场化征程扬帆
  2021年1月23日,腾讯电竞2021天美电竞项目计划发布会在深圳华润大厦艺术中心举行。斗鱼旗下DYG电子竞技俱乐部宣布将正式落户深圳市南山区,并更名为“深圳DYG电子竞技俱乐...
日期:06-16
百度腾讯推自家手机 国内巨头热衷移动互联(百度和腾讯合作)
据经济之声《天下公司》报道,国内业界巨头们对于移动互联网表现出了非常浓厚的兴趣,百度推出了集成自家特色服务的“易”平台,并且计划和戴尔合作于11月推出百度“易”手机。...
日期:07-22
iphone13pro免税价格「iPhone14 Plus免税版开售:才便宜200元?」
iPhone 14 Plus终于开售,不过6999元的价格却偏贵,使得开售就破发。目前海南免税店的iPhone 14 Plus也开售,但低配版只比官网便宜209元。根据海南免税店发布的消息,iPhone 14 Plu...
日期:10-11
高德地图版本更新 正式上线路灯导航和小路提示
1月16日消息,近日,高德地图迎来版本更新,针对日常骑行和步行较多的用户提供了重要升级,正式上线路灯导航和小路提示。oppo翻盖折叠屏格力电器2023年营收6000亿mac book pro怎么...
日期:01-16
美媒都看不下去了:特朗普“围剿华为”是个严重错误_特朗普大乌龙!华为躺枪
  [摘要]对华为的围剿会让全球各地无辜的企业——其中包括华为的美国供货商——可能损失业务、面临破产或要承担极高的额外成本。引发盟友的不满,而中国只会加倍在国内生...
日期:08-06
谷歌将在明年初推出Go语言首个正式版本1.0(go语言 版本)
  谷歌两年前发布了Go工具及其开放资源,现在正计划未来几个月对Go语言进行完善,在明年年初推出首个正式版本Go 1.0,并将其推向Google App Engine。Go是一种计算机语言,其设计...
日期:07-24
全球it公司排行_全球10大增长速度最快的IT服务公司 当当网居首
  北京时间2月27日消息,据国外媒体报道,美国金融信息网站今天撰文,评选出截至2月26日的全球10大增长速度最快的IT服务公司,评选依据是华尔街分析师对各公司长期年度每股利润...
日期:07-26
马斯克脑机接口公司研究内幕曝光:杀死1500只动物 遭美国调查_马斯克人脑接口新闻
凤凰网科技讯 北京时间12月6日消息,外媒看到的文件以及熟悉调查和公司运营的知情人士透露,埃隆马斯克(Elon Musk)的脑机接口Neuralink因为涉嫌侵犯动物福利正在接受美国联邦部...
日期:12-08
准入门槛被抬高 第三方支付开打并购战
  昨日,支付宝宣布收购安卡支付。随着第二批第三方支付牌照的落地,多家获牌企业已经开始布局抢占市场先机,或是收购,或是结盟。第三方支付的进入门槛也已迅速抬高。   第二...
日期:07-22
捍卫隐私  360隐私保护器用户增至3500万(360隐私保护器手机版)
  最近,电脑网络的安全事件层出不穷,不少网民都担心某天自己电脑上的私密信息被传到网上,隐私保护工具受到青睐。据了解,在360隐私保护器发布后的短短时间内,用户数量已经猛增...
日期:07-23
小米10青春版常程_小米10青春版常程设置
是小米公司于2020年6月发表的一款高性价比手机,目的在于打造年轻人的“闪亮生活”。这款手机主打年轻化,外观采用6.57英寸中心开孔全面屏设计,屏幕分辨率为2400×1080,支持HDR10...
日期:05-29
微软巨资收购Skype主意来自盖茨(微软收购Skype)
(晁晖)北京时间5月18日消息,据国外媒体报道,微软创始人、董事长 比尔·盖茨 (Bill Gates)表示,他建议公司收购互联网电话服务公司Skype,并敦促董事会其他成员支持这一建议。上周,...
日期:07-28
七牛云「金融 IT 基础设施数据元报送」应用助力金融业科技信息上报工作
  背景   为全面提升金融机构数字化转型,加强金融科技监管,保障金融科技领域的稳定健康发展,央行和银保监出台了一系列政策和措施。近期中国人民银行科技司发布了《中国人...
日期:07-16
iPhone 14 怎么买便宜,咱们比比价「苹果13出了买11划算吗」
iPhone 14 系列基础款和 Pro 款价格正在遭遇冰火两重天,很多小伙伴会私信小编问中关村村里是什么行情。那么咱们就来比比价,疯狂星期四的钱,帮你省出来。目前呢,iPhone 14 和 iP...
日期:10-14
Omdia观察:2022年全球电信资本支出发展趋势「全球电信市场规模」
2023/5/29 17:03 Omdia观察:2022年全球电信资本支出发展趋势  艾斯 C114讯 5月29日消息(艾斯)市场研究公司Omdia最近发布了其Global Telecoms Capex Tracker的2022年全年...
日期:05-30
新顶级域名开放 “.aigo”域名有望第一批顺利通过申请
  在新顶级域名提案正式获得批准之际,我国著名数码品牌“爱国者”的总裁冯军通过微博宣布,向ICANN(互联网名称与数字地址分配机构)申请品牌新顶级域名“.aigo”,这也是中国首...
日期:07-30