您的位置:首页 > 互联网

英伟达H100将在2024年之前售罄!推理GPU根本不够用,AI初创公司急了_英伟达v100 32g

发布时间:2023-08-11 16:24:23  来源:互联网     背景:


新智元报道

编辑:Aeneas

【新智元导读】据悉,英伟达H100 GPU在2024年之前基本已售罄。AI初创公司真的开始急了。

英伟达最好的芯片H100,在2024年之前就会售罄!

这一消息,让AI初创公司们开始揪心了。

现在,我们已经进入了一个GPU至上的时代。

英伟达的芯片,现在已经成为了科技行业最宝贵的资源。

无论是大厂还是初创企业,都在疯狂地把预算从其他项目转到AI项目上,对GPU的需求日益旺盛。

台积电:所有产品需求都降低了,除了英伟达的芯片

作为全球最大的合同芯片制造商,台积电在上个月公布收益时表示:现在几乎所有产品的需求都减弱了,唯一的一个例外,是AI芯片。


台积电为英伟达制造的图形处理单元GPU,主导着AI应用的半导体市场。

英伟达的高端H100 GPU非常适合训练AI模型、服务客户所需的并行式计算。而如今随着生成式AI的热潮,H100已经出现了大量短缺。

4月,GPU市场忽然紧俏起来

根据《巴伦周刊》的采访,CoreWeave的联合创始人兼首席技术官Brian Venturo表示,在今年第一季度,保证供应链中GPU的分配和容量还很容易。

英伟达dgx a100 价格


但是从4月开始,市场忽然变得异常紧张。交货时间甚至推迟到了年底。

而这种转变,发生在仅仅一周之内。

大型企业和人工智能实验室的GPU需求,忽然出现了猛增。

英伟达 v100s

C01车型

而英伟达最顶级的H100,在当前的环境下,甚至已经买不到了。

英伟达快垄断了?

为什么客户要求购买的是英伟达的AI芯片,而不是AMD和其他云供应商的产品呢?

表示,英伟达的护城河是双重的。

首先,在硬件方面,没有人像英伟达那样制造芯片。

其次,是在软件上。上市时间对于初创企业来说非常重要。如果用AMD或TPU(谷歌的张量处理单元)重装整个技术堆栈,就会耽误宝贵的时间,可能会让人失去潜在的市场机会。


英伟达在CUDA生态系统上投入如此之多,是非常有先见之明的。

可以说,他们现在基本上比要比其他人领先10年。

这不仅仅是英伟达花了10年做的工作,而且是他们的客户和开发者CUDA生态系统上(使用软件工具和库),利用了前人的工作。

短期内,没有谁能超越英伟达。

另外,使用谷歌的TPU的问题,被锁定在具有具体技术解决方案的供应商身上。

作为一家初创公司,这或许不是最佳选择。他们需要的是具有灵活性的供应商,可以让他们在多个地方获得同样的东西。


而英伟达的专有网络InfiniBand提供了当今最好的解决方案,以最大程度地减少延迟。许多其他产品不具备拥塞控制和功能,无法使工作负载发挥最佳性能。

而现在,AI初创公司都很担心:当他们取得商业成功时,或许无法拥有足够的GPU来让模型推理。

这种需求会让基础设施服务商兴奋,但是从初创公司战略的角度来讲,如何稳妥获取对算力的访问,几乎成了一种二元的风险业务。


英伟达GPU已陷短缺风暴

「谁将获得多少H100,何时获得H100,都是硅谷中最热门的话题。」

OpenAI联合创始人兼职科学家Andrej Karpathy近日也曾发文,阐述了自己对英伟达GPU短缺的看法。


近来,社区广为流传的一张图「我们需要多少张GPU」,引发了众多网友的讨论。


根据图中内容所示:

- GPT-4可能在大约10000-25000张A100上进行了训练

- Meta大约21000 A100- Tesla大约7000 A100

- Stability AI大约5000 A100

- Falcon-40B在384个A100上进行了训练

– Inflection使用了3500和H100,来训练与GPT-3.5能力相当的模型

另外,根据马斯克的说法,GPT-5可能需要30000-50000个H100。

此前,摩根士丹利曾表示GPT-5使用25000个GPU,自2月以来已经开始训练,不过Sam Altman之后澄清了GPT-5尚未进行训。

不过,Altman此前表示,

我们的GPU非常短缺,使用我们产品的人越少越好。 如果人们用的越少,我们会很开心,因为我们没有足够的GPU。


文章推测,小型和大型云提供商的大规模H100集群容量即将耗尽,H100的需求趋势至少会持续到2024年底。

总之,老黄是赢麻了。

参考资料:

https://twitter.com/firstadopter/status/1689606588506476545?s=46&t=iBppoR0Tk6jtBDcof0HHgg


返回网站首页

本文评论
智能科技与教育融合 猿辅导小猿学练机助力学生个性化学习「小猿讲课」
众所周知,教育智能硬件是依托移动互联网、大数据、人工智能、5G等技术,通过人机协同、软硬件一体化满足学习者个性学习需求的电子终端。其产品形态在近年来获得大发展,随着学生...
日期:07-05
联想g455配置_联想g45笔记本配置
联想G455是一款运行Windows 7操作系统的笔记本电脑,被广泛用于家庭、办公和学习等场合。它具有出色的性能、优秀的图形处理能力和良好的音频效果,是一款深受消费者欢迎的笔记...
日期:05-31
抗疫助农 云集助力海南菠萝1小时卖出80000斤
  眼看着田里的菠萝一天天成熟,海南万宁市的果农心急如焚。以往,这该是个丰收的季节,但因为疫情的影响,今年,菠萝无处可销,面临着滞销的难题。   但这两天,果农们可算松了一口...
日期:04-26
RTX 4080 12GB真实性能公布后:网友的吐槽更猛烈了
前不久NVIDIA发布三款RTX 40系显卡时,被网友评论中伤最深的当属RTX 4080 12GB。大家很难相信,有着x80之名的它,居然只配192bit位宽显存,这可是NV史上头一回。甚至出现一种质疑,RT...
日期:10-16
iOS 17升级方法看这 所有人都能升「苹果17.1更新」
iOS 17系统已经发布,内测beta版本已经正式开始推送,在今年的推送中引入了一个关于开发者测试版的重大改动,随后的iOS和iPadOS版本中,无法再通过安装描述文件的方式来体验新的测...
日期:06-08
YouTube力挺WebM视频格式 Flash遭受重创
  据国外媒体报道,YouTube今日宣布,所有新上传到其服务器上的视频都将被转换成WebM格式。YouTube此举对Adobe的Flash视频格式构成了沉重的打击。   WebM格式是由谷歌利用...
日期:07-27
《美猴王》发布剧照被吐槽丑 Netflix联合周星驰制作
《西游记》是我国四大名著之一,是陪伴每个人成长的经典之作。不仅有文字版本,各种影视作品也层出不穷。荣耀80 pro三体限定版早前,Netflix宣布与周星驰联合制作动画电影《美猴...
日期:04-28
极光Q1手机报告:OPPO销量份额连续三个季度下滑_oppo2020手机销量
  极光(Aurora Mobile, NASDAQ:JG)发布《2020年Q1智能手机行业季度数据研究报告》,从整体市场情况、5G手机专题、iPhone专题、安卓手机品牌忠诚度专题等多维度分析当前智...
日期:08-27
“突破封锁活了下来” 华为宣布实现ERP替换自主可控_华为erp系统案例分析
凤凰网科技讯 4月20日消息,华为宣布已实现自主可控的MetaERP研发,基于华为欧拉操作系统、GaussDB等根技术,并已完成对旧ERP系统的替换。ERP是最关键、最重要的企业级IT应用,2019...
日期:04-21
近2万字工作报告 丰修带你3分钟聚焦两会核心重点
  喜大普奔!人工智能又一次“登上“人民大会堂。这是李克强总理连续第三年在政府工作报告中提及人工智能产业发展,划重点部分来了——继”互联网+“之后,”智能+“成为新命...
日期:04-20
小米14相机「新自拍神器?曝小米14系列将配备4K录制前置镜头」
近日,海外博主Kartikey Singh透露,小米14系列将解决小米13系列在自拍和USB接口方面的短板。据他称,小米14系列将首次搭载可录制4K视频的前置摄像头以提升自拍体验,而且小米13 Ul...
日期:06-08
京东38节有活动吗「京东3·8节活动规则出炉 推重点玩法“买贵双倍赔”」
2月22日 消息:京麦商家中心发布了京东3·8节活动总则。今年京东3·8节将围绕重要玩法“买贵双倍赔”,以更高效的流量生态、更有效的营销推广和更简单的参与方式。下面一起来...
日期:03-01
驾驶员端实时显示每单抽成比例,交通运输部:网约车和道路货运新业态平台公司将向社会公开计价规则
  据央视新闻报道,今日,交通运输部举行新闻发布会,交通运输部运输服务司副司长王绣春表示,交通运输部将“实施交通运输新业态平台企业抽成‘阳光行动’”作为 2022 年更贴近...
日期:04-23
Unity宣布在华成立新合资公司,阿里巴巴、中国移动等入股
8月9日,Unity宣布已与合作伙伴达成协议并成立合资企业——Unity中国,阿里巴巴、中国移动、吉比特、米哈游、OPPO、佳都科技以及抖音集团等将参与投资该合资公司,Unity中国的投...
日期:08-11
微软人工智能 Bing Chat 聊天记录功能现已上线「微软的聊天机器人叫什么名字」
5月12日消息:Bing Chat 终于推出令用户最期待的功能——聊天记录。尽管最近几日科技界都在关注 Google I/O 和 Google Bard 的最新动态,Bing Chat 却悄悄地进行着自己的更新,...
日期:05-12
Adobe 特效工具 After Effects 已原生支持苹果 M1 系列芯片 Mac:启动速度提高 7 倍,渲染合成速度提高两倍
  Adobe 发布公告,旗下特效工具 After Effects(简称 AE)已原生支持苹果 M1 系列芯片 Mac。   Adobe 表示,与英特尔 10 核 iMac Pro 相比,M1 原生版本现在在 M1 Mac 上的...
日期:09-02
特斯拉员工贴吧「推特员工晒睡公司照片 马斯克:我曾在特斯拉工厂住三年」
此前,一名推特员工分享了一张似乎是他的老板在办公室地板上睡觉的照片。照片中,这家社交媒体巨头的产品管理总监埃斯特克劳福德戴着眼罩,裹在睡袋里,放在睡垫上。当地时间周五特...
日期:11-13
比亚迪大动作:部分新车将搭载交互式车载KTV「比亚迪车机k歌用哪个软件」
快科技8月7日消息,比亚迪宣布与音乐媒体科技公司Stingray达成合作。比亚迪计划从2023年起将在部分新能源汽车上搭载Stingray交互式车载KTV产品,并将面向全球多个市场推出,为用...
日期:08-08
马斯克:希望20年内在火星建造自给自足城市_火星什么时候能居住,马斯克
华为HMS全球应用创新大赛华硕无畏15轻薄本开学第一课哪个软件可以看直播oppo什么时候换电池便宜   特斯拉和SpaceX公司CEO埃隆·马斯克周末重申,他坚定不移地致力于殖民火...
日期:08-15
珍惜雷军还在台前的日子
  来源:AI蓝媒汇   作者/黑羊 杨蕾   编辑/魏晓   还是熟悉的慈眉善目,还是厚道的仙桃口音。   雷军又一次白T青衫、一丝不苟地站在舞台上,脸上的褶子越来越少,比202...
日期:08-12