您的位置:首页 > 互联网

月之暗面怎么打「月之暗面撞上算力墙?」

发布时间:2024-05-07 17:58:40  来源:互联网     背景:

声明:本文来自微信公众号“字母榜”(ID:wujicaijing),作者:赵晋杰,,授权转载发布。

“不好意思,刚刚和Kimi聊的人太多了。Kimi有点累了,可以晚点再问我一遍。”近期正在赶毕业论文的娄晓彤,时不时仍会收到AI助手Kimi无法使用的提示。

作为大模型初创公司月之暗面旗下的To C应用,自3月份更新成为国内首个支持200万字上下文的大模型产品后,Kimi爆火出圈,QuestMobile数据显示,Kimi 应用月活用户量在3月份飙升至589.7万,但算力焦虑也随之而来。即便距产品更新已经过去一个多月,娄晓彤的遭遇仍在部分用户身上逐一上演。

月之暗面向字母榜解释称,“其实是因为每天都有相对的高峰期和低谷期,高峰期可能会遇到(类似娄晓彤的)情况。”

每次产品更新,对大模型公司而言都是一次流量和算力的双重考验。在3月18日宣布支持200万字上下文后,彼时Kimi便遭遇一次大规模宕机:从3月21日开始,Kimi APP和小程序被爆均无法正常使用。月之暗面随后发布情况说明,“观测到Kimi的系统流量持续异常增高,流量增加的趋势远超对资源的预期规划。”

理论上,Kimi等AI助手可以支持的用户量几乎没有上限,只要大模型公司能够提供源源不断的算力供给,但这背后涉及的却是一个现实的效率平衡问题,在商业化尚未走向闭环的当下,这也是一众大模型产品的共同难题:配置冗余算力,难免带来部分时间段内的资源浪费;配置紧张算力,则不可避免会在高峰期内影响用户体验。

尚需投资储备算力资源的月之暗面,在近期被爆出创始人杨植麟通过售出个人持股已套现数千万美元消息后,更是一时间引发诸多猜测。

同样困在商业变现中的OpenAI,为了尽可能追求效率平衡,在免费版ChatGPT之外,特意设计出了付费版ChatGPT Plus。高峰时段,ChatGPT Plus用户将享有优先使用权,可以获得更迅速的服务响应。

但随着用户规模暴涨,自去年2月推出付费版以来,OpenAI曾几度暂停ChatGPT Plus新用户注册,给出的理由是“需求量过大”,导致算力资源出现缺口。

大模型产品的规模效应和网络效应仍处在市场潜伏期。这也使得部分投资人开始对大模型产品去魅,典型代表如金沙江创投主管合伙人朱啸虎,其在接受腾讯科技采访中表示,从2023年下半年开始,自己便决定不再和美国同事开原定每周一次的远程例行会议,探讨两边大模型产业格局变化,“打了半年我不打了,没有意义。”相比期待大模型产品在未来某一时刻迎来“iPhone时刻”,朱啸虎更在意当下能马上变现的To B应用。

资本市场对大模型商业化的担忧更是进一步体现在刚刚发布财报的Meta身上。“即使将我们的许多现有资源转移到人工智能上,在我们从这些新产品中获得大量收入之前,我们仍然需要扩大我们的投资范围……这将是一个持续多年的投资周期。”扎克伯格宣告扩大对AI投资话音落地,当地时间4月25日,Meta股价盘后应声下跌超10%。

对于Kimi这类缺乏自身造血能力的大模型创业公司而言,相比Meta,其面临的挑战只多不少:在这场效率平衡游戏中,它们宛如行走在悬于空中的钢丝绳上的杂技演员,投资款便是平衡木,到达对岸的唯一路径,便是在投资款耗尽之前,找到能够自我造血的商业模式。

A

春节期间,娄晓彤被身边同学安利了Kimi,当时Kimi支持的上下文长度只有20万字。加上彼时还未出圈,在日常使用中,娄晓彤基本没遇过无法使用情况。

随着Kimi将上下文长度扩展到200万字,并通过在资本市场上衍生出Kimi概念股火速出圈,从3月中旬开始,娄晓彤遭遇Kimi提示“有点累了”的情况,逐渐多了起来。

娄晓彤正在遭遇的算力紧张,从Kimi诞生后便已是注定的局面。去年3月创立月之暗面后,杨植麟便定下了做产品的两大思路:只做To C,且坚持长文本路线。

图源:月之暗面官网截图

文本长度和算力成本之间不可调和的矛盾,以及To C和高额营销成本之间的取舍,成为摆在杨植麟面前的两重平衡难题。

3月份Kimi借助支持200万字上下文出圈后,新浪科技曾报道称,Kimi用户获客成本达到12元-13元,其每天获客成本超过20万元。

大模型耗钱也早在杨植麟预料之中。“它需要人才聚集、资本聚集。”杨植麟形容道。

短短一年多时间内,月之暗面已经拿下近百亿人民币投资:2023年,月之暗面完成两轮总计近20亿人民币投资;今年2月份,月之暗面完成新一轮10亿美元融资,由阿里巴巴领投,红杉中国、小红书、美团等机构跟投,投后估值超过25亿美元。

近百亿融资款,更多都被用以支付算力资源。据市界报道,新一轮10亿美元融资款中,领投方阿里出资的8亿美元并非全是现金,其中部分将以阿里云提供的算力结算。

这方面行业早有惯例。更早之前微软百亿美元投资OpenAI,其中大部分投资款便是以微软云服务提供的算力资源结算。在微软参投之前,OpenAI其实是从谷歌云服务采购算力资源。如此一来,微软投出去的钱,大部分又以云服务的方式流了回来。

更重要的是,微软还借此完成了股价飙升,总市值不仅突破3万亿美元,更是超越苹果,成为全球市值最高上市公司。

亚马逊随后便来了个有样学样。今年3月底,亚马逊正式完成对OpenAI最强对手Anthropic40亿美元的投资。与OpenAI一样,Anthropic也需要选择亚马逊作为其主要云服务商。

B

因算力资源而导致服务中断的现象,不只发生在Kimi一家身上,包括文心一言、ChatGPT等,都曾出现过无法正常使用的情况。

据字母榜不完全统计,每次产品更新升级的节点,便是大模型产品可能迎接“崩盘”命运的开始。

去年4月份,ChatGPT付费版本推出2个月后,ChatGPT Plus被爆暂停新用户注册,OpenAI给出的理由是“需求量过大”,导致算力资源出现缺口。付费通道恢复正常后,OpenAI再次收紧GPT-4的互动次数,从每4小时100条消息降为每3小时25条消息。

7个月后的2023年11月,OpenAI在首届开发者大会上带来一系列产品更新:全新GPT-4Turbo、自定义GPT以及上线GPT商店。在大会结束后的短短两天内,ChatGPT服务器再次崩溃:用户数量的激增又一次超过了OpenAI的算力容量。

月之暗面在榜时间

作为OpenAI CEO的山姆·奥特曼都不得不亲自下场致歉,称新功能的热度远远超出了公司预期。“由于负载的原因,短期内可能会出现服务不稳定的情况,对不起。”

最近一次“崩盘”发生在4月份。为了再次降低使用门槛,扩大用户量,在全球185个国家/地区累积超1亿每周用户量后,OpenAI宣布用户无需注册账户就可以使用ChatGPT,“我们正在逐步推出这一功能,目的是让任何对其功能感兴趣的人都可以使用人工智能。”

月之暗面在榜时间

华为p50是徕卡吗

rtx3080 699美元

在OpenAI还没来得及将上述新功能扩散到全球所有地区时,社交媒体上已经陆续有用户反馈,自己在与ChatGPT互动时又被提示“系统错误”了。

除了采购更多算力资源来提升用户体验之外,一众大模型公司也在想方设法通过降低算力成本来满足更多用户需求。

截至4月份,国内文心大模型推理性能被爆提升了105倍,推理成本降到了原来的1%。这意味着,客户原来一天调用1万次,同样成本现在可以调用100万次。

国外OpenAI的奥特曼,更是在近期接受采访时预言,“我们(OpenAI)可以将非常高质量的AI技术成本降至接近零……如果我们没有制造足够的计算资源、供应和需求失衡,或计算成本攀升,这将导致AI成本非常高。”在奥特曼看来,未来AI技术成本将会变得越来越便宜。

C

使用更高效的硬件,便是推动AI技术成本降低的直接手段。

几乎在奥特曼预测AI技术成本将变得越来越便宜的同一时期,英伟达创始人黄仁勋又来给OpenAI送芯片,这次是量产最强一代的全球第一台Nvidia DGX H200超级计算机。OpenAI总裁格雷格·布罗克曼还特意晒出了自己、奥特曼与黄仁勋的三人大合照。

但对于已经无法获得英伟达最强芯片的中国大模型公司而言,借助人才优化算法以减少算力需求,则是另一条降低AI技术成本的路径。

4月23日,界面新闻爆出杨植麟通过售出个人持股已套现数千万美元消息后,月之暗面随即对外回应称“消息不实”,并向媒体发来了一则招聘文章说明,里面重点提到,为了吸引并留住最优秀的人才,月之暗面推出全新员工激励计划,为优秀人才提供匹配其贡献的丰厚回报。“从今年开始,我们将在公司取得重要进展时发起员工期权回购计划,确保团队成员能够分享公司发展的果实(2024年底启动首次期权回购计划)。每年定期根据工作表现进行调薪和期权增发,确保薪酬和期权充分反映出员工个人的成长和贡献。”

由此,外界也猜测杨植麟团队此次套现,其中或许便包括对重要人才的贡献奖励。

在公司创立伊始,杨植麟给出的早期招人画像便是专注找对口的genius(天才)。“公司上限是由人的上限决定的……之前有对模型动手术的能力,有训练超大规模模型直接的经验,就可以很快做出来。包括Kimi发布,资本效率和组织效率其实很高。”

与国内相比,硅谷AI人才之争,更为疯狂。马斯克本人都不得不感慨:“这是我见过最疯狂的人才大战。”为了避免特斯拉人才外流,马斯克旗下的大模型公司xAI开出了不少offer。

电动车充电充值不可退余额

扎克伯格更是亲力亲为,通过个人电子邮件给谷歌DeepMind团队成员发去邀请,希望他们能加入Meta与他共事。谷歌创始人谢尔盖·布林,为了挽留即将离职转投OpenAI的员工,也同样选择亲自出马,给员工加薪加福利。

人才大战之下,根据薪资数据网站 Levels.fyi数据,硅谷机器学习和AI工程师的薪酬中位数已经接近40万美元,OpenAI总薪资中位数甚至高达92.5万美元(包括期权)。

尽管为争夺AI人才,科技巨头开支增加,但他们的一系列疯狂举动已经在股价上迎来正反馈:2024年刚过完4个月,Meta股价年内已经大涨22%,谷歌大涨19%,亚马逊大涨19%。

参考资料:

微软收购案例

《ChatGPT 之父最新演讲:GPT-5聪明程度超乎想象,一大批 AI 初创公司的努力将变得毫无意义》APPSO

《黄仁勋亲自给OpenAI送货,全球首台DGX H200开箱了》机器之心

《如何评价月之暗面创始人杨植麟一年套现数千万美金事件?》钛媒体

《月之暗面创始人杨植麟套现数千万美金》界面新闻

《月之暗面杨植麟复盘大模型创业这一年:向延绵而未知的雪山前进》腾讯科技

月之暗面在榜时间

《Kimi创始人套现4000万美元疑云》市界


返回网站首页

本文评论
vivo Y36m亮相中国电信网站 或为合约机 售价1499元起_vivo合约机有哪些
近日,vivo在国内推出了一款新型智能手机Y36m。根据报道,该手机的售价为1499元人民币,并配备6GB RAM和128GB存储空间。除此之外,vivo还推出了更高配版的Y36m,售价为1799元人民币。...
日期:11-14
小米SU7行车支持快捷录制紧急时刻:鸣笛保存太方便_小米行车记录仪快捷指令
快科技5月2日消息,日前,小米汽车发布最新小米SU7答网友问,回答了米家多功能强光手电筒如何安装及拆卸、快捷保存行车记录紧急瞬间等问题。据了解,小米SU7在行车过程中支持快捷保...
日期:05-02
奇富科技与360智脑合作 推动大模型在金融行业应用「奇富昌科技有限公司」
8月10日 消息:奇富科技与360智脑达成战略合作,加速完善金融行业大模型。双方将通过奇富 GPT 与360智脑的算法、算力、数据融合,优化奇富 GPT 并扩大其在金融业务中的应用场景...
日期:08-10
外资风投寻退出新途径 中国企业赴美上市陷低谷_美资企业撤离中国
  海外市场做空中国概念股的风波至今依然未能平息。出于对市场环境的担忧,不少中国公司将其赴美上市计划搁浅。7月份中国企业在美IPO数量为零,降入冰点。   在此背景之下...
日期:07-22
iQOO Neo7首发天玑8200:12月2日发布 已上架_iqoo搭载天玑820
iQOO Neo7已经官宣首发天玑8200芯片,发布日期已经定在了12月2日,目前该机已经上架,此前Redmi K60也称要首发这颗芯片,此次也是被vivo抢先了,天玑8200集于台积电4nm工艺制程打造,最...
日期:11-28
iPhone 14 Pro再现重大BUG:充电会自动重启_iphone12充电自动重启
近日,网络爆料显示,iPhone 14 Pro再次出现重大BUG,有部分用户称,自己的iPhone 14 Pro在通过MagSafe或Lightning充电时,会毫无征兆的出现间歇性重启。而且从目前来看在iOS16.0.1系...
日期:10-06
编辑部的一己之见「编辑部与“文心一言”的首次亲密接触」
【】千呼万唤,全村的希望,“文心一言”终于可以用了!编辑部的小伙伴抢先对“文心一言”进行了轮番拷问(亲切友好的交流)。“文心一言”的答题水平如何呢?不多言,自己看。索尼游戏公...
日期:10-06
《王者荣耀》全面开放抖音直播 张大仙COS“黑历史”高渐离庆祝_王者荣耀张大仙的直播
快科技1月20日消息,今晚24点,《王者荣耀》正式全面开放抖音直播。库克的苹果为了庆祝这一历史性时刻,《王者荣耀》主播张大仙今天晒出了COS高渐离的视频。其配文:该我上场表演了...
日期:01-20
苹果2015pro「iPhone 15 Pro Max曝光:配置强悍极了」
iPhone 15 Pro Max的核心数据提前曝光,消息称,iPhone 15 Pro Max将采用台积电3nm制程工艺的A17处理器,内存容量为8GB LPDDR5,相比上一代的4nm A16(6核3.46GHz)匹配6GB LPDDR5,性能...
日期:05-29
麻省理工推出AI工具PhotoGuard 对抗生成式AI模型
8月1日 消息:近年来,大型扩散模型,如 DALL-E 2 和 Stable Diffusion,因其生成高质量、逼真的图像以及执行各种图像合成和编辑任务的能力而受到认可。oppo和vivo自拍但是,人们对...
日期:08-01
Meta AI意外成功,助小扎爬出元宇宙大坑!却被曝对FAIR毫不知情
新智元报道编辑:润 alan【新智元导读】2021年劈柴恭喜小扎FAIR在取得的突破时,小扎并不知道到底发生了什么,但快速的学习能力让他重新把Meta从泥潭中拉了出来。无心插柳的FAIR...
日期:01-20
理想汽车纯电车型「理想首款纯电车型MEGA来了: 11月17日开启盲订 12月发布」
快科技11月5日消息,据微博博主透露,理想旗下首款纯电车型将在今年11月17日的广州车展上开启盲定。 而正式上市时间则与此前透露的消息一样,MEGA的上市发布会依旧会在今年的1...
日期:11-05
京东众筹:10月10日起将暂停运营_京东众筹成立时间
10月8日 消息:近日,京东众筹发布公告称,10月10日起将暂停运营。印度CPU据悉,京东众筹于2014年7月1日上线,是京东金融旗下的一个互联网众筹平台,为用户提供智能科技、生活美食、智...
日期:10-11
莹润护唇 晶透花色 Little Ondine小奥汀花心唇蜜全新上市_保修期内苹果11内屏碎了
12 月,Little Ondine小奥汀延续经典人气花心系列设计及理念,将灵动花色融入晶透唇蜜,惊喜推出全新花心唇蜜系列彩妆产品。产品特别添加花萃精华成分,莹润双唇的同时打造剔透氛围...
日期:12-27
史上最强手机SoC!A17 PRO处理器背后揭秘:苹果果然留了一手「a17处理器是多少」
快科技9月13日消息,伴随着iPhone 15 Pro的发布,苹果A系列全新处理器正式与大家见面。这一次命名很有意思,不叫A17 Bionic,而是叫A17 PRO。这也是苹果首次以PRO来命名处手机芯片,...
日期:09-14
董宇辉称已在北京买房:向俞敏洪借了钱 不会忘记恩情_董宇辉演讲
快科技12月19日消息,小作文事件后,董宇辉昨晚重回东方甄选直播间,与俞敏洪一同直播,在线观众一度高达380万人,人气第一名。直播中,董宇辉透露,自己已经在北京买了房,而且买房的钱是...
日期:12-19
英美等国联合发布《AI系统开发指引》,号称全球首份相关安全标准
通信世界网消息(CWW)美国网络安全兼基础架构安全管理署(CISA)及英国国家网络安全中心(NCSC)日前正式发布《安全 AI 系统开发指引》(Guidelines for Secure AI System Development)白...
日期:12-06
Stable Diffusion教学:怎么制作角色设定图
今天要来讲的,是如何使用Stable Diffusion来制作角色设定图。在一两个月之前,要制作角色设定图这种多面向且高度一致的人物图,除了用Textual Inversion或者LoRA之外,还有用Contr...
日期:04-24
最后一代带光驱的macbook「苹果最后一款带光驱的MacBook停产:停止发售超7年」
快科技2月1日消息,据媒体报道,苹果最近更新的全球停产产品名单中,新增了MacBook Pro(13英寸,2012年中)这款产品,是苹果公司销售的最后一款内置CD/DVD光驱的Mac。这款13英寸MacBook...
日期:02-01
配6.1英寸刘海屏!iPhone SE 4曝光「刘海屏的iPhone」
据Macrumors报道,根据显示器供应链顾问(DSCC)分析师Ross Young的说法,第四代iPhone SE将配备6.1英寸LCD显示屏,并在显示屏顶部有一个“刘海”。Ross Young表示,他已经修改了对第四...
日期:10-15