您的位置:首页 > 互联网

26岁华裔研究生「突破数据墙!27岁华裔MIT辍学创业8年,年化收入逼近10亿」

发布时间:2024-09-25 16:26:25  来源:互联网     背景:

声明:本文来自于微信公众号 新智元,作者:新智元,授权转载发布。

【新智元导读】震惊!就在刚刚,Scale AI创始人Alexandr Wang宣布:公司的年化收入已经达到近10亿美元。OpenAI的年收入,也仅仅是35-45亿美元。数据墙愈渐紧逼的今天,Scale AI早早踩对了风口,如今终于一飞冲天了。

就在刚刚,创业成功的27岁亿万富翁Alexandr Wang宣布——

Scale AI的年化收入,几乎达到了10亿美元!

这个数字,足够震惊整个硅谷的。

相比之下,OpenAI预估的年收入也只是35-45亿美元而已。再减去85亿美元的成本,OpenAI今年可能会血亏50亿。

这Scale AI是什么来头,能在营收上取得如此惊人的成绩?

原来,它主攻的就是如今AI模型的一大软肋——对数据的巨大需求。

我们正在进入LLM开发的第三阶段。

第一阶段是早期的试验,从Transformer到GPT-3

第二阶段是规模扩展

第三阶段是创新阶段:除了o1之外,还需要哪些突破性进展才能让我们达到新的proto-AGI范式

Scaling Law的存在意味着,随着模型变大,对数据的需求也呈现指数级增长,越来越多的人担心大模型会耗尽可用数据。

Scale AI的主营业务——做AI模型的数据工厂,恰好处于这个风口之上。

如果能攻克数据墙这个AI进步的巨大瓶颈,Alexandr Wang理所当然会赚得盆满钵满。

在AI浪潮中,赚得盆满钵满

生意能做这么大,源于Scale AI越做越成功的一项大业务。

在AI生态圈中,为大公司提供基础设施或服务支持的业务,市场需求巨大。

Scale AI做的就是后者——为这些公司提供人工数据标注员。帮AI公司提高LLM的准确性。Meta、谷歌等大公司,都是它的客户。

而且,今年Scale AI的生意越做越红火了。

跟去年同期相比,它今年上半年的销售额增长了近4倍,已经接近4亿美元。

可以肯定地说,Scale AI是从AI热潮中受益最多的私营企业之一。

投资者们当然也看到了这一点。

今年5月,Scale AI以138亿美元的估值,进行了新一轮融资。

投资者包括Accel、Founders Fund、Index Ventures、Thrive Capital和Greenoaks Capital等。

并且,除了亚马逊和Meta之外,Scale AI还吸引了各种各样的新投资者:思科、英特尔、AMD等风险投资部门参与其中,而且很多注资过的公司也回归了,包括英伟达、Coatue、Y Combinator等等。

就在近期,Wang手下的高管团队,再度进行了调整。

首席技术官Arun Murthy将离开公司,而去年离开风投公司Benchmark的前优步高管Jason Droege将加入公司担任首席战略官,直接向Wang汇报。

首席策略官Jason Droege解释自己为什么要加入Scale AI:这让我有机会参与到我一生中技术领域最根本的变革中

在Droege看来,Scale解决了人工智能中最困难的挑战之一:通过数据改进模型。做到这一点需要卓越的人才、复杂的运营和对AI未来发展的强烈愿景。虽然团队迄今已经取得了瞩目成就,但仍处于起步阶段。

2023年上半年开始,公司收入激增

这家成立8年的初创公司,一直负责合同工的招聘和培训,但尚未实现盈利。

然而就在今年上半年,它成功改善了运营的毛利率——每产生1美元收入,只需要花费约1.2美元,而在去年上半年,这一数字为1.5美元。

如今仅考虑业务成本(比如合同工的工资),Scale AI保留的收入只有一半。毛利率这一财务指标,略低于50%。比起2022年上半年约57%的毛利率,这个数字有所下降。

这一水平,大大低于科技投资者对软件公司的期望。

但尽管如此,5月份的融资还是为Scale AI提供了雄厚的资金实力。截至上半年末,公司还有约9.8亿美元的现金。

从去年上半年开始,公司收入就开始激增。因为构建LLM的客户需要很多合同工,通过向聊天机器人提交问题、撰写答案,来训练AI模型。

在给投资者的PPT上,Scale AI自称是一个人机混合系统,以低成本生产高质量数据。

根据外媒消息,它还通过一家名为Outlier的子公司,雇佣了数十万个小时工,来进行数据微调。

显然,Scale AI选择聚焦LLM客户,是一种战略转型。

此前,它还有一项类似业务,主要是利用菲律宾和肯尼亚的低成本劳动力,为自动驾驶汽车公司标注数据。但近年来,这项业务的增长已经放缓。

现在,即使雇佣薪酬更高、更专业的合同工,Scale AI的收入也依然能提高,因为它可以将这些更高的成本转移给客户。

当然,现在Scale AI也并非硅谷投资者眼中稳赚不赔的投资。投资者担忧的问题,包括公司较低的毛利率,以及过度依赖少数几个大客户的问题。

天才少年辍学创办独角兽

Scale AI由Alexandr Wang和Lucy Guo于2016年创立,由著名创业孵化器Y Combinator投资。客户包括Meta、微软、英伟达、OpenAI、丰田和哈佛医学院。

2019年,Scale AI成为独角兽。

2022年,Alexandr Wang成为全球最年轻的白手起家的亿万富翁。

Wang于1997年出生于新墨西哥州,父母都是在新墨西哥州洛斯阿拉莫斯国家实验室的物理学家。

高中阶段,他开始通过网络自学编程,开始参加世界级编程大赛,如美国计算机奥林匹克竞赛(USACO)。

17岁,他成为美国知名问答网站Quora的全职码农;18岁,考入麻省理工学院攻读机器学习;在MIT大一刚结束后的暑假,他就和Guo一起创办了Scale,并且拿到了Y Combinator的投资。

Wang跟爸妈说,这就是我夏天随便玩玩的事。

Scale AI刚起步时,有些人确实觉得这就是一个笑话,毕竟公司当时只有三名员工。

不过,在不断地融资和发展之下,Scale AI发展飞速,到2021年已经成长为价值73亿美元的独角兽企业,2023年初公司规模也扩展到了700人。

Wang透露,随着企业客户竞相训练生成式AI模型,Scale AI的这方面业务快速增长。

2023年,公司年度经常性收入增加了两倍,预计2024年底将达到14亿美元。

由于Scale AI的惊人成就,Alexandr Wang已经被硅谷公认为下一个扎克伯格。

AI模型的数据工厂

AI领域公认的三个基本支柱——数据、算法和算力。

算法领域,前有谷歌、微软的大型研究院,后有推出过Sora和GPT系列模型的OpenAI;算力领域有供货全球的英伟达,但在Scale AI还未诞生的2016年,数据领域仍处于空白。

19岁的Alexandr Wang在看到这一点后,做出了辍学创业的决定,我创办Scale的原因是为了解决人工智能中的数据问题。

大部分数据都是非结构化的,AI很难直接学习这些数据;而且大型数据集的标注一项资源密集型工作,因此,数据被很多人认为是科技领域最辛苦、最卑微的部分。

但Scale AI却在短时间内就获得了巨大成功。他们可以为不同行业的企业客户量身定制数据服务。

在自动驾驶领域,Cruise和Waymo等公司通过摄像头和传感器收集了大量数据,Scale AI将机器学习与人机回路监督相结合,管理和标注这些数据。

他们曾经开发的自治数据引擎,甚至推动了L4级自动驾驶的发展。

Wang表示,Scale AI将自己定位为整个AI生态的基础设施供应商,构建数据铸造厂,而不仅仅是在子公司Remotasks中雇佣大量的合同工进行人工标注。

他强调,来自专家的、包含复杂推理的数据是未来人工智能的必备条件。

传统的数据来源,比如从Reddit等社区的评论中抓取数据存在局限性。Scale AI构建了一些流程,模型先输出一些内容,例如撰写研究论文,在此基础上,人类专家可以改进这些内容,从而改进模型的输出。

虽然人工智能生成的数据很重要,但想要获得有一定质量和准确性的数据,唯一方法是通过人类专家的验证。

Alexandr Wang在Scale AI的官网上这样写道,数据丰富不是默认情况,而是一种选择,它需要汇集工程、运营和AI方面最优秀的人才。

Scale AI的愿景之一是数据丰富,从而将前沿LLM扩展到更大数量级,为通向AGI铺平道路。在达到GPT-10的过程中,我们不应该受到数据的限制。

业内盛赞的LLM排行榜更新

Scale AI对业界所做的贡献,不仅是数据标注这么简单。

今年5月,Scale AI重磅推出了全新LLM排行榜——SEAL,开始对前沿模型开展专业性评估。

对于这个榜单,Jim Fan大加赞赏。他认为SEAL是LMSys的非常好的补充和参照,提供公开模型的私密、安全、可信的第三方评估。

对此,Andrej Karpathy也深以为然。

随着OpenAI最强模型——o1的推出,SEAL排行榜也第一时间进行了评测。

除了在高级编程、数学和科学等领域表现出色之外,o1系列也为prompt engineering(提示工程)引入了新的变化。

在工具使用和指令跟随方面,o1-preview表现出色。而在编程能力方面,o1-mini夺得榜首,o1-preview紧随其后位居第二。

- 编程排行榜

在SEAL编程排行榜上,o1-mini以1271分的成绩领跑,紧随其后的是o1-preview,得分为1198。

评估数据集使用了1000个提示词,用于测试各种编程任务,涵盖从代码生成到优化和文档创建等多个方面。

过程中,每个模型的响应都会从正确性、性能和可读性三个维度进行评估,综合运用人工审核和代码执行测试的方法。

- 指令跟随排行榜

在对精确指令跟随能力的评估中,o1-preview以87.27分的成绩领先,超越了知名Claude3.5Sonnet和Llama3.1405B Instruct。

评估数据集包含1054个跨领域的提示词,涉及文本生成、头脑风暴和教育支持等多个方面。

提示工程的变化

与我们熟悉的GPT、Gemini或Claude等模型相比,o1模型的提示词使用和可操控性明显不同。

根据OpenAI的建议,简单直接的指令有助于充分发挥o1的潜力。

与之前的模型不同,用户应避免要求模型进行思维链推理。他们还指出,提示词中的无关上下文对o1模型的干扰可能比之前的GPT系列更大,因此在检索增强生成(RAG)提示中加入一些示例很重要。

Cognition Labs发现,要求模型think out loud(大声思考)实际上会损害性能,而只要求给出最终答案反而会提高性能,因为o1模型无论如何都会产生内部的思维链。他们还指出,冗长或重复的指令会损害性能,而过于具体的指示似乎会影响模型的推理能力。

虽然o1在基准测试中取得了出色的结果,但让它完成你自己的具体任务似乎需要更多努力——它们往往会忽视明确(甚至是强调的)关于如何解决问题的指令。

由此可见,现实世界的提示和基准测试中使用的提示之间,实际上存在着不小的差距:后者旨在只包含明确的、自包含的、最小呈现的问题,没有关于如何解决它们的建议或意见。

需要注意的是,o1-preview响应的延迟,特别是其首个token的时间,明显高于GPT-4o。不过,o1-mini用更快的token推理速度弥补了思考的时间。

一些实测

- 词汇约束

在官方示例中,o1在臭名昭著的strawberry这个词中有多少个R?等陷阱任务上,有着不小的改进。

为了验证这一点,我们向o1-preview提出了一个新编写的谜语:

说出一个拉丁语源的英语形容词,它以相同的字母开头和结尾,总共有十一个字母,并且词中所有元音按字母顺序排列。

在第一次尝试中,模型成功解决了这个谜语,答案是:sententious。

但如果反复提问同一个,o1却并不能次次做对:

sententious ✅

facetiously ❌

transparent ✅

abstentious ❌

facetiously ❌

- 解码密码

同样令人深刻的,还有一个解码复杂密码的例子。

类似的,我们也尝试了这个提示词的各种变体,包括ROT13密码、Atbash密码、Base64编码、反转字符串等各种组合。

中兴通讯近况

然而,大多数测试都不成功——在7次尝试中,o1-preview只有2次能够解码给出的加密信息(《沙丘》中的迎恐祷词(the Litany Against Fear))。

在每个prompt中,o1都被要求从OpenAI给出的示例中推断出一种编码方式。

在以下每个测试中,o1都未能在一次尝试中解码目标消息:

ROT13密码 → 反转字符串 → Base64编码 → 反转字符串

ROT13密码 → Base64编码 → ROT13密码 → 反转字符串

ROT13密码 → Base64编码 → ROT13密码

ROT13密码 → Base64编码 → Atbash密码

ROT13密码 → Base58编码

在第一次尝试中成功解码的两个测试是:

Atbash密码 → Base64编码

ROT13密码 → Base64编码

这里展示了第一个成功的例子——其他测试除了使用的编码不同外,都是相同的:

结论

mit毕业的中国人

总结来看,OpenAI的o1模型在推理能力方面都取得了重大突破,在AIME、Codeforces、Scale的SEAL排行榜等关键基准测试中表现出色。

这些结果表明,o1-preview和o1-mini是解决复杂推理问题的强大工具。然而,要充分发挥这些模型的潜力,可能需要比用户习惯的其他模型发布更多的实验和尝试。

参考资料:

https://www.theinformation.com/articles/scale-ais-sales-nearly-quadrupled-in-first-half?rc=epv9gi

https://scale.com/blog/first-impression-openai-o1?utm_offer=blog


返回网站首页

本文评论
宁夏要安装多少个5g基站「宁夏:2024年将实现人口密集区5G信号全覆盖」
通信世界网消息(CWW)今日,宁夏回族自治区公布2024年北京市政府工作报告(以下简称《工作报告》)。《工作报告》指出,2024年宁夏将加快建设七大数据中心,力争新增标准机架6万架以上,更...
日期:01-29
日本西红柿价格涨至十年来最高:一斤约人民币31元_日本的西红柿多少一斤
10月17日消息,受今年夏季持续高温的影响,近期日本国内的西红柿等多种农作物出现减产,其中西红柿的价格,已经涨至十年来最高水平。据悉,日本一家超市一斤西红柿售价是646日元,约合...
日期:10-18
城市数智化创新高峰论坛成功举办:共筑城市智能体,共赢城市数智化
[中国,上海,2024年9月19日] 华为全联接大会2024期间,在以“共筑城市智能体 共赢城市数智化”为主题的城市数智化创新高峰论坛上,华为联合政务与城市领域的专家、客户和合作伙伴...
日期:09-21
李斌:我们从来不把自己称作豪华品牌_李斌的汽车品牌
日前,蔚来创始人李斌接受媒体采访时,被问到怎么看待中国品牌的豪华?李斌给出了自己的看法。三星Neo QLED 8K电视李斌称,我们从来不把自己叫豪华品牌,如果你去看,我们自己没有叫过...
日期:01-10
孙宇晨豪掷300万拍下比特币大会首版NFT,获大会入场券和终身权益_孙宇晨大举抄底比特币
  日前,波场TRON创始人孙宇晨发推文表示,已经以12.6个比特币(300万人民币)的价格成功拍下比特币大会2021的首版金鲸通(the Golden Whale Pass)NFT 《Forever Whale》,同时获...
日期:12-13
陕西慈善周:传递慈善精神,陕西移动为爱持续奔赴_陕西慈善机构联系方式
通信世界网消息(CWW)9月4日—10日为第五个“陕西慈善周”,主题为“携手参与慈善,共创美好生活”。作为驻地央企,陕西移动始终牢记央企责任担当,多年来致力于推动公益慈善事业发展,...
日期:09-09
真我gt 5g 骁龙888 旗舰新机「骁龙8 Gen2神机!真我GT5支持240W闪充」
真我GT5正式宣布支持240W有线闪充,成为骁龙8 Gen2旗舰中充电速度最快的手机。据了解,真我GT5的240W闪充采用长寿版本,即使经过1600次充放电循环,电池容量仍可保持在80%以上。在2...
日期:08-28
抖音发布体育报告:6762万条视频记录普通人成功瞬间(抖音 视频记录)
7月26日,抖音发布首份体育数据报告(以下简称"报告")。 报告显示,作为人们记录运动生活的重要工具,抖音上有6762万条视频记录了普通人成功的瞬间。 同时,报告还呈现了不同城市人...
日期:04-16
中国联通打造“一带一路”信息光通道 布局全球高速安全网络
  近日,第二届“一带一路”国际合作高峰论坛召开,本次论坛围绕“共建‘一带一路’、开创美好未来”主题展开。自此,“一带一路”建设将从大开大合的“大写意”向精雕细琢的...
日期:02-04
小米想退a「小米su7退订退订率达40% 小米SU7锁单量已达4万辆」
来源:中关村在线哈投股份怎么了switch游戏串流中关村在线消息:今日上午,有相关人士发布了小米新车SU7在线下门店的销量数据,称店均大定有1800~2000台,锁单率:35~40%,退订率:40% ,总体...
日期:04-02
腾讯营收增长_腾讯营收首次下滑,啥原因?
图源:图虫直播一套设备苏宁创业大赛   腾讯正主动退出非核心业务。   作者:白杨;编辑:张伟贤   8月17日,腾讯发布了2022年第二季度财报。报告期内,腾讯营收1340.34亿元,同比...
日期:08-19
解读移动云信创能力,看移动云如何以云化替代加速信创落地实施
我国“2+8+N”信创三步走战略的落地实施为国内信创升级按下“加速键”。大力推动信创落地应用,于外能够缓解国际贸易摩擦、技术脱钩带来巨大压力,于内能够加速推动千行百业的...
日期:08-01
iPhone 14车祸检测被过山车触发 苹果高管详解触发条件
今年,iPhone 14全系都增加了一项新功能车祸检测”,该功能可以识别出机主是否遭遇车祸,并拨打紧急电话,不过目前来看似乎算法还不够完善,日前我们就报道过,有用户因为坐过山车触发...
日期:10-12
12分扣完!女星虞书欣司机在高速上倒车引热议 粉丝效仿 交警回应
快科技1月25日消息,在高速开车时,最危险、最不能有的行为之一就是倒车,后车高速行驶时很容易发生追尾事故。今日,词条#虞书欣司机在高速上倒车#登上微博热搜榜第一。魅族2月23日...
日期:01-26
张朝阳谈ChatGPT:不具备情绪和创造性  人类的智慧可以控制AI_张朝阳最聪明
4月17日 消息:最近,搜狐的创始人和董事长兼首席执行官张朝阳以及深石集团的创始人王石进行了一次对话。在谈及近期炙手可热的ChatGPT时,张朝阳指出,“GPT算法和人类的思维方式...
日期:04-17
AGI-Samantha官网体验入口 AI自主智能体开发软件工具在线使用地址
AGI-Samantha是一个高度先进的自主智能体,模仿了电影《她》中的Samantha。它具有动态语音能力和实时视觉功能,能够进行自主发言并基于上下文做出反应。AGI-Samantha的这些特点...
日期:01-16
聊聊CRM那些事:从百家争鸣到胜者为王,从大浪淘沙到一超多强
(原标题:聊聊CRM那些事:从百家争鸣到胜者为王,从大浪淘沙到一超多强) 2023年,国内企业服务SaaS赛道的舆论呈现冰火两重天。一方...
日期:08-16
FF首位车主曝光 不是贾跃亭而是他_ff汽车是谁的
(原标题:FF首位车主曝光 不是贾跃亭而是他 ) 证券时报e公司讯,6月2日,e公司记者获悉,Faraday Future(简称FF)首位车主曝光,为设计师Re...
日期:06-02
联想服务器连续三季度全球第三!以算力赋能实体经济「联想服务器销量」
联想服务器连续三季度全球第三!以算力赋能实体经济 通信产业网|2023-06-10 13:33:15作者:通文来源:通信产业网全球知名市场调研机构IDC近日发布的2023年第一季度x86服务器全球...
日期:06-10
还没买到口罩的看过来!百度也能买平价N95口罩(我要买n95口罩)
  武汉新型冠状病毒疫情持续发酵,国家卫建委官方消息,截至21日24时,全国累计报告新型冠状病毒感染的肺炎确诊病例440例,22日,仍有多起确诊病例陆续被爆出。事件也引发了全社会...
日期:01-04