您的位置:首页 > 互联网

机器学习正在突破摩尔定律,Epoch 最新AI发展趋势预测_ai时代的新摩尔定律

发布时间:2024-06-18 19:24:40  来源:互联网     背景:

声明:本文来自于微信公众号深思SenseAI(ID:gh_a54fc6d3826c),作者:深思SenseAI,授权转载发布。

近日,Epoch AI更新了他们对机器学习远期趋势的研究报告,在计算、数据、硬件、算法、成本等多个维度对人工智能模型趋势进行了深入研究。

Epoch AI是一家研究机构,致力于研究影响人工智能发展轨迹和治理的关键趋势和问题,以造福社会。其报告中的研究结论联合了包括 StandfordHAI 在内的多个学术机构发布,部分研究成果在 ICML 等期刊会议发布,是目前市面上相对权威的趋势预测来源。

01.

计算趋势:

前沿 AI 模型的训练计算量每年增长4-5倍

AI 训练中使用的计算量是 AI 进步的关键驱动因素。Epoch AI 对300多个机器学习系统的分析表明,从2010年到2024年5月,用于训练近期模型的计算量每年增长4-5倍。我们发现前沿模型、近期的大型语言模型以及领先公司的模型也出现了类似的增长。

最先进的 AI 模型发展速度有多快?AI 训练中使用的计算量是 AI 进步的关键驱动因素。Epoch AI 对300多个机器学习系统的分析表明:

自2010年以来,著名 ML 模型的训练计算量每年增长4.1倍。而从1956年到2010年, 著名 ML 模型的训练计算量每年增长1.5倍。

对排名前10名的前沿模型进行统计观测:

在2018年前,模型计算量的增长速度快于总体趋势,高达6.7x/年,或许反映了实验室加入 AI 竞赛。

2018年之后,前沿模型的增长放缓至4.2x/年,与总体趋势趋于一致。

语言模型是当今最重要的模型之一。前沿 LLM 在过去十年中经历了快速的计算增长,在 GPT-3(2020年)之后放缓至每年5倍。

领先的人工智能实验室,包括OpenAI、Google DeepMind 和 Meta AI,一直在以与总体趋势相对一致的速度扩展其模型,平均每年增长5-7倍。

每年4-5倍的增长速度是令人难以置信的,需要面临巨大的工程和科学挑战才能维持。训练很快将涉及管理数十万个 GPU 的集群,并使用它们高效地训练更大的模型。

Gemini Ultra 可能是迄今为止计算最密集的模型,其最后一次训练运行的总训练计算量估计为5e25FLOP。

02.

数据趋势

2028年前,人类的文本Token会被消耗殆尽

有多少文本可以用于训练?

Common Crawl(CC) 是一个广泛使用的爬取数据存储库,包含超过100万亿个 Token,大约是最大数据集的10倍。

Epoch AI 采用常用于研究搜索引擎的方法来估算索引网站的大小。使用CC等网络语料库计算词频,然后在Google搜索词频不同的单词,并记录每个单词的页面数量。由此计算出索引网络上大概有500万亿个Token,排除掉不适合LLM训练的数据集,最终网络文本库存将下降至100万亿个 Token。

那么何时会耗尽网络上的文本?在大概100T Token上训练一个4个Epochs的模型大概会消耗~5e28FLOP的计算资源,预计比GPT4高出3个数量级(OOMs),根据模型算法的增长速度,大概在2028年会达到这个临界点,如果过度训练,这一时间甚至会更早到来。

ai时代的新摩尔定律

目前,Llama370B 表示其接受了15万亿个Token的训练,使其成为公开确认的拥有最大训练数据集的模型。

ai时代的新摩尔定律

当然,还有一些未编入索引的“深层”网络和私人数据。Epoch AI估算,在Facebook、Instagram 和 WhatsApp 等社交媒体和消息应用中有约3000T Token。

为了在2028年(或5e28FLOP)之后保持当前的进展速度,开发或改进替代数据源(如合成数据)似乎至关重要。尽管挑战仍然存在,但这些挑战可以使机器学习继续扩展到公共文本之外。

03.

硬件趋势:

ML 硬件的 FLOP/s 性能每2.3年翻一番

Epoch AI 使用2010年至2023年机器学习实验中常用的47个机器学习加速器(GPU 和其他 AI 芯片)来研究 GPU 等硬件的计算性能发现:

大型硬件集群对于最先进的 ML 模型训练和推理的整体性能取决于多种因素,包括 GPU 本身的计算性能、内存容量、内存带宽和互连。ML 硬件加速器中的 FLOP/s 性能每2.3年翻一番,内存容量和带宽每4年翻一番。

鉴于现代 ML 训练运行需要数千个芯片的有效交互,因此内存和互连带宽是利用大型分布式 ML 训练场景中的峰值计算性能的瓶颈。

使用硬件成本或估算的云成本计算 GPU 性价比:ML GPU 的计算性价比 [FLOP/$] 每2.1年翻一番,通用 GPU 每2.5年翻一番。

使用TDP(芯片的热设计功率)计算ML 硬件的能效:ML GPU 的能源效率 [FLOP/s/瓦特] 每3.0年翻一番,通用 GPU 每2.7年翻一番。

04.

算法趋势:

语言模型性能每5到14个月翻一番

在对 LLM 的算法升级进行研究时,Epoch AI发现,算法进步使得模型实现给定性能水平所需的计算量大约每8个月减半,95% 的置信区间为5到14个月,再次超过摩尔定律。

尤其是两个特别值得注意的算法创新,一个是Transformer 架构,他的引入相当于该领域近两年的算法进展。另一项创新是另一项创新是Chinchilla缩放定律的引入,相当于8到16个月的算法进展。

Epoch AI 在研究模型性能改善时,尝试归因算法的影响比重。其数据发现,计算效率的提高解释了自2014年以来语言建模性能改进的大约35%,而计算规模的增加则解释了模型65% 的性能改进。

05.

成本趋势:

模型训练成本每9个月翻一番

Epoch AI 估算了45个前沿模型,根据模型训练期间的硬件折旧和能耗来计算训练成本,发现自2016年以来,训练前沿 ML 模型的美元成本,总体增长率为每年2.4倍。同时,自2016年以来,用于训练前沿 ML 模型的硬件购置成本,每年增长2.5倍。

在过去几年中,头部大厂的模型成本竞赛已经到了新的数量级。根据最新数据,开发 Gemini Ultra 的总摊销成本(包括硬件、电力和员工薪酬)估计为1.3亿美元。用于训练 Gemini Ultra 的硬件购置成本估计为6.7亿美金。

按照当前的训练成本增长速度,预计在2027年,最大的模型成本将超过10亿美金。

在拆分模型训练成本时,Epoch AI 分析了几个主流选定模型的开发成本。这些模型包括 GPT-3、OPT-175B、GPT-4和 Gemini Ultra。

研究发现,目前AI加速器芯片、其他服务器组件和互连硬件的总成本占总成本的47-67%,而研发人员成本占29-49%(包括股权),能源消耗占剩余成本的2-6%。

无法在此iphone上激活touch id什么意思

虽然当前能源只占成本的一小部分,但由于模型所需的电力容量很大,目前Gemini Ultra 预计需要35兆瓦。简单推断到2029年,人工智能超级计算机将需要千兆瓦级的电力供应。


返回网站首页

本文评论
iPhone15Pro多机型价格破发 最低价比官网便宜1500
9月22日iPhone15系列开卖当天,标准版和15plus就已经跌破发行价。两周以来,iPhone15系列多个型号在第三方渠道的价格一直在下降。10月8日,一位华强北的渠道商透露,iPhone15Pro和1...
日期:10-08
月饼新规来了!电商再难见500元以上的月饼_上千元的月饼
记者|俞瑶 张露曦; 编辑|余冬梅 于曼歌   距一年一度的中秋节还有不到一个月的时间,月饼已被各大商家摆放售卖。但今年的月饼行情有了新变化。   一位做定制月饼加补品礼...
日期:08-16
企业共探液冷“新风向”,由技术及应用,健全体系正加速形成
通信世界网消息(CWW)随着“双碳”目标日益迫近,在数字经济的驱动、“新基建”和“东数西算”等政策的加持下,如何实现数据中心绿色低碳的可持续发展,成为信息通信行业必须思考和...
日期:07-26
三星代工骁龙820「骁龙8 Gen3旗舰中最小的一款 「三星Galaxy」-S24全系电池容量曝光」
年初,全新的三星Galaxy S23系列发布,包含Galaxy S23、Galaxy S23+和Galaxy S23 Ultra三个版本,全系搭载超频版骁龙8 Gen 2,极限性能更强。随着新一代旗舰芯片骁龙8 Gen3芯片即将...
日期:09-10
周鸿祎提醒哪吒汽车CEO张勇:不要哪吒L订单多了就飘了
快科技6月5日消息,近日,哪吒汽车CEO张勇的一条都不创业了 都去干企业家IP了”的微博引发热议。对此,360董事长周鸿祎发布视频称,现在我觉得哪吒汽车的问题不是在那跟别人讨论要...
日期:06-05
ChatGPT、AIGC 的火热推动大数据市场投入和更新迭代
4月6日消息:根据 IDC 的最新预测数据,预计到 2022 年,中国大数据市场的总 IT 投资规模约为 170 亿美元,并且在 2026 年将增至 364.9 亿美元,从而实现规模翻倍。美团2020年第三季...
日期:04-06
三星移动部门首席工程师:正考虑为手机提供超过5年安全更新支持
IT之家 10 月 7 日消息,外媒 Sammobile 在今年的三星开发者大会期间采访了三星移动体验部门(Mobile eXperience)首席工程师、安全团队技术项目经理白信哲(音译)。▲ 图为三星 Gal...
日期:10-07
年轻人爱上国货香水,价比大牌的东方香“真香”?_90年代香水国货香水
声明:本文来自于微信公众号 锌刻度(ID:znkedu),作者:黎炫岐,授权转载发布。曾几何时,国内香水市场一度被国外大牌占据。从正装到分装小样,不少年轻人曾为了大牌香水跑专柜、找代购...
日期:12-16
小米14卖爆了!雷军称未购机用户抓紧去线下买_小米pro14买不到
小米14日前正式开售,市场反应热烈,成为目前手机界的新热点。据官方透露,此次供不应求的原因并非产能不足或库存匮乏,而是因为产品过于抢手。抖音与罗永浩的合作关系荣耀80 Pro三...
日期:11-02
大疆DJI Mini3:制霸你的朋友圈,口袋中的航拍大师「dji 大疆 dji mini 2」
作者:陈功前言到现在都记得曾经有个飞手告诉我:一旦入了无人机的「坑」,我敢打赌,你再也出不来了!为什么这么说呢?因为无人机能够带来的「飞翔体验」实在太爽,谁飞谁知道。用5个理...
日期:12-12
OPPO刘作虎:AI手机是必然趋势 苹果都放弃造车转投AI_刘作虎回归oppo
3月11日 消息:OPPO高级副总裁、一加创始人刘作虎近日在一加内部会议中深入探讨了行业热议的AI手机话题,并给出了自己的见解。刘作虎明确指出,AI手机并非仅仅是一个营销噱头,而...
日期:03-11
电竞国家队参加亚运会「电竞国家集训队名单公布 备战今年杭州亚运会」
5月5日上午,腾讯电竞对外公布首份电竞国家队名单,包含了英雄联盟项目、和平精英项目。小米集团总裁不是雷军?杭州亚运会电子竞技(英雄联盟项目)国家集训队:主教练:朱开教练组成...
日期:05-05
国美年终福利日再推空调安装“十免”服务_国美官方网旗舰店挂机空调价格
  伴着冬天的脚步,2019年已经接近尾声。而颇受用户青睐的国美年终超级福利日将于11月30日在全渠道同步启动。   今年的参与方式也非常简单,从即日起至11月30日,用户可在国...
日期:12-12
五一佳节,在三星显示器上邂逅“诗与远方”「2021三星显示器」
临近五一小长假,各大平台旅游订单异常火爆,“迁徙式旅游” 盛况即将上演。选择避开出行高峰,宅家邂逅“诗与远方”的你,不妨选购一款性能卓越的显示器。无论是专为玩家而生的三...
日期:04-26
特斯拉股价涨至历史高位,马斯克成世界首富「全球车企第一高!马斯克曝特斯拉市值上涨主要动力」
快科技6月18日消息,特斯拉CEO马斯克近日在法国巴黎参加了致力于创新和创业的 Viva Technology 大会。京东全球热爱季会上,马斯克表示,特斯拉已经接近实现完全自动驾驶的汽车,并...
日期:06-19
携程内部信:高管自愿降薪 梁建章和孙洁将0薪_携程ceo孙洁年薪
  3月9日上午消息,携程CEO孙洁今日发布内部信称,从本月开始,自己和董事局主席梁建章将0薪。公司高管层也提出自愿降薪,最低半薪,直至行业恢复。   孙洁表示,经历了保障消费者...
日期:06-14
dream release「dream factory软件下载地址 dreamfactory使用方法教程指南」
什么是DreamFactoryDreamFactory是一个创新的电影制作服务,它通过顶级电影团队的配置,为用户提供快速、专业且无瑕疵的电影制作体验。该服务的核心优势在于能够将用户的想法迅...
日期:04-29
苹果 iOS 17 新特性:为电动车主提供实时可用充电站信息
IT之家 8 月 20 日消息,据外媒 9to5mac 报道,苹果 iOS 17 将会具有一个对电动汽车车主来说非常便利的功能:iPhone 手机内置的地图 App 将实时显示充电设施可用性信息。而在 iOS...
日期:08-21
回首协同应用大赛9年 | 我们是见证者,更是参与者
  风雨夏秋冬,九年磨一剑。不知不觉,致远互联举办全国协同应用大赛已有九载。时光飞逝,或许你已记不清“她”原来的模样,但那些陪伴我们一起走过的“协同岁月”,永远值得铭记...
日期:06-12
小米计划2024年出车_小米汽车2024 年上半年正式量产
  10 月 19 日消息,小米集团董事长雷军今日在投资者日上公布,小米造车及团队各项工作的进展都远超他的预期,预计小米汽车于 2024 年上半年正式量产。   雷军表示,做汽车业...
日期:04-17