您的位置:首页 > 互联网

预见2024:大模型成长进入关键期,探究AI背后的算力战争

发布时间:2024-02-03 20:15:17  来源:互联网     背景:

图片来源@视觉中国

文 | 元宇宙新声,作者 | 贾桂鹏

距离大模型横空出世已经过去一年有余,在AI大模型的浪潮下,各大科技企业争先恐后地推出了自家的大模型产品。

与此同时,各行业企业也对大模型保持着高度关注,一些其他行业的企业也纷纷跨界布局大模型相关产品。

面对着全球都在追逐的大模型浪潮,这也使其对算力需求无处不在,但算力供给相对有限,“缺口”或许将影响人工智能的发展。未来,算力问题也成为各行业实现人工智能普惠的最大难点。那么,这一困局如何破解呢?

大模型在流行

《北京市人工智能行业大模型创新应用白皮书(2023年)》中显示,截至2023年10月,我国10亿参数规模以上的大模型厂商及高校院所共计254家,分布于20余个省市/地区。

商业咨询机构爱分析的报告称,2023年中国大模型市场规模约为50亿元,预计到2024年这一数字将达到120亿元。

显然,2024年,大模型将继续其火热的现象,在2023年形成的百模大战竞争将会进一步白热化,进一步渗透到各行各业的数字化进程中。

我们看到,大模型真正的价值在于行业侧的应用落地,就目前业内对大模型的认知来看,绝大多数人对大模型相关产品的发展观点类似于互联网,消费级只是开始,产业级价值更大。

但如同互联网一样,消费互联网发展迅速,甚至已经接近“天花板”;产业互联网也仅是近年来在政策引导,数字技术驱动下,逐步发展提速。

为什么大模型技术是产业界的一次革命呢?

一直以来,AI在产业化的进程当中,发展得非常慢。那么在大模型的技术出来后,我们认为它来到了一个转折点。

需要了解的是,大模型不仅是一个聊天机器人,也不是像抖音、快手这样让人消磨时间的娱乐软件。它是一个提高生产力的工具,不仅仅是公司间竞争的利器,更重要的是,它像发电厂一样,把以前很难直接使用的大数据从“石油”状态加工成了“电”。而“电”是通用的,就能赋能百行千业,就能够在实体经济转型数字化、智能化的过程中发挥重要的作用。

据有关机构预测,未来三年,在生产经营环节应用AI大模型的企业占比将提高到80%以上。

广汽新能源suv埃安v80

为了进一步释放AI的效果,我们需要推动产学研用的深度融合,强化高价值的数据、高性能的算力、高质量的算法和协同创新,加快关键技术突破和产业应用,让AI不仅会写文章做PPT,更能够实际应用于各个领域。

然而,随着大模型的不断发展,我们也面临着一些挑战。

比如,目前的大模型是万事通,但不是行业通。如果你真的用过大模型,在震惊完它什么都会之后,你会发现一旦问它一些行业的问题,它就会说很多概念性的正确废话。也就是说,大模型对行业理解的深度还远远不足。

大模型无法保证生成的内容完全可信,或者说大模型能产生知识模糊、制造知识幻觉。比如它会输出“贾宝玉打虎”“林黛玉三打白骨精”等不符合事实的信息。

我们认为,相比于AI大模型自身发展的问题,算力不足的问题更显突出。由于大模型的规模庞大,需要巨大的计算资源来进行训练和推理。

但现有的计算基础设施还无法满足这一需求,这导致了训练时间过长、推理速度缓慢等问题。这不仅限制了大模型的应用范围,也制约了我们的创新步伐。

AI时代,算力需求增加

我们看到,GPT-3实际上是生成语言生成模型,他参数量大概1750亿,而随着GPT-4和未来GPT-5的推出这个发展趋势还会延续。

比如,对标GPT-3和GPT-4模型,GPT-3模型训练使用了128台英伟达A100服务器(训练34天),对应640P算力,GPT-4模型训练使用了3125台英伟达A100服务器(训练90—100天),对应15625P算力。从GPT-3至GPT-4模型参数规模增加约10倍,但用于训练的GPU数量增加了近24倍(且不考虑模型训练时间的增长)。

从全球算力的表现状态分析来看,从22到23年经历了疫情,数字经济其实在这几年增长还比较快。

尤其数字化优先成为企业重要的战略发展途径。所以算力已经成为整个行业里面科技的更新和迭代的一个重要支撑。

未来算力发展的趋势

nvidia 芯片颗数

macbook电脑锁屏壁纸怎么换

众所周知,人工智能实现方法之一为机器学习,而深度学习是用来实现机器学习的技术,通常可分为“训练”和“推理”两个阶段。

训练阶段:需要基于大量的数据来调整和优化人工智能模型的参数,使模型的准确度达到预期,核心在于算力。

推理阶段:训练结束后,建立的人工智能模型可用于推理或预测待处理输入数据对应的输出,这个过程为推理阶段,对单个任务的计算能力不及训练,但总计算量也相当可观。

虽然,目前算力的需求在不断增加,也导致了出现“算力危机”,但我们看到突破这些危机的一些技术趋势。

第一个趋势,在算力层面,我们看到通用算力正在转向专用算力,也可以称为智能算力。专用算力包括以GPU为核心的并行训练加速,例如,英伟达DPU,谷歌的GPU,还有新型的算力形态,如NPU等,用于加速 AI 载体。

第二个趋势是从单点到分布式的发展。在十多年前,我们可能只需要使用CPU进行AI模型训练,然后逐渐转向GPU加CPU的方式。当时由于CPU和GPU的编程方式不同,需要重新编译两次才能在CPU和GPU上运行,因此在那个时候,AI模型通常在单台机器上单卡上运行。随着模型参数的增加和模型类型的多样化,从单机单卡逐渐演变成了单机多卡,然后随着GPU的崛起,从单机多卡又发展为分布式训练。这也使得模型训练的速度更快。

第三个趋势是能耗和可持续性。随着训练集群的出现,能耗上升成为一个问题,数据中心需要进行改建和升级以满足能耗要求,这也引发了合规和可持续性的关注。高能耗需要政府批准,因此降低能耗、实现绿色和节能成为趋势。

第四个趋势是软硬结合。从纯硬件走向软硬件结合,尤其是英伟达等公司的带领,软件生态系统变得至关重要。软件工程师和人工智能算法工程师的参与推动了这一趋势。

就我国而言,未来,随着新的算力芯片到来的,还有国内各地出台的一系列利好政策,也积极引导大模型研发企业应用国产芯片,加快提升算力供给的国产化率,提升算力资源统筹供给能力,携手企业共同推动算力市场发展。

写在最后

可以说,算力是数字经济时代最底层的驱动器,无人驾驶、智慧城市、智能交通、智慧金融、仿生科技、生命医学、气候预测以及农业精细化等,都离不开超大算力的支持。在未来的大国竞争中,算力之强弱将直接深度影响到新技术的研发效率和研发成果。

未来,大模型时代的全面到来,注定充满挑战,而挑战往往孕育着机遇。以计算为代表的颠覆技术成为大模型时代的重要底座。最终,谁将主导这场算力的变革,让业界看到大模型市场的新机会,在广阔的市场中率先突围呢?我们拭目以待。


返回网站首页

本文评论
刚刚,出行行业首个!百亿估值玩家联合国有运营商开卷大模型
声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:杨净 衡宇,授权转载发布。首个落地的交通出行大模型,它来了!这两年的出行行业,有的卷补贴、规模,有的卷自动驾驶、卷定制车,终于...
日期:11-14
美团发布国庆“即兴度假”报告 本地游周边游搜索量大涨440%「美团旅游团购」
  上证报中国证券网讯(记者 温婷)美团9月27日发布的最新数据显示,国庆假期前一周,“本地游、周边游”等关键词搜索量环比暴涨440%;北京、上海、南京、苏州、广州、成都、深圳、...
日期:10-04
视频号新策略还利好私域吗?「2021年以后视频号的趋势发展」
声明:本文来自于微信公众号见实(ID:jianshishijie),作者:见实,授权转载发布。视频号近期更新和调整了服务策略到功能,涉及面比较广,或对接下来的市场发生很大影响。比如,视频号小店...
日期:06-25
打破PPT26年的垄断,来画推出上帝视角演示工具Perfoo
  今年7月,「来画」宣布完成1.88亿Pre-C轮融资,这也是疫情期间来画获得的第三轮融资。本次融资由行知资本(新东方产业基金)领投,真成投资跟投,本轮融资将主要用于素材累...
日期:05-18
入门单反相机_入门单反相机和手机拍照哪个好
随着科技的不断发展,单反相机已经成为了越来越多的人所热衷的摄影设备。成为了许多初学者的首选,因为价格相对低廉,比专业单反相机容易掌握。如何选择?首先,要选择一个适合自己的...
日期:05-28
郑州一滴滴司机确诊新冠肺炎_郑州新冠肺炎早期症状
  (原标题:,滴滴:配合相关部门查找乘客)   2月7日消息 河南漯河市卫健委发布疫情情况,全市新增2例确诊病例,其中1人为郑州市的滴滴司机,但未公布具体车牌号。漯河市卫健委工...
日期:06-24
r15标准支持的5g应用场景有_5G R16标准Ready 展锐联合联通率先完成5G端到端技术验证
  【环球网智能报道 记者 张阳】5G可以说是当前最热门的词汇之一,大街小巷人人都在谈论5G,甚至不少人都已经换用了5G手机,享受到了5G带来的高速率。但是从早期声势浩大的宣...
日期:10-08
职业蛙求职_职业蛙学员:我是如何在职业蛙帮助下拿下7张offer的?
  刚刚过去的2019年,对海归留学生来说,是百感交集的一年。50万留学生选择归国与830万国内应届生争夺有限的校招岗位,“不熟悉校招流程、缺乏实习经验、薪资期望过高”让留学...
日期:05-25
A60和Pro A60M 英特尔推出全新专业级图形显卡——锐炫Pro_a6核显相当于什么显卡
【】6月9日消息,英特尔近日宣布英特尔锐炫™ Pro A系列专业级图形显卡新增两款产品——英特尔锐炫™ Pro A60和Pro A60M。上述两款产品的性能在现有英特尔锐炫Pro系列的基础...
日期:09-24
华为宣布昇腾AI集群全面升级 推出首个万卡AI集群_华为升腾atlas
华为宣布昇腾AI集群全面升级 推出首个万卡AI集群 通信产业网|2023-07-06 20:14:56作者:党博文来源:通信产业网7月6日,昇腾人工智能产业高峰论坛在上海举办。论坛现场,大模型联合...
日期:07-07
降低门槛!微软喊你升级Windows 11:CPU支持列表更新了「升级windows11cpu不支持」
快科技6月20日消息,现在微软很重要的一个任务就是让更多用户升级Windows 11系统,所以他们又行动了。微软在5月底发布了KB5026446(Build 22621.1778)下的Windows 11版本22H2的Mom...
日期:06-20
b站up主赚钱吗「B站要捧着UP主赚钱了」
声明:本文来自于微信公众号 天下网商(ID:txws_txws),作者:叶晨,授权转载发布。经历了长期的温吞可乐般状态,B站直播带货终于像被投入了一颗曼妥思,滚起一阵泡沫。6月10日,B站445.6...
日期:06-20
华为轮值董事长胡厚崑说桃李不言「华为胡厚崑:中国大模型中约一半算力由昇腾AI支撑」
凤凰网科技讯7月6日消息,2023世界人工智能大会在上海世博中心开幕,华为轮值董事长胡厚崑发表了主题演讲《共赢人工智能新时代》,他强调,人工智能的发展,关键要“走深向实”,赋能产...
日期:07-07
微软发布可完全在浏览器中运行的轻量级 VS Code 工具
  10 月 21 日消息,微软现已推出了可完全在浏览器中运行的轻量级 VS Code 网页预览版,该程序可以允许开发者直接使用浏览器中的 VS Code,无需使用本地安装版本进行开发。...
日期:07-17
复读14年的高考“钉子户”考了594分:这次要去读大学 去年放弃上交大
日前,备受关注的高考钉子户”唐尚珺发布视频,他大方自曝今年高考分数是594分。他表示,读了17年的高中,这次要去读大学了,大概率会报师范类的方向,并希望在填志愿得到大家的帮助。...
日期:07-01
amd四核心「AMD Zen4拼了!16核心紧紧咬住Intel 24核心」
凭借大小核混合架构设计,Intel 12代酷睿在多核性能上打了个翻身仗,AMD锐龙多年来的多核优势瞬间几乎不复存在。到了13代酷睿,Intel更是将小核心数量翻番,发展到了8+16 24核心的...
日期:09-09
百度智能云VideoMind开放,你想要的模型训练平台,我们给你
  近期,百度智能云宣布开放业内第一个视频AI模型自动化生产平台VideoMind,可以帮助企业构建符合自身业务的AI模型,对视频进行智能分析,从而最大化视频数据的价值。   在今...
日期:04-17
初代电商之死:含着“金钥匙”出生,最终还是落寞了
5g手机体验店活动iPhone有问题极米 new z6   撰文/魏一宁 李丹   编辑/陈芳   人们以为它早倒闭了   昔日中国电商老大易趣网,最后一次走进公众视野,是因为一则倒闭消...
日期:07-31
女性更喜欢的小米小折叠手机!预计年底亮相
小米最近发布了一款名为MIX Fold 3的折叠屏旗舰手机,这款手机在功能和轻薄方面达到了平衡,是目前市面上综合实力最强的折叠旗舰之一。不过,MIX Fold 3是一款主打大屏体验的...
日期:09-06
realme 真我gt 骁龙888 120hz屏幕 65w闪充 智能手机「搭载骁龙8」-Gen 2+240W充电 「realme真我GT5核心配置出炉」
此前realme已经官宣旗下旗舰手机系列 GT 的最新产品——真我GT5系列,号称“安卓性能之王巅峰对决”。作为GT旗舰系列的回归之作,该系列一经官宣便吸引了大批粉丝及潮酷玩家的...
日期:09-10