您的位置:首页 > 互联网

为什么说GPU再火,AI平台也少不了强力的CPU_gpu为什么不能做处理器

发布时间:2024-03-22 16:37:08  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:鱼羊 栗子 ,授权转载发布。

AIGC的这把火,燃起来的可不只是百模大战的热度和雨后春笋般的各式AI应用。

更是由于算力与通信需求的爆发式增长,使得底层的专用加速芯片、以及配备这些芯片的AI加速服务器再次被拉到了大众的聚光灯下。

据统计,2023年全球范围内的AI服务器市场规模已经达到了211亿美元,并且IDC还发布预测说:

乐视超级电视系统

预计2025年达317.9亿美元,2023-2025年CAGR为22.7%。

AIGC大模型的训练和推理需要大量的高性能算力支持,对AI服务器需求还将提升。

gpu为什么比cpu还难研发

而且AI加速服务器不同于普通服务器,在架构上一般采用异构的方式,且GPU的数量更是能配多少就配多少,这也就是造成目前GPU千金难求的因素之一。

但你知道吗?即使在大模型时代GPU或各式AI加速芯片的光芒变得更加耀眼,但对于AI基础设施来说,CPU依然是必不可少的存在——至少一台高端的AI加速服务器中每8个GPU就需得搭配2个CPU

不仅如此,由于AI加速服务器异构的特点,市场上除了CPU+GPU的组合方式之外,还有其它多种多样的架构,例如:

  • CPU+FPGA

  • CPU+TPU

  • CPU+ASIC

  • CPU+多种加速卡

不难看出,即使AI加速服务器架构的组合方式万般变化,唯独不能变的就是CPU,而且往往还得是搭配高端的那种。

那么为什么会这样呢?

AI加速服务器中的CPU

首先,CPU对于AI加速服务器来说相当于人的大脑。

它可以负责整个服务器的运算与控制,是直接影响到服务器整体性能的核心部件。

CPU处理操作系统的指令,协调各个硬件组件的工作,包括内存管理、数据流控制和I/O操作。

即使在AI服务器中,GPU或其他加速器负责执行大部分计算密集型任务,CPU仍然是不可或缺的,因为它确保了整个系统的稳定运行、各组件的高效通信协作,最终推进任务的顺利执行。

其次,CPU还具备灵活性通用性

CPU的设计一般为通用处理器,能够执行各种类型的计算任务。

三星手机note8怎么样

虽然GPU在并行处理方面更为高效,但CPU在处理序列化任务、执行复杂逻辑和运行通用应用程序方面更为灵活。

真正完整的AI应用平台其实需要处理一系列密切相关又特色各异的任务,包括数据预处理、模型训练、推理和后处理等,这些任务也可能甚至特别需要CPU的通用处理能力。

不仅如此,CPU还是系统启动和维护的关键点。

因为服务器的启动过程、系统监控、故障诊断和维护操作都需要CPU来执行;没有CPU,这些关键的系统级任务将无法进行。

而且CPU在软件兼容性方面更是有积累多年的优势。

市面上大多数软件和应用程序都是为CPU设计的,包括操作系统、数据库管理系统和开发工具。AI加速服务器需要运行这些软件来支持AI应用的开发和部署。

也正如我们刚才所说,现在AI加速服务器均是采用异构的形式,CPU在此过程中可以作为控制节点,管理GPU或其他加速器的计算任务,以此来实现高效的资源分配和任务调度。

最后,便是成本的问题。

虽然GPU在AI计算中非常高效,但CPU或其他专用加速芯片仍然是成本效益较高的选择,特别是在处理不适合GPU或加速器的任务时。CPU和它们的组合可以提供更佳的性能和成本平衡。

这也就不难理解为什么AI加速服务器里唯独不能缺少CPU了。

那么接下来的一个问题便是,主流的服务器厂商都在用什么样的CPU。

我们以国内AI加速服务器市场份额排第一的浪潮为例,从最新消息来看,其NE5260G7服务器便已经适配了老牌芯片巨头英特尔最新发布的第五代英特尔®至强®可扩展处理器

为什么gpu适合人工智能

而之所以浪潮要适配最新的高端CPU,可以理解为“高端的游戏需要搭配高端GPU和CPU”,AI服务器要想在性能上取得新突破,同样也是要适配高端的硬件。

具体而言,与前一代相比,第五代英特尔®至强®可扩展处理器在处理人工智能工作负载方面表现出色,其性能提升了21%,特别是在AI推理任务上,性能增幅更是达到了42%。

此外,它的内存带宽也增加了16%;在执行一般计算任务时,第五代至强®可扩展处理器能够将整体性能提高至多21%,并且在多个客户实际工作负载中实现了每瓦特功耗性能提升高达36%。

也正因“内核”如此强悍,才使得浪潮的服务器在性能上实现了平均21%的提升。

不过有一说一,毕竟AI也不完全就是单纯的模型或大模型的加速,因此上述的CPU优势也还仅是能力的一隅,在各个细分的应用场景中,它还有更大的作为。

AI不完全是大模型

即使在配备了GPU或专用加速器的AI服务器中,CPU的角色也远不止于主控或为加速器提供服务。

而是在AI系统的整个生命周期中扮演着多样化的角色,贯穿从数据采集、预处理、训练、推理、应用等全流程。

先说最关键的AI模型,尤其是模型推理这一环节。

不论是现在占据最强话题热度的大语言模型,还是传统的深度学习模型,抑或是科学计算与人工智能交融形成的AI for Science应用,CPU,特别是内置AI加速能力的英特尔®至强®可扩展处理器,都在推理应用中有不俗战绩。

例如在AlphaFold2掀起的蛋白质折叠预测热潮之中,借助第三代和第四代至强®可扩展处理器不断优化端到端通量能力,就能实现比GPU更具性价比的加速方案,直接拉低AI for Science的入场门槛。

gpu为什么不能做处理器

再例如OCR技术应用,也随着至强®可扩展处理器在内置AI加速技术上的演进,被赋予了新的“灵魂”,不但准确率飙升、响应延迟也进一步降低。

ai为什么都用gpu

更别提以ChatGLM为代表的通用大模型,以及卫宁、惠每等行业软件或解决方案提供商输出的行业特定场景的大模型应用,它们都提供了有力的实践佐证,能验证至强®在大模型推理上的实力,以及相比加速器芯片更优的成本,以及更易获取,更易部署、优化和使用的优势。

不信你就瞧瞧我们的最“In”AI专区,来刷新一下认知。

再说AI全流程中大量涉及数据处理的环节。

实际业务中的AI应用,背后往往需要包含大量数据的知识库作为支撑。

这些数据通过将海量文本语料压缩成密集向量的形式存储,并通过高效的相似度搜索迅速找到与查询最相关的信息,也就是大家所熟知的向量数据库了。

在这方面,专门针对向量和矩阵计算优化的英特尔®AVX-512指令集和英特尔®AMX加速技术有了用武之地,可应对海量、多维向量数据的高并发和实时计算等挑战。

业界知名的向量数据库开发商如腾讯云和星环科技等,底层都选择第五代英特尔®至强®可扩展处理器作为承载和加速的平台。

腾讯云VectorDB与英特尔合作,在第五代至强®平台经软硬件双方面优化后,在提升向量数据库的向量检索效率方面相比基准组提升了约2.3倍,在使用英特尔®AMX 加速数据格式为INT8的测试场景中再次性能提升达约5.8倍。

为什么gpu不能代替cpu

星环科技则基于第五代至强®可扩展处理器推出了Transwarp Hippo 分布式向量数据库解决方案,实现了约2倍的代际性能提升,可有效满足大模型时代海量、高维向量的存储和计算需求。

gpu为什么比cpu还难研发

图:星环科技分布向量数据库Transwarp Hippo产品架构

AI全流程中与数据相关的环节,不止包含可用作大模型外部知识库的向量数据库这一种。还涉及模型训练前数据预处理,训练中的数据调度,模型上线后的持续优化和维护、异常数据的发现和处理等。

众所周知,数据是AI三要素之一,相当于AI的血液和原料,没有优质的数据,再先进的算法和模型也是空中楼阁。但原始数据往往参差不齐,需要通过数据清洗、转换、特征工程等一系列流程,最终才能为AI系统所用。

这些数据处理任务涉及海量逻辑运算,以及同样、甚至更大量级的内存操作,如存取、传输,对处理速度和时延要求都非常高,因此通常也是由最离系统内存最近、更擅长通用计算的CPU来承担。

第五代英特尔®至强®可扩展处理器充分考虑到这些需求,内置多款加速器来为数据处理提供支持,如:

  • DSA数据流加速器(Data Streaming Accelerator):负责优化数据复制和转换操作,提高网络和存储性能。

  • IAA存内分析加速器(In-Memory Analytics Accelerator):提高分析性能,同时卸载CPU内核任务以加速数据库查询吞吐量等工作负载。

  • QAT数据保护与压缩加速技术(QuickAssist Technology):可显著加速数据压缩、对称和非对称数据加密解密,提高CPU效率和整体系统性能。

  • DLB动态负载均衡器(Dynamic Load Balancer),帮助防止性能瓶颈并实现低时延控制平面工作负载。

在第五代至强®可扩展处理器的不同细分型号中,对上述加速器有灵活的配置或支持方案,并且还支持通过Intel On Demand按需启用,可以适应不同工作负载的需求。

gpu为什么比cpu还难研发

最后,还特别要提到的对数据隐私、模型和应用安全的更优防护,毕竟所有AI场景都不能以牺牲安全为代价,更是有些AI应用场景对此格外在意,如在金融、医疗行业。

黑鲨冰封散热背夹2pro智享

对这些行业场景来说,能用上基于CPU实现的硬件级可信执行环境(TEE)技术来保护敏感数据和代码免受攻击可是非常关键的。

如平安科技,就曾使用英特尔®Software Guard Extensions(英特尔®SGX)构建联邦学习解决方案。

平安科技通过英特尔®SGX的“飞地”内存区域,在本地安全地执行模型训练,而无需共享原始数据。同时SGX支持安全的多方计算协议,如同态加密、安全聚合等,从而在联邦学习中实现了更优的隐私保护。

阿里云则基于最新第五代英特尔®至强®可扩展处理器推出了BigDL-LLM 隐私保护方案。

它在这款全新处理器内置的英特尔®Trust Domain Extension (英特尔®TDX)技术的加持下实现了对分布式节点或 AI管道的更优防护,从而能让客户在不牺牲数据隐私的前提下将更多数据运用到 AI 应用中,有效挖掘数据价值,为客户构建更为高效的隐私保护机器学习方案,助力大模型的广泛应用。

ai的gpu不兼容

图:采用英特尔®TDX的BigDL-LLM服务和调优架构

要知道,基于 TEE 的联邦学习或隐私保护机器学习技术,可是未来AI在大规模实践中打通和共享多机构数据的一大基座。

通过这种技术,不同机构之间才能在保证数据安全和隐私的前提下,实现数据的共享和联合分析,才能为 AI 的持续发展演进提供更加丰富和全面的数据支持。

搞好AI全流程加速,CPU不能是短板

所以,让我们从单纯的模型加速,将眼界扩展到更全面、多维、流水线化的AI平台应用,不难预见,随着这种平台级应用的成熟与走向实战,我们对小到AI加速服务器,大到AI基础设施的期望也在不断拓展和升级。

仅仅关注AI模型本身以及GPU、专用加速器的性能,会越来越像一个单点化的思维。

未来大家必须更重视整个AI平台中多种硬件与软件的搭配及协同工作,这其中CPU作为主控、加速、辅助的多面手,对于补齐整个平台的短板,提升整个平台的质量至关重要。

这或许就是在如今的技术浪潮下,以第五代英特尔®至强®可扩展处理器为代表的高端CPU,依然会在AI服务器或基础设施市场中赢得一席之地的根因。

毕竟,高端CPU的作用不仅是直接上手加速AI推理,还关系到整个AI平台或系统整体性能的提升,更是提供更加稳定和安全的运行环境来拓展AI的边界,只有这几个环节都照顾到,才能推动AI Everywhere愿景进一步走向现实。

或者简言之,AI如果要真正走向更多的实用场景,又怎么能少得了更强大、更可靠、更全面多能的CPU呢?

参考链接:

[1]https://www.bilibili.com/read/cv23242562/

[2]https://www.idc.com/getdoc.jsp?containerId=US49554023


返回网站首页

本文评论
英国法庭或限制公众庭审期间使用Twitter(英国法庭庭审程序)
  英格兰及威尔士司法局(Judiciary of England and Wales)首席大法官艾格·朱奇(Igor Judge)周一表示,英国法庭将来可能禁止公众在庭审期间使用Twitter。   朱奇办公室...
日期:07-26
元宇宙也有地产泡沫?炒房客这下血本无归了「元宇宙的房子」
声明:本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,授权转载发布。作为区块链的衍生品,元宇宙房产自然也与NFT和加密货币“同此凉热”。9月1日,2022世界人工智能大会...
日期:09-12
2022年京东开放平台双十二活动总则发布:跨店满300元减40元_京东双十二活动2020入口
11月25日 消息:今日,京麦商家中心发布了2022年京东开放平台12.12活动总则。京东将结合跨店满减、红包雨等各类特色玩法,整合京东内外部流量阵地给予商家优质资源扶持。活动节...
日期:11-26
豆包AI电脑版入口在哪 国产热门AI聊天助手推荐_豆包论坛
豆包是一款由字节跳动推出的人工智能创作助手,可以帮助用户快速制作视频、图文、直播等创意内容。豆包软件的体验入口在哪呢,这里我们来看下豆包的官方体验入口。>>>点击前往...
日期:12-18
美腕开新直播间 李佳琦助播旺旺“出道”
凤凰网科技讯 11月13日消息,李佳琦直播时宣布,助播旺旺和庆子会在全新直播间挑大梁,担任主播,新直播间名叫”所有女生”。利亚德智慧屏联想yoga pro 14c...
日期:11-14
马斯克的"读脑"设备首次植入人体,科学家期待什么?担忧什么?
2月4日消息,埃隆·马斯克(Elon Musk)创建的Neuralink旨在改变我们对脑机接口的认知,让科幻变成了现实。1月29日发布的消息中,马斯克宣布Neuralink已成功将其“读脑”设备首次植入...
日期:02-07
首发3nm联发科天玑9300芯片 「iQOO」-11s配置细节曝光_联发科天玑900天梯图
去年底,iQOO推出了“电竞旗舰”iQOO 11系列,作为一款性能强机,iQOO 11不仅全球首发2K 144Hz E6全感屏,搭载了第二代骁龙8平台及144Hz电竞屏,同时在快充上也堆料到极致,支持200W超...
日期:09-17
中国有声书市场规模将达95亿元 中文在线双轮驱动打造有声精品(有声书行业报告)
  随着互联网与数字化技术的不断发展,获取知识和资讯的方式也变得多元化。数字化媒介不断冲击传统的纸质报刊书籍阅读模式,有声书市场蓬勃发展,以声音为载体,为国民带来阅读...
日期:12-26
科大讯飞参展2023全球智博会,以星火之势赋能姑苏数字生态「科大讯飞2021年会」
6 月 25 日, 2023 全球人工智能产品应用博览会(以下简称“全球智博会”)如期在苏州国际博览中心启幕。全球智博会已连续在苏州工业园区举办五届,作为国内人工智能四大展会之一...
日期:06-27
OPPO 大模型 AndesGPT 曝光“知识与百科"能力表现优异!_oppoa5模型
(原标题:OPPO 大模型 AndesGPT 曝光“知识与百科"能力表现优异!) 近日,OPPO安第斯大模型 (AndesGPT)登上SuperCLUE的9月排行榜,在...
日期:09-29
“必须比时代变化更快”!阿里申请双重主要上市 还有这些对未来的思考
记者/陈婷; ;   编辑/刘雪梅;;   “过去这一年,在风云变幻的国际、国内形势下,我们共同面临着很多的‘时代之问’。我们应对之道的基本原则是‘坚定信心,积极应变,做好自己...
日期:07-31
男子手写3层楼高书法长卷 七夕送异地女友 网友:这不比玫瑰浪漫
从前车马很慢,一生只够爱一人”,虽然古人没有手机、互联网,但他们却把浓浓情意,写在书信之中。而在七夕佳节,用书信来当做礼物,也是形式和意义俱佳的礼物,杭州的一位女子,就收到了这...
日期:08-22
2019kpl秋季赛ag对xq_雷竞技KPL春季赛线上赛预测:QGhappy VS TTG.XQ,昔日雄狮能否止住连败?
  通过专业电竞赛事预测竞猜平台——雷竞技平台所给出的赛前预测数据,可以看到重庆QGhappy战队和广州TTG.XQ战队的指数分别为1.53和2.45。   可以看出,观众们非常看好重...
日期:04-01
视频号电商走出黑盒?_2020视频号商业玩法和商业价值
声明:本文来自于微信公众号新莓daybreak(ID:new-daybreak),作者:李欢,授权转载发布。被称作腾讯全场希望的视频号,2023年开始释放商业能量。去年这个时候,视频号电商还处于一片浓...
日期:12-18
华为mate60概念机「华为Mate60针对iPhone」-15有不少领先之处 「李楠」
【】9月7日消息,今日,前魅族科技副总裁李楠在社交平台上发文表示,随着iPhone 15发布临近,肯定会有人把这款手机和华为Mate60对比。但是还是我之前说的,其实华为Mate60是不需要和...
日期:09-10
amd财报2021q2「4年来首次下滑 AMD发布Q1季度财报:锐龙处理器成重灾区」
快科技5月3日消息,AMD今天凌晨发布了截至4月1日的Q1季度财报,在当前的大环境下,AMD的业绩也同样遭受了考验,营收创新了2019年以来首次下滑,其中锐龙处理器成为营收下滑的重灾区。...
日期:05-03
荣耀TWS耳机_入门级首选TWS耳机荣耀亲选Earbuds X2 开启双11预售优惠价179元
  据荣耀官微消息,荣耀亲选Earbuds X2真无线耳机在10月20日开始双11预售。在10月20日20:00—10月31日20:00期间,用户参与预售支付定金10元可享受抵30元优惠,到手仅179元,参与预...
日期:10-25
微博上线热搜词条投诉功能 更新热搜词条处置规则_微博热搜词条下实时看不到
3月12日 消息:微博近日公布了对热搜词条处置规则的更新公告,强调热搜作为网友热议与发现热点的重要场所,一直受到广大用户的青睐。为了更真实、客观地反映社会热点和网民心声,...
日期:03-12
欲将《赛博朋克2077》纳入麾下:曝索尼与CD Projekt洽谈收购_赛博朋克2077上架psn了吗
今年,无论是微软还是索尼都毫不吝啬手中的钞票,分别收购了《魔兽世界》的开发商动视暴雪,和《命运》的开发商Bungie。现在,根据分析师Rythian透露的消息,索尼又将目光放在了《赛...
日期:11-14
马斯克回应特斯拉降价到20万出头:让普通人圆电车梦
1月26日消息,特斯拉CEO埃隆马斯克在财报电话会议中回应特斯拉降价时表示,很多人都想买一部特斯拉电车,但是可能负担不起,所以我们在市场上的价格调整也将迎合普通消费者的需求。...
日期:01-26