您的位置:首页 > 互联网

为AI加速而生 英特尔CPU能跑200亿参数大模型_英特尔cpu能用多少年

发布时间:2023-12-22 21:35:52  来源:互联网     背景:

实用化 AI 算力又升上了一个新台阶。

在人工智能的应用领域,出现了一些让人始料未及的趋势:很多传统企业开始选择在CPU平台上落地和优化AI应用。

例如制造领域在高度精细且较为耗时的瑕疵检测环节,就导入了CPU及其他产品组合,来构建横跨“云-边-端”的AI 缺陷检测方案,代替传统的人工瑕疵检测方式。

再比如亚信科技就在自家OCR-AIRPA方案中采用了CPU作为硬件平台,实现了从FP32 到INT8/BF16 的量化,从而在可接受的精度损失下,增加吞吐量并加速推理。将人工成本降至原来的1/ 5 到1/9,效率还提升了约5- 10 倍。

在处理AI制药领域最重要的算法——AlphaFold2 这类大型模型上,CPU同样也“加入群聊”。从去年开始,CPU便使AlphaFold2 端到端的通量提升到了原来的23. 11 倍;而现如今,CPU让这个数值再次提升3. 02 倍。

上述这些CPU,都有个共同的名字——至强,即英特尔®️ 至强®️ 可扩展处理器。

为什么这些AI任务的推理能用CPU,而不是只考虑由GPU或AI加速器来处理?

这里历来存在很多争论。

很多人认为,真正落地的AI应用往往与企业的核心业务紧密关联,在要求推理性能的同时,也需要关联到它的核心数据,因此对数据安全和隐私的要求也很高,因此也更偏向本地化部署。

而结合这个需求,再考虑到真正用AI的传统行业更熟悉、更了解也更容易获取和使用CPU,那么使用服务器CPU混合精度实现的推理吞吐量,就是他们能够更快和以更低成本解决自身需求的方法了。

面对越来越多传统AI应用和大模型在CPU上的落地优化,“用CPU加速AI”这条道路被不断验证。这就是在数据中心中,有70%的推理运行在英特尔® 至强® 可扩展处理器上的原因。1

最近,英特尔的服务器CPU完成了又一次进化。 12 月 15 日,第五代英特尔® 至强® 可扩展处理器正式发布。英特尔表示,一款为AI加速而生,而且表现更强的处理器诞生了。

天猫苹果12销量

人工智能正在推动人类与技术交互方式的根本性转变,这场转变的中心就是算力。

英特尔CEO帕特·基辛格(Pat Gelsinger)在 2023 英特尔ON技术创新大会表示:“在这个人工智能技术与产业数字化转型飞速发展的时代,英特尔保持高度的责任心,助力开发者,让AI技术无处不在,让AI更易触达、更可见、透明并且值得信任。”

第五代至强 为AI加速

第五代英特尔® 至强® 可扩展处理器的核心数量增加至 64 个,配备了高达320MB的L3 缓存和128MB的L2 缓存。不论单核性能还是核心数量,它相比以往的至强都有了明显提升。在最终性能指标上,与上代产品相比,在相同功耗下平均性能提升21%,内存带宽提升高达16%,三级缓存容量提升到了原来的近 3 倍。

更为重要的是,第五代至强® 可扩展处理器的每个内核均具备AI加速功能,完全有能力处理要求严苛的AI工作负载。与上代相比,其训练性能提升多达29%,推理能力提升高达42%。

英特尔全部cpu参数列表

在重要的AI负载处理能力上,第五代英特尔® 至强® 可扩展处理器也交出了令人满意的答卷。

首先要让CPU学会高效处理AI负载的方法:在第四代至强® 可扩展处理器上,英特尔面向深度学习任务带来了矩阵化的算力支持。

英特尔®️ AMX就是至强CPU上的专用矩阵计算单元,可被视为CPU上的Tensor Core,从第四代至强® 可扩展处理器开始成为内置于CPU的AI加速引擎。

第五代至强®️ 可扩展处理器利用英特尔®️ AMX与英特尔®️ AVX- 512 指令集,配合更快的内核,以及速度更快的内存,可以让生成式AI更快地在其上运行,无需独立的AI加速器就能执行更多工作负载。

借助在自然语言处理 (NLP) 推理方面实现的性能飞跃,这款全新的至强® 可支持响应更迅速的智能助手、聊天机器人、预测性文本、语言翻译等工作负载,可以在运行参数量 200 亿的大语言模型时,做到时延不超过 100 毫秒。

据了解,11. 11 期间,京东云便通过基于第五代英特尔® 至强® 可扩展处理器的新一代服务器,成功应对了业务量激增。与上一代服务器相比,新一代京东云服务器实现了23%的整机性能提升,AI计算机视觉推理性能提升了38%,Llama v2 推理性能也提高了51%,轻松hold住用户访问峰值同比提高170%、智能客服咨询量超 14 亿次的大促压力。

除此之外,第五代英特尔® 至强® 可扩展处理器也在能效、运营效率、安全及质量等方面实现了全面提升,提供了向前代产品的软件和引脚兼容性支持,以及硬件级安全功能和可信服务。

国内云服务大厂阿里云也在发布会上披露了其实测体验数据,基于第五代英特尔® 至强® 可扩展处理器及英特尔® AMX、英特尔® TDX加速引擎,阿里云打造了 “生成式AI模型及数据保护”的创新实践,使第八代ECS实例在实现了全场景加速和全能力提升情况下,更加固了安全性能,且保持实例价格不变,普惠客户。

数据显示,其在数据全流程保护的基础上,AI推理性能提高25%、QAT加解密性能提升20%、数据库性能提升25%,以及音视频性能提升15%。

英特尔表示,第五代至强® 可扩展处理器可为AI、数据库、网络和科学计算工作负载带来更强大的性能和更低的TCO,将目标工作负载的每瓦性能提升高达 10 倍。

对先进AI模型实现原生加速

为让CPU能够高效处理AI任务,英特尔把AI加速的能力提升到了开箱即用的程度。

英特尔®️ AMX除了可以加速深度学习的推理、训练以外,现在已经支持了流行的深度学习框架。在深度学习开发者常用的TensorFlow、PyTorch上,英特尔® oneAPI深度神经网络库 (oneDNN) 提供了指令集层面的支持,使开发人员能够在不同硬件架构和供应商之间自由迁移代码,可以更轻松地利用芯片内置的AI加速能力。

在保证了AI加速直接可用之后,英特尔利用高性能开源深度学习框架OpenVINO™ 工具套件,帮助开发者实现了一次开发、多平台部署。它可以转换和优化使用热门框架训练好的模型,在多种英特尔硬件的环境中快速实现,帮用户最 大程度地利用已有资源。

英特尔cpu性能排行2021

OpenVINO™ 工具套件最 新的版本也加入了对大型语言模型 (LLM) 性能的改进,可以支持生成式AI工作负载,包括聊天机器人、智能助手、代码生成模型等。

OpenVINO™ 工具套件2

通过这一系列技术,英特尔让开发者们能够在几分钟内调优深度学习模型,或完成对中小型深度学习模型的训练,在不增加硬件和系统复杂性的前提下获得媲美独立AI加速器的性能。

比如在先进的预训练大语言模型上,英特尔的技术就可以帮助用户完成快速部署。

用户可以从最热门的机器学习代码库Hugging Face中下载预训练模型LLaMA2,然后使用英特尔®️ PyTorch、英特尔®️ Neural Compressor等将模型转换为BF16 或INT8 精度版本以降低延迟,再使用PyTorch进行部署。

英特尔表示,为了能够紧跟AI领域的潮流,有数百名软件开发人员正在不断改进常用的模型加速能力,让用户能够在跟上最 新软件版本的同时,获得对于先进AI模型的支持。

第五代至强® 可扩展处理器的实力,目前已在部分大厂进行了验证。火山引擎与英特尔合作升级了第三代弹性计算实例。

目前,火山引擎已通过独有的潮汐资源并池能力,构建百万核弹性资源池,能够以近似包月的成本提供按量使用体验,降低上云成本。基于第五代英特尔® 至强® 可扩展处理器,火山引擎第三代弹性计算实例整机算力再次提升了39%,应用性能最 高提升了43%。

这只是个开始。可以预见,很快会有更多科技公司的应用能够从第五代至强®️ 可扩展处理器的性能中获益。

下一代至强已经现身

未来,人们对于生成式AI的需求还将不断扩大,更多的智能化应用将会改变我们的生活。以计算能力为基础,万物感知、万物互联、万物智能的时代正在加速到来。

面对这样的趋势,英特尔正在加紧打造再下一代的至强CPU,它们面向AI的专业化程度还会更高。

英特尔每代cpu提升

在最近披露的英特尔数据中心路线图上,下一代至强® 处理器将对不同工作负载、场景配备不同的核心,其中主打计算密集型与AI任务的型号会使用侧重性能输出的核P-core,面向高密度与横向扩展负载的型号则会使用有更高能效的核E-core,这两种不同的核心架构并存的设计,既满足部分用户对极 致性能的追求,也能兼顾到可持续发展绿色节能的需求。

未来,英特尔还将如何实现晶体管和芯片性能的飞跃,在AI算力上还能有什么样的跃升?

让我们拭目以待。


返回网站首页

本文评论
iPhone15全系破发:官网瞬间售罄
苹果iPhone 15系列机型于9月15日晚间正式开启预购,引发果粉们的热情。然而,一些电商平台上,iPhone 15系列机型却出现了全系破发的情况,这让不少在官网购买手机的苹果用户开...
日期:09-17
迄今为止我最想吹爆的暗光长焦影像旗舰 OPPO-Find X6 Pro评测
就在不久前,OPPO发布了新一代Find系列旗舰——全新的OPPO Find X6系列,包含OPPO Find X6和OPPO Find X6 Pro两个版本,作为第二代的骁龙8旗舰中入局比较晚的机型,它们凭借着业界...
日期:09-18
续航超过1000公里!丰田电池公布最新进展:成本减少40%_丰田车的电池是什么牌子的?
快科技9月21日消息,据资料显示,丰田6月在中国市场的销量为17.45万辆,同比下降12.8%。相比之下,本田6月在华销量为11.31万辆,同比下降19.8%;日产6月在华销量仅为6.91万辆,同比大跌2...
日期:09-22
上新!H3C Magic NX54双频5400M Wi-Fi 6路由器:549元_H3C Magic NX54
  新华三智能终端有限公司全新家用路由器H3C Magic NX54双频5400M Wi-Fi 6路由器618期间发布,官方售价549元。5月25日起,H3C智能终端京东官方旗舰店开启预约,6月1日、6月11...
日期:01-26
任天堂“NX 2”硬件开发套件曝光:Switch 2将延续设计
任天堂未发布的下一代主机被大多数用户暂时称为“Switch 2”,然而,官方并未明确确认这款新主机是否将延续Switch的设计。最近,根据推特用户NWPlayer123的爆料,任天堂的开发者网...
日期:07-07
是个狠人 马斯克要求推特程序员书面打印代码:证明自己没摸鱼_马斯克改推特
几经波折之后,马斯克最终还是以440亿美元的代价收购了推特,这几天正式成为推特老板,开始对推特进行改革,原来的CEO、CFO及首席法律顾问在拿到几千万美元的补偿之后走人,下一步马...
日期:10-31
淘宝天猫618直播预售首日战报出炉_天猫618预热
5月28日消息,据淘宝直播公众号,淘宝天猫618直播预售首日,李佳琦Austin、香菇来了、蜜蜂惊喜社、烈儿宝贝、陈洁kiki、林依轮等达人直播间交易额破亿,罗永浩、胡可、Timor小小疯...
日期:05-28
博主曝开合创汽车走广深沿江高速免费:背后金主不一般_合创汽车公司现在什么情况
快科技11月8日消息,今日,有汽车博主爆料称,开合创的车,走广深沿江高速是免高速费的,102元直接免掉,开合创能省不少高速费。2021购买汽车政府补贴博主上传视频中,他在高速收费站下站...
日期:11-09
欲与其展开正面竞争,OpenAI对手Cohere获2.7亿美元融资_openai dall e
6 月 12 日消息,OpenAI 的竞争对手 Cohere 公司日前宣布已获得 2.7 亿美元(备注:当前约 19.25 亿元人民币)的新融资,Cohere 公司声称,这笔融资将作为其“ C 系列”资本的一部分,“...
日期:09-24
小米自研系统MIOS爆料
“MIUI究极进化……MIOS”。8月22日消息,小米在工信部备案了新网址mios.cn(但网站还没开,现在访问是403状态)。同日,闲聊站爆料这是小米全端自研系统,兼容AOSP。省流就是可以在多...
日期:08-23
济南动物园网红小黑猩猩“柒仔”去世:初步研判系突发疾病死亡
近日,济南动物园服务中心发布了关于济南动物园小黑猩猩柒仔去世的情况通报”。内容提到:3日11时,济南动物园饲养员观察到黑猩猩幼崽柒仔”情况异常,11时20分,经专家初步研判为突...
日期:03-04
NASA:新型登月火箭一旦错过6日发射窗口,首飞可能推迟至10月「nasa公布登月新计划」
【环球时报综合报道】因发动机故障推迟至北京时间9月4日凌晨发射的美国“太空发射系统(SLS)”重型火箭,再度因为燃料泄漏问题“临阵”取消首飞任务。美国国家航空航天局(NASA)的...
日期:09-17
广东突降冰雹 多车被砸毁容!保险给赔吗?_冰雹砸坏车保险理赔吗
近日,广州除番禺区、南沙区外,其他9区全部生效雷雨大风黄色预警,荔湾、越秀、天河、黄埔、白云、花都区生效冰雹橙色预警。据网友爆料称,他们所在地区已经下起了冰雹,部分冰雹如...
日期:03-26
通义千问官方App在哪下载 通义千问2.0有哪些升级
通义千问已经发布了2.0版本,2.0版本在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升,以...
日期:11-14
小米13 Ultra新款发布 3款限量色「小米13最新官方消息」
今天一早,小米13 Ultra的白色1Tb版宣布开售,而除此官方宣布推出小米13 Ultra限量定制色,共三款颜色,分别是星空蓝、赤霞橙、银杏黄。发售时间为5月6日上午10点,售价和普通版相同...
日期:05-04
30年老将马道杰任董事长-国产手机芯片巨头紫光展锐换帅_马道杰简介
6月27日消息,紫光集团今天发布公告,委派集团执行副总裁马道杰任紫光展锐董事并选派其为紫光展锐董事长。原神游戏制作了多长时间?原由紫光集团委任的紫光展锐董事吴胜武不再担...
日期:09-22
支付宝小荷包升级:最多支持60人同时使用_支付宝小荷包升级:最多支持60人同时使用吗
支付宝宣布,支付宝小荷包扩容”,现在起,集体经费模式”可支持60人同时使用,还能提前预存、灵活分摊、自动计算成员结余,事后多退少补,账单一目了然。百度互联网医院平台希沃培训报...
日期:10-02
1799元起步!NV为入门神卡RTX 3050升级GPU:功耗还降低
NVIDIA AIB合作伙伴终于开始提供配备GA107 GPU的GeForce RTX 3050显卡,从而使功耗降低15W。一年前,NVIDIA推出了GeForce RTX 3050显卡,该显卡采用GA106 GPU,售价249美元,国内售价...
日期:12-25
iPhone 14最快降价:速度破纪录_iphone 11大降价
iPhone 14全系开始之后,标准版的两款机型都已经在线下破发,即便有灵动岛,4800万像素等重磅升级的加持,Pro版的两款机型在发售之后溢价也在快速下降,部分型号和颜色在线下已经有原...
日期:10-24
宝尊电商在港交所主板主要上市「宝尊股票市值」
11月1日 消息:今日,宝尊电商宣布,公司自愿将其在香港联合交易所有限公司(“香港联交所”)的第二上市地位转换为主板主要上市的事项于今日生效。宝尊现为在香港联交所及纳斯达克...
日期:11-08