您的位置:首页 > 互联网

迎接变革,至强可扩展处理器的技术创新为云端AI应用打通底层瓶颈

发布时间:2023-12-29 14:23:32  来源:互联网     背景:

智能革命的浪潮之中,算力普慧、算法进化、数据爆发对AI基础设施产品组合的要求更进一步,第五代英特尔® 至强® 可扩展处理器的发布则强化了英特尔在AI产品的完整版图。

2023 年,生成式AI研究和应用的爆发给云计算产业带来了全新的机遇和挑战:大模型需要庞大的算力支持,用户普遍需要向云计算厂商购买算力服务;且由于大量用户涌入云服务市场,云厂商需要尽快升级数据中心算力以应对AI需求,同时持续降低TCO,为用户提供价格合理的算力资源;此外,AI应用开发还涉及大量隐私敏感数据的云端存储和使用,云厂商也要全力保障这些数据的安全可靠,打消用户后顾之忧。

基于上述需求,云厂商迫切需要对已有硬件基础设施进行更新换代,要求新一代CPU能在保障基础设施平稳升级迭代的同时,具备更强的性能、更低的TCO,同时能够满足云端多样化工作负载需求的较强AI能力:

对于大型云服务基础设施而言,稳定性、可靠性依然是王道,因此云服务厂商升级硬件时决策更加谨慎,偏向于在有着长期延续性的主流平台上逐渐迭代,保护上层软件应用投资,减小对基础设施开发运维部门的冲击。大模型在云端训练、推理的过程需要用户将大量数据传输至云端,云厂商需要采取更强的安全措施,如硬件级的安全引擎来更好地保障敏感数据的安全,确保云实例间的数据隔离,预防恶意入侵和泄漏。AI应用涉及密集的低精度矩阵运算,需要较大的内存空间。对于大模型推理应用和中小尺度(参数规模低于20B)模型的训练应用而言,其在搭载AI加速器的CPU上运行可以获得非常好的能耗比与性价比,还能够以极具优势的TCO满足云厂商大多数AI服务的需求。同时CPU的通用计算能力也可以为云厂商提供充足的灵活性,有效保护基础设施投资。

面对上述需求,英特尔作为服务器CPU领域的技术领导 者,继年初发布第四代至强® 可扩展处理器之后,加快了产品更新节奏,于上周发布了第五代至强® 可扩展处理器,其可与上一代处理器兼容,提供硬件级安全和可信服务,并通过丰富的AI产品组合驾驭整个AI管线,从而进一步壮大了应对人工智能时代的产品组合。

技术创新解决三大维度需求,CPU 继续扮演 AI 时代基础设施关键角色

相比上一代产品,第五代至强® 可扩展处理器的核心数量增加至 64 个,拥有更高的单核性能和内存带宽,三级缓存容量提升近 3 倍。其每个内核都具备AI加速功能,内置的英特尔® AVX- 512 及英特尔® AMX,能使机器学习、深度学习和大模型应用的性能大幅提升。第五代至强® 可扩展处理器还能通过英特尔® SGX/TDX为使用中的云端数据提供端到端硬件级防护能力。与上一代至强® 可扩展处理器相比,五代至强® 在相同功耗下的平均性能提升了21%,而AI推理和训练性能的提升更是高达42%和29%。

一系列技术创新,使第五代至强® 可扩展处理器成为AI时代云厂商的基础设施关键角色。目前,已经有多家客户在实际业务中部署了第五代至强® 可扩展处理器,在实践中证明了它为用户带来的巨大收益提升。其优异的表现得到了客户的很高评价,也让更多准备升级云计算基础设施的企业对新一代至强® 有了更高的期待。

英特尔 AMX提升大模型推理性能,助力京东升级营销购物体验

2023 年京东云突破性地在数百个AI场景中应用了大模型,在数百个营销场景中升级了原有工作流,显著提升了商家与消费者的购物体验。

基于自研的言犀AI与大模型,京东云通过AIGC管道生成了30%的大促物料,京小智数字人、领航者营销平台也在大模型支持下获得了高达87%的商品推荐采纳率,消费者应答准确率提升30%。

京东大模型第 一次亮相就收获完美成绩,很大程度上要归功于其部署的基于第五代英特尔® 至强® 可扩展处理器的新一代自研服务器,与上一代自研服务器相比整机性能提升23%,关键的AI CV推理性能与 Llama v2 大模型推理性能更是分别提升38%与51%。

取得如此显著的AI推理能力进步,秘诀在于第五代至强® 可扩展处理器搭载的英特尔® AMX加速引擎。其可以将INT8 低精度矩阵运算速度提升一个数量级,再结合第五代至强® 可扩展处理器更高的内存带宽与更强的多核心互联能力,使AI推理性能相较上一代显著提升。在11. 11 大促中,第五代至强® 可扩展处理器和英特尔® AMX的组合在京东云承载的 AI 推理应用服务中大展身手,助力用户访问峰值同比提升170%,智能客服咨询服务量超 14 亿次,且并未增加能耗,也将京东云基础设施的运维成本维护在之前的水平内。

英特尔®TDX赋能可信计算环境,为阿里云客户构筑端到端数据安全城墙

对于云计算厂商而言,要让更多行业和组织信任云服务,就必须提供有足够说服力的安全隐私保障,所以云厂商迫切需要更高水准的硬件级安全城墙。

对于云环境中使用状态中的数据,机密计算是实现其有效保护的良策,其为客户敏感数据提供了基于硬件设备的可信执行环境(Trusted Execution Environment, TEE),通过隔离保护的方式来防止未经授权的入侵者访问或修改处理中的数据。作为机密计算技术的重要引领者,英特尔® 软件防护扩展(英特尔® SGX)技术提供了应用层面的隔离能力;而在和阿里云的合作中,则由英特尔® TDX技术与阿里云新实例搭载的可信平台模块(TPM)相配合,结合阿里云自研的加密计算隔离环境enclave,为阿里云第八代企业级ECS实例g8i构建了一个基于虚拟化的硬件可信环境,即为整个虚拟化实例(包括虚拟机、容器)都构建出可信的边界,由此为客户提供了可信边界更大、更易部署的安全云环境。

英特尔® TDX使TEE环境的可信边界获得了有效扩展,从而让IaaS、PaaS等环境中的云工作负载都能整体纳入机密计算的数据保护之下,能够有效抵御恶意威胁,加强云端数据隔离。

阿里云自研的千问大模型就得到了英特尔® TDX的充分保护,实现模型数据端到端加密保护。英特尔® TDX技术为AI大模型这样需要向云端传输大量数据的应用场景铸就了足够牢固的安全保障,也为生成式AI应用广泛普及铺平了信任道路。此外,在引入第五代至强® 可扩展处理器之后,第八代企业级ECS实例在计算、网络、存储、安全等工作负载中的都得到了显著提升,在数据库、硬件加解密、AI应用、音视频等场景性能提升15%~25%不等。更重要的是,八代实例保持价格不变,使阿里云g8i实例可以用更小的性能开销保障用户的数据高度安全性。

第五代至强®可扩展至强算力大升级,支持火山引擎实现降本增效目标

火山引擎的大规模云原生基础设施包含超过一百万台服务器、上千万容器实例,管理数十EB级别存储资源,需要应对10 亿+级QPS缓存峰值、10+TB/s的读写峰值带宽,支持数亿日活的应用访问。

为了应对如此复杂的需求,火山引擎一直都选择和信赖英特尔® 至强® 解决方案,并率先引入第五代至强® 可扩展处理器,助其第三代弹性计算实例加码全新升级。

与基于第四代至强® 的弹性计算实例相比,第五代至强® 可扩展处理器助力火山引擎释放了巨大算力和性能红利,其弹性计算实例整机算力提升39%,内存带宽提升17%,并在AI、视频处理性能、Java应用性能等方面均有40%左右的性能提升。火山引擎计划推出使用英特尔原生硬件加速技术的能力升级,以Nginx为例,使用英特尔® QAT进行数据压缩和证书验证操作的吞吐量最 高可提升 5 倍;在RocksDB中,使用英特尔® IAA进行数据压缩读写的吞吐量最 高可提升1. 9 倍。提升如此巨大的算力进化幅度,使火山引擎能够使用相同的实例数量应对更多业务需求。

如今,火山引擎正在构建百万核心级别弹性资源池,为业务的流量增长、体验创新与安全性增强提供海量算力保障。

第五代至强® 可扩展处理器提供澎湃的算力的同时,还与上一代处理器兼容,共享架构与平台,大大减少测试和验证工作,其更高的性能、更好的安全性、更高的成本效益,已经在头部云服务提供商中得到全面验证。

软硬结合,打通AI创新底层瓶颈

除硬件方面的诸多创新,第五代至强® 可扩展处理器在软件层面也搭建了良好的生态环境。例如,英特尔已经在Pytorch、Tensorflow和OpenVINO™ 工具套件等行业标准框架中提供了针对第五代至强® 可扩展处理器的优化,使得云厂商和用户能够以较低的门槛,快速利用如英特尔® AMX等处理器功能,打通AI应用的算力瓶颈。英特尔® Trust Authority鉴证服务则能充分验证TEE的有效性,发挥英特尔® SGX/TDX技术的优势。

戴尔g15加装固态硬盘需要螺丝吗

iphone 12 5g频段对比华为5g频段

如果说数据中心是一台巨型计算机,那么CPU就是它的超 级大脑,第五代英特尔® 至强® 可扩展处理器将一如既往地扮演核心角色。它与网络、GPU、软件技术栈等其他英特尔创新技术一起共同构筑了上层AI应用的根基。而这样的根基虽然能力强大,但并不需要用户为此投入大量精力学习或增加运维投入。由此,企业就能将主要精力投入在业务创新中,并在 AI 浪潮中紧紧把握住市场机遇,开启新的增长路径。


返回网站首页

本文评论
AI创业要求剧变:拿到融资前必须先挣到钱_ai方面的创业
声明:本文来自于微信公众号见实(ID:jianshishijie),作者:徐志斌,授权转载发布。“现在投身AI领域的创业团队,能够试错的空间和次数,比几年前移动浪潮小多少?至少下降了80%~90%。早...
日期:09-04
国产动画电影史上第8!《长安三万里》票房破6亿元_万里长安小说
7月16日消息,根据灯塔专业版提供的数据,截止今天11时49分,动画电影《长安三万里》的票房已经突破6亿元。同时,截止本文成稿,《长安三万里》的票房,已经达到了国产动画电影史上第8...
日期:07-16
广州苹果经销商强行搭售 工商局称此举违规
iPad2在中国大陆上市不到一个月,引来抢购潮。而在销售火爆货源紧缺的背景下,各经销商祭出强行搭售措施,让“果粉”们很受伤。购iPad2强搭配件   “果粉”吴先生和刘小姐日前...
日期:07-28
wps设计功能怎么用_WPS为春节打造的专属功能 如何让4亿用户化身设计大师
  春节将至,与农历新年有关的一系列主题海报,也成为了节前办公人群的主要创作内容之一。提到海报设计,大多数用户会率先想到类似Photoshop这样的专业设计软件。令人意想不到...
日期:05-09
德国域名.de昨日瘫痪一个多小时
  德国的因特网昨日出现了严重问题,他们的国家域名“.de”出现了一个多小时的无法访问的情况。   德国网络监管机构DENIC透露,.de目前有1360万域名,发生问题的范围在为.de...
日期:07-29
上万的月饼_月饼新规来了!电商再难见500元以上的月饼
记者|俞瑶 张露曦; 编辑|余冬梅 于曼歌   距一年一度的中秋节还有不到一个月的时间,月饼已被各大商家摆放售卖。但今年的月饼行情有了新变化。   一位做定制月饼加补品礼...
日期:08-16
三个月关两店,宜家不受年轻人喜欢了?_宜家的消费者
  文 |;刘德炳   行业自身也在发生变革。   在北京五棵松附近的宜家体验中心,一进门不远处是沙发销售区,不过,前来选购沙发的消费者并不多,沙发上三三两两坐着一些人。中...
日期:08-17
优惠289元!海南免税店版iPhone 14 Plus开卖「海南免税店iphone13发」
大家注意啦!现在海南免税店版iPhone 14 Plus开卖了,最多可便宜289元。根据海南免税店发布的消息,iPhone 14 Plus手机128GB、256GB和512GB三个版本的价格分别是6790元、7665元...
日期:10-21
三星m12材料屏幕「iPhone 15将全系采用三星M12屏幕:Pro版依然独享ProMotion动态高刷」
快科技6月5日消息,今年的iPhone15系列,不出意外还会在9月份与大家相见。马斯克为啥卖房根据最新消息,目前iPhone15系列已经在富士康完成试产,预计将会在本月底量产,这就意味着产...
日期:06-06
双十一大战来了 上海:禁止电商虚假打折、虚假标价_双11虚假降价
2022年的双十一”马上就要来了,各大电商平台正在紧锣密鼓准备中,你的购物车塞满了没?魅族v8和魅族note8哪个好中兴5g全部测评为规范双十一”期间网络集中促销经营行为,上海市市...
日期:10-15
2将配备18GB LPDDR5X内存_“大哥”都没用上- 一加Ace
日前一加官方宣布,将于2月7日举行新品发布会,正式推出一加Ace 2新机,不出意外的话,这也是开工以来的首场新品发布会。随着发布会时间的日益临近,官方关于该机的预热也更加密集。...
日期:09-20
百度:二季度共计清理各类有害信息151.6亿余条_有害信息清理报告
10月25日 消息:近日,百度对外公布2023年第二季度信息安全综合治理数据。百度内容安全中心在二季度共计清理各类有害信息151.6亿余条。其中,通过人工智能技术挖掘并打击以淫秽...
日期:10-25
iPhone车祸检测又出问题:音乐节“太嗨”导致误报数翻5倍
快科技6月25日消息,近日,一年一度的波纳罗音乐节在美国田纳西州拉开帷幕,这场摇滚界的盛会吸引了超过8万人参加。但在现场观众为之兴奋,沉浸在音乐狂欢中的同时,田纳西州的救援人...
日期:06-25
ai头像插画「AI简笔画、百变AI头像、文生图....美图秀秀助力用户美学创作」
美图秀秀“AI绘画”自面世以来,得到全球用户的广泛认可。近日,美图秀秀“AI绘画”上线“文生图”功能,能够将用户输入的自然语言文本转换为图像,只要将想象画面的关键词以逗号隔...
日期:04-24
小米13 Ultra同款基材!Redmi K60至尊版搭载华星C7屏「小米k60至尊纪念版」
快科技8月11日消息,Redmi公布了K60至尊版的屏幕参数。蓝厂高端机型推荐该机采用第二代1.5K旗舰直屏,使用了华星最新的C7发光材料,功耗大幅降低。此前上市的小米13Ultra就是采用...
日期:08-11
iPhone终于有潜望式长焦了_苹果潜望式
光学变焦在成像方面的优点非常明显,虽然数码变焦可以达到6倍甚至更高的倍数,但是光学变焦可以实现更好的成像效果,这次iPhone 15升级潜望式长焦也将带来更好的拍摄表现。朋友圈...
日期:05-16
iqoo7正式发售「iQOO Neo7 SE正式官宣 12月2日全球首发天玑8200」
2022年11月25日,@iQOO手机今日宣布新一代“120W性能神机”——iQOO Neo7 SE正式开启全渠道预约,并将于12月2日(周五)隆重发布。令人惊喜的是,iQOO Neo7 SE将全球首发联发科天玑82...
日期:12-04
新表情包?腾讯申请新狗头图形商标_狗头表情包版权
10月9日消息,天眼查App显示,近日,腾讯科技(深圳)有限公司申请注册多个狗头形象图形商标以及“微信创意表情”商标,国际分类含广告销售、教育娱乐、通讯服务等,当前商标状态均为申请...
日期:10-21
研究机构:宁德时代是上半年全球第二大 EV 与 PHEV 电池供应商
  8 月 18 日消息,据国外媒体报道,宁德时代是全球重要的电动汽车电池供应商,他们已在全球建立四大研发中心、六大生产基地,向特斯拉等众多汽车制造商供应电池。   市场研...
日期:07-17
扎克伯格称应允许13岁以下儿童访问Facebook
腾讯科技讯(晁晖)北京时间5月21日消息,据国外媒体报道,Facebook首席执行官马克·扎克伯格(Mark Zuckerberg)本周表示,出于教育目的,年龄小于13岁的儿童应当允许访问该网站。扎克...
日期:07-28