您的位置:首页 > 互联网

英特尔披露至强6处理器针对Meta Llama 3模型的推理性能_intel至强系列处理器

发布时间:2024-04-24 01:16:15  来源:互联网     背景:

通信世界网消息(CWW)近日,Meta重磅推出其80亿和700亿参数的Meta Llama 3开源大模型。该模型引入了改进推理等新功能和更多的模型尺寸,并采用全新标记器(Tokenizer),旨在提升编码语言效率并提高模型性能。

在模型发布的第一时间,英特尔即验证了Llama 3能够在包括英特尔®至强®处理器在内的丰富AI产品组合上运行,并披露了即将发布的英特尔至强6性能核处理器(代号为Granite Rapids)针对Meta Llama 3模型的推理性能。

英特尔至强处理器可以满足要求严苛的端到端AI工作负载的需求。以第五代至强处理器为例,每个核心均内置了AMX加速引擎,能够提供出色的AI推理和训练性能。截至目前,该处理器已被众多主流云服务商所采用。不仅如此,至强处理器在进行通用计算时,能够提供更低时延,并能同时处理多种工作负载。

事实上,英特尔一直在持续优化至强平台的大模型推理性能。例如,相较于Llama 2模型的软件,PyTorch及英特尔® PyTorch扩展包(Intel® Extension for PyTorch)的延迟降低了5倍。这一优化是通过Paged Attention算法和张量并行实现的,这是因为其能够最大化可用算力及内存带宽。下图展示了80亿参数的Meta Lama 3模型在AWS m7i.metal-48x实例上的推理性能,该实例基于第四代英特尔至强可扩展处理器。

 

intel至强

图1:AWS实例上Llama 3的下一个Token延迟

不仅如此,英特尔还首次披露了即将发布的产品——英特尔®至强® 6性能核处理器(代号为Granite Rapids)针对Meta Llama 3的性能测试。结果显示,与第四代至强处理器相比,英特尔至强6处理器在80亿参数的Llama 3推理模型的延迟降低了2倍,并且能够以低于100毫秒的token延迟,在单个双路服务器上运行诸如700亿参数的Llama 3这种更大参数的推理模型。

 图2:基于英特尔®至强® 6性能核处理器(代号Granite Rapids)的Llama 3下一个Token延迟

苏宁海信99嗨购盛典

考虑到Llama 3具备更高效的编码语言标记器(Tokenizer),测试采用了随机选择的prompt对Llama 3和Llama 2进行快速比较。在prompt相同的情况下,Llama 3所标记的token数量相较Llama 2减少18%。因此,即使80亿参数的Llama 3模型比70亿参数的Llama 2模型参数更高,在AWS m7i.metal-48xl实例上运行BF16推理时,整体prompt的推理时延几乎相同(该评估中,Llama 3比Llama 2快1.04倍)。

至强六核

高通5nm芯片为什么韩国不首发

intel 至强 2021

开发者可在此查阅在英特尔至强平台上运行Llama 3的说明。

产品和性能信息英特尔至强处理器:

在英特尔®至强® 6处理器(此前代号Granite Rapids)上进行测试,使用2个英特尔®至强® Platinum,120核,超线程开启,睿频开启,NUMA 6,集成加速器可用[已使用]:DLB[8],DSA[8],IAA[8],QAT[8],总内存1536GB(24x64GB DDR5 8800 MT/s[8800 MT/s]),BIOS BHSDCRB1.IPC.0031.D44.2403292312,微码0x810001d0,1x以太网控制器I210千兆网络连接1x SSK存储953.9G,Red Hat Enterprise Linux 9.2(Plow),6.2.0-gn r.bkc.6.2.4.15.28.x86_64,基于英特尔2024年4月17日的测试。

关于股东权益变动的提示性公告

在第四代英特尔®至强®可扩展处理器(此前代号Sapphire Rapids)上进行测试,使用AWS m7i.metal-48xl实例,2个英特尔®至强® Platinum 8488C,48核,超线程开启,睿频开启,NUMA 2,集成加速器可用[已使用]:DLB[8],DSA[8],IAA[8],QAT[8],总内存768GB(16x32GB DDR5 4800 MT/s[4400 MT/s]);(16x16GB DDR5 4800 MT/s[4400 MT/s]),BIOS亚马逊EC2,微码0x2b0000590,1x以太网控制器弹性网络适配器(ENA)亚马逊弹性块存储(EBS)256G,Ubuntu 22.04.4 LTS,6.5.0-1016-ws,基于英特尔2024年4月17日的测试。

飞书开放平台


返回网站首页

本文评论
马云从东京教书回来了!现身杭州围观阿里数学竞赛,与参赛选手、命题老师畅谈数学
据蓝鲸财经,6月17日下午,2023阿里巴巴全球数学竞赛决赛开赛,阿里巴巴创始人马云来到杭州现场观赛。今年来自全球19个国家的685位选手,从5万多名参赛者中脱颖而出,晋级时长8小时的...
日期:06-19
南方卫星导航:珠峰测量展现国产测绘仪器装备实力_卫星定位测量技术
  5月30日下午4点,广州市人民政府新闻办公室于广州图书馆举办广州市第117场疫情防控复工复产新闻采访活动(广州市科技系统代表媒体座谈会),邀请南方测绘、广州呼吸健康研...
日期:07-14
英伟达高管抛售1.8亿美元股票 月度减持创下6年新高_英伟达股价创新高
12月5日 消息:近期,虽然大多数企业内部人士纷纷押注于自家公司股票,但与此不同的是,作为标准普尔500指数表现最佳的英伟达公司却迎来了高管们的疯狂套现潮。根据最新数据显示,在...
日期:12-05
MWC 2024 | 长飞全光联接新价值高峰论坛抢鲜看_长飞光纤百度百科
MWC 2024 | 长飞全光联接新价值高峰论坛抢鲜看 通信产业网|2024-02-22 11:11:42作者:通文来源:通信产业网2月26-29日小米成立时的13个人小米一英寸大底2024 MWC巴塞罗那开幕在...
日期:02-22
iOS 18代码确认!iPhone 16共四款新机:搭载A18/Pro处理器_苹果处理器a16
快科技12月21日消息,每年6月份苹果都会发布全新系统,目前iOS 18等的新一代系统已经在准备中。根据最新爆料,iOS 18代码中发现了iPhone 16系列,确认依然是四款的组合:D47 iPhone...
日期:12-21
聚焦新氦类脑智能公益属性平台 深聪吴耿源谈AIoT最佳共赢模式(新氦类脑智能科技)
  “人们总是高估了未来一到两年的变化,低估了未来十年的变革。”   ——比尔 盖茨   从2017到2018人们见证了AI技术井喷式爆发。2017年被《华尔街日报》、《福布斯...
日期:02-15
e5屏幕的手机有哪几款「手机e5屏和e4屏区别对比 手机e5屏和e4屏哪个好」
手机e5屏和e4屏哪个好?其实这两种屏幕各有特点,要看大家自己如何去取舍了。e5屏采用了棱镜排列效果,在正面屏幕全局亮度上更加友好。而e4屏则具有更加护眼的优点。接下来一起看...
日期:02-29
360旗下招聘网_联手9大招聘平台,360智慧商业开启黄金招聘季
  虽然充满不舍,但打工人们也都再次鼓起勇气,和春节长假作别。从充满烟火气的家乡,回到高耸写字楼里那属于自己的工位上。在还没想起“我过年之前是干什么的?”之前,新的需求...
日期:07-16
关于组织开展北京“网络与数据安全”和“‘双千兆’网络优秀设计暨工程”典型案例征集工作的通知
通信世界网消息(CWW)近日,北京市通信行业协会发布《关于组织开展北京“网络与数据安全”和“‘双千兆’网络优秀设计暨工程”典型案例征集工作的通知》。通知如下。各相关单位:...
日期:06-09
美团财报q3「美团Q2财报背后:本地生活进入新周期,迎来新路径」
  记者:Esther  8月26日,美团发布2022年第二季度及半年度业绩。今年第二季度,美团实现营收509亿元,同比增长16.4%;净亏损11.2亿元,同比收窄67%,好于市场预期的32.4亿元亏损;调整...
日期:09-05
Udio官网体验入口 AI音乐创作分享社交平台使用地址_audiodown官网
Udio是一个音乐发现、创作和分享的平台。用户可以在这里发现新的音乐作品,上传自己的创作分享给他人,并与其他音乐爱好者互动交流。该平台提供免费使用,同时也有付费高级服务供...
日期:04-10
黄 英伟达「英伟达黄仁勋:华为是AI芯片领域的强大竞争对手之一」
通信世界网消息(CWW)周三,黄仁勋在新加坡接受采访时表示,华为、英特尔和不断壮大的半导体初创公司对英伟达在人工智能加速器市场的主导地位构成了严峻挑战。“我们在中国内外都...
日期:12-07
OPPO明日将发千亿参数安第斯大模型:对话能力获提升_oppo安第斯事业部工作地点
快科技11月15日消息,据媒体报道,OPPO将于明日发布个人专属、对话增强的安第斯大模型(AndesGPT),这是基于千亿参数的对话增强语言模型。OPPO明日将会在上海世博中心举行OPPO开发者...
日期:11-16
LinkedIn首席运营官谈2024年:人工智能将使我们的日常生活更轻松_linkedin networking
**划重点:**联想出新款手机1. 跨越凛冽寒冬,传统家电业巨头康佳逆市上涨的原因...
日期:12-19
三足鼎立、群雄环伺,本地生活“乱战门”开启_乱战啥意思
声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:大可,授权转载发布。近十年来,本地生活赛道的狼烟从未熄灭,从美团全方位布局“吃喝住行娱”,到口碑等平台深耕细分领域,...
日期:05-05
可减少折痕,三星 Galaxy Z Fold 5 将采用“水滴状”铰链设计_三星Fold折痕越用越明显
IT之家 1 月 16 日消息,根据韩媒 Naver 报道,三星计划为 Galaxy Z Fold 5 采用“水滴”状的铰链设计,在折叠状态下提供更柔和的曲线,从而减少屏幕折痕,降低屏幕开裂的风险。三星...
日期:01-16
夏普手机拍照怎么样「一英寸大底徕卡相机!夏普发布AQUOS R8 Pro手机」
快科技5月9日消息,今天,夏普推出了与徕卡合作的AQUOS R8 Pro手机。高通骁龙arm据悉,AQUOS R8 Pro搭载骁龙8 Gen2处理器,最高支持12GB LPDDR5内存 256GB存储。一加手表nord什么时...
日期:05-09
上任把火!马斯克完成收购推特 开除多名高管「马斯克退出推特」
10月28日 消息:27日,特斯拉CEO马斯克正式收购了社交媒体公司Twitter,收购金额为440亿美元。入主推特后,马斯克做的第一件事就是开除多名高管,冻结并检查所有代码。目前,马斯克已...
日期:11-02
九号公司荣获2023造物者“年度产品品质创新大奖”,创新科技成就国民出行品牌
12 月 15 日,由TopMarketing、新消费造物者、金触点主办,DigitialWay联合主办的“ 2023 造物者·产品创新大奖”颁奖盛典在北京举行。其中,九号公司旗下智能电动两轮车“九号电...
日期:12-20
网友提问特斯拉FSD何时进入中国 马斯克:可能很快就会实现_特斯拉fsd何时在中国开放
快科技4月21日消息,据媒体报道,近日一位中国网友询问特斯拉FSD何时进入中国市场。据悉,该车主表示期待特斯拉FSD(完全自动驾驶)早日在中国上市,并关注HW3.0系统的进展以及新的倒车...
日期:04-21