您的位置:首页 > 互联网

AMD Zen4架构深入揭秘!49%性能提升从何而来?「amd zen4处理器」

发布时间:2022-10-11 03:58:53  来源:互联网     背景:

AMD锐龙7000系列的性能大家都见识过了,提升幅度可能没有预想得那么猛,但依然诚意十足。锐龙9 7900X作为次旗舰,就足以碾压12代酷睿顶级灰烬版i9-12900KS。主流的锐龙5 7600X更是再次展现爆款潜质,直接让i5-12600K抬不起头来。

至于和Intel 13代酷睿究竟鹿死谁手,还要到这个月底才能见分晓了。

按照AMD的官方数据,Zen4相比于Zen3,同等性能下功耗可降低至多62%,同等功耗下性能可提升至多49%!

今天,我们就来深入了解一下Zen4架构、平台的革新之处,看看如此巨大的提升是从而来的。

一、全新的Zen4内核:前端大变、不一样的AVX-512

先从Zen架构的历史讲起

Zen4已经是AMD Zen系列架构的第四代(Zen/Zen+算作一代),对比来看它的改革、提升幅度都不是最大的,更多的是在Zen3基础上的一次深度优化增强,并在新工艺的加持下大幅提升频率,最高加速频率不但首次突破5GHz,而且跨越性地达到了5.7GHz!

中国芯片如何突破

对比四代架构,初代Zen的变革、提升幅度最猛(当然主要是推土机实在太弱了),Zen2是一次优化升级,尤其chiplet设计奠定未来基础,Zen3则是再一次革命性的大变,19% IPC提升也非常感人,Zen4再来个小步快跑就非常符合情理和逻辑了。

我们身边的日货

amd架构zen3

按照AMD的说法,Zen4架构的设计目标有三个方面:

amd处理器架构zen3

一是性能,IPC(每时钟周期指令数或同频性能)和频率提升幅度都要达到两位数(超过10%);

二是延迟,通过增大二级缓存、改进缓存有效性,大幅降低平均延迟;

三是能效,在整个TDP(热设计功耗)范围内,显著降低动态功耗。

为了达成以上目标,Zen4对整个微架构体系进行了升级优化,包括前端、执行引擎、载入/存储单元、缓存、指令集等等,后边我们会一一讲到。

整体而言,Zen4架构的核心升级点包括:改进分支预测、增大OP指令作缓存、增大指令退役队列、增大整数/浮点寄存器文件、加深核心缓冲吞吐、浮点单元支持AVX-512指令、改进载入/存储单元、增大二级缓存。

前端部分变化较大,这里包括指令缓存、分支预测、解码器、指令缓存、微指令队列等模块。

Zen4架构重点改进了分支预测部分,包括每时钟周期预测两个跳转分支、一级缓存BTB(分支目标缓冲)增大50%达到1.5K条目、二级缓存BTB扩容从6.5K略增至7K。

另外,指令缓存(Op Cache)增大了约68%达到6.75K条目,每时钟周期可以完成多达9个宏指令(增加1个)。

不变的则是解码器每时钟周期发出4条指令、微指令队列每时钟周期分派6个整数+浮点指令。

执行引擎部分变化较小,尤其是每时钟周期10次整数、6次浮点的指令分派保持不变。

指令退役队列或者说ROB(重排序缓冲)从256条目增大25%至320条目,整数寄存器从192个增至224个,浮点寄存器从160个增至192个,缓存与核心之间的吞吐能力也提升了。

载入/存储单元部分,载入队列从72个增大至88个(22%),存储队列维持64个不变,二级缓存DTLB(数据页表缓冲)从2K条目增大了多达50%至3K条目,另外还减少了数据缓存端口的冲突几率。

也许有同学会问,很多模块都是不断增大、再增大,为什么不一步到位,从设计之初就做个大容量呢?

amd的zen4架构

一方面,谁也无法精准预测每个模块多大容量下效率最好,而且不同模块之间需要彼此协调配合;

另一方面,更大容量意味着更多晶体管、更大核心面积、更高功耗、更高成本,需要在性能、能效之间做出妥协、寻求平衡。

缓存体系也做了优化,尤其是二级缓存,不但容量翻了一番,每核心来到1MB,还提升了速度。

同时,从二级缓存到三级缓存、从三级缓存到内存,都支持更多命中失败(outstanding miss),可以减少流水线的停顿,增加缓存回填带宽,提升整体效率。

不过整体缓存架构没变,一级缓存依然是32KB+32KB的每核心容量组合,三级缓存则继续每8个核心一组共享32MB。

AVX-512指令集或许是大家对Zen4最感兴趣的地方之一,毕竟在以往这是Intel处理器的专属技术,而且争议非常大,有人觉得它非常有用,有人觉得它只是徒增功耗,甚至成为极限烤机专用

Zen4支持的AVX-512并非直接将Intel那套技术照搬过来(也不允许),而是选择了不一样的实现方式。

lightank投影仪w100重装系统

Intel处理器执行AVX-512指令时,是完整的512-bit通道(这也是该指令集命名的来源),但是AMD走的是256-bit通道,也就是砍了一半,因此遇到512-bit的指令就需要拆分成两个256-bit指令来执行。

事实上,AMD推土机家族、Zen家族在执行AVX-2 256-bit指令的时候,也是拆分成两个128-bit。这都是一脉相承的

AMD表示,这么做可以节省芯片面积,并且避免执行AVX-512指令时发热过大、频率下降的情况出现(峰值性能确有轻微损失),因为真正长达512-bit的指令并不多,就像以前256-bit的指令不够多。

Zen4支持的AVX-512指令一览并不是把Intel的全都搬了过来,而是选择性地加入,除了一些基础指令,特别值得注意的是用于AI加速的VNNI、BF16,这也是Intel之前宣传的重点。

VNNI是面向AI模型推理的矢量指令,可将多个8-bit或16-bit整数串联成512-bit,提升卷积神经网络常用的MAC(乘法累加)的速度。

另一个是BF16,面向AI加速,将双精度浮点FP32中的23位小数减少到7位,并保留1位符号、8位指数,结果与FP32相比范围相同,只是精度较差,但仍远高于单精度FP16。

按照AMD的说法,加入AVX-512指令集后,Zen4架构的FP32浮点推理多线程性能可提升1.31倍,VNNI INT8整数推理多线程性能可提升2.47倍!

另外,Zen4还增加了一些虚拟化、安全性方面的新指令,就不赘述了。

以上是Zen4、Zen3的具体变化对比,可以看到其中不少都维持不变,其他很多则只是数量/容量上的扩充,因此说Zen4就是个放大优化版的Zen3也没什么毛病。

值得注意的是,Zen4二级缓存、三级缓存的延迟甚至还略微加大了。

AMD宣称,Zen4 IPC平均提升了13%,这是在固定4GHz八核心情况下,通过22个项目对比Zen3得出的几何平均结果。

当然不同项目的变化幅度差异很大,比如说CPU-Z单线程只提升了1%(所以这个测试项目跑分变化不大),寒霜引擎游戏、《GTA V》、PUBG吃鸡、CineBench R23单线程这些项目提升也有限。

wPrime 1024M是变化最大的提升幅度达惊人的39%,另外像是Dolphin Web测试和《看门狗:军团》、《F1 2022》、《杀出重围:人类分裂》、《地铁:离去》等游戏的提升也很喜人。

13%的提升进一步划分,可以看到前端架构改进带来的提升幅度最大,其次是载入/存储单元、分支预测单元,而来自执行引擎、二级缓存的贡献相对较小。

这和前边架构分析的变化幅度是相符合的。

IPC提升之外,锐龙7000系列的频率也达到了前所未有的高度,旗舰锐龙9 7950X最高可以加速到5.7GHz(还有个5.85GHz fMax频率但官方一直保持缄默)。

当然,5.7GHz的频率只有单核心加速可以做到,AMD也公布了锐龙9 7950X在不同核心/线程下的最高加速频率,可以看到2核心可以到5.6GHz,8核心可以接近5.4GHz,16核心全开也能到5.2GHz。

13% IPC提升,加上频率拉到最高5.7GHz,锐龙7000的单线程性能提高了最多29%。

一个很容易被忽略的点,就是锐龙7000系列支持Eco模式,运行在更低的TDP,比如170W的可以低至105W或者65W,105W的可以低至65W。

AMD宣称,锐龙9 7950X 65W Eco模式下的性能,依然可以超过正常的锐龙9 5950X。

Eco模式未来会集成在主板BIOS的超频模块,可一键开启,还会集成在锐龙Master软件中。

有趣的是,得益于新的架构和工艺,Zen4单个核心加二级缓存总面积仅为3.84平方毫米,相比于Intel 7工艺的12代酷睿的7.46平方毫米,小了几乎一半,能效则高了几乎一半。


返回网站首页

本文评论
微软漏洞补丁_黑客攻击代码已公布 微软Windows新补丁再受挑衅
  月20日消息,据国外媒体报道,微软去年Pwn2Own黑客大赛上发现的漏洞,在9个月后终于得到了修补,但是短短一天过后,就有研究者公布了新的Windows补丁的攻击代码。   这个被微...
日期:07-26
欧洲中东和非洲将享受到微软公司的云产品_欧洲中东和非洲将享受到微软公司的云产品优势
  据国外媒体报道,在欧洲,中东和非洲的公司将可以通过Logica享受到微软公司的云产品。目前,包括Talentsoft, Backelite和Ventadis在内的公司已经开始使用这项服务,并与一些成...
日期:07-25
马斯克计划按原价收购推特公司 推特股票飙升「马斯克的推特是多少」
  据美国多家媒体报道,当地时间10月4日,在特斯拉首席执行官马斯克计划以此前协议原价,即每股54.20美元的价格收购推特公司后,推特当天股价飙升15%,并在飙升后停牌。因马斯克此...
日期:10-05
“躺赢”的张朝阳手里还剩什么牌
头图摄影|史小兵 苹果用户忠诚度  文/赵东山  编辑/李薇  看起来几近“躺平”状态的搜狐,成了少数“躺赢”的互联网公司之一。  “我先(将直播课)分享到几个社交平台,...
日期:09-29
官宣:Android 13正式开源 源代码公开!华为等随便用「华为参与安卓源代码」
  新酷产品第一时间免费试玩,还有众多优质达人分享独到生活经验,快来新浪众测,体验各领域最前沿、最有趣、最好玩的产品吧~!下载客户端还能获得专享福利哦!  Android是开源的...
日期:10-01
CPU-Z 1.89发布:首次支持中国兆芯处理器(cpuz1.94)
  时隔四个多月之后,CPU处理器和相关硬件检测的第一权威工具CPU-Z发布了最新的1.89版本,首次加入了对中国兆芯处理器的支持。   官方还特意为此发布了短新闻,表示CPU-Z支...
日期:10-14
荣耀V40保值换新套餐受追捧 26日再次开售_荣耀v40保价
  日前,备受期待的荣耀V40正式发布,同时荣耀携手京东,推出了荣耀V40保值换新套餐,加99元就能享受保值换新服务,引发网友抢购热潮。现在,为了给更多人谋福利,第二批荣耀V40保值换...
日期:05-14
诸侯林立、短兵相接:新能源车打响「全面战争」
文章目录 01后来者来势汹汹 声明:本文来自微信公众号“深响”(ID:deep-echo),作者:肖卓,授权转载发布。鸿蒙系统目前装机量“似乎很少有人意识到,中国在可再生能源发电和电动汽车...
日期:10-11
资深果粉分享:iPhone14 Pro的升级和槽点_iphone11promax升级ios14.4怎么样
随着每年9月的“科技春晚”的落幕,今年的新款iPhone 也公诸于世。作为果粉的我,也第一时间入手了iPhone 14 Pro 银色版。使用了一段时间沉浸在新机的喜悦同时,来分享一些我对新...
日期:10-14
双品牌中标:以问题为导向的改革探索(公开招标采购形式中,关于同一品牌)
  鼓励竞争和保障公平是政府采购制度的灵魂,也是市场经济的应有之义。十九大报告再次强调, “让市场在资源配置中起决定性作用,更好发挥政府作用”。由市场决定价格,这既是市...
日期:06-07
redmi k30 5g发售价_Redmi K30 5G 6GB内存版开售
  (原标题:1999元起,:骁龙765G+120Hz流速屏)   1月14日消息 今日上午,Redmi K30 5G手机6GB版本正式开售,8GB+128GB版也同步开售,搭载高通骁龙765G处理器,配备索尼6400万前后六...
日期:01-20
投资超10年,腾讯突然割肉影视巨头!合计8000多万股,曾多次增资!
查看最新行情   文/吴志   继海澜之家、京东、步步高之后,又一家上市公司遭遇了腾讯减持。这一次是A股影视巨头华谊兄弟(300027)。   8月5日晚间,华...
日期:08-07
截至目前,中国移动全球网络_全球移动通信系统协会报告:全球四分之三手机产自中国
  1月10日消息 据外媒报道,全球移动通信系统协会(GSMA)信息组织1月7日在美国拉斯维加斯消费电子展发布报告《设备的未来》,报告显示全世界四分之三的手机在中国生产。此外,...
日期:05-22
海南猛推新能源汽车:电动汽车充电量达标直接发钱_海南新能源汽车充电收费
  据海南省工业和信息化厅 3 月 30 日消息,为贯彻落实《海南省清洁能源汽车发展规划》,加快新能源汽车推广应用,确保 2022 年海南省新能源汽车在新增车辆中占比超过 30%,促进...
日期:03-25
华为发布2020上半年财报 强势增长源于京东鼎力支持(华为公司2020年上半年财报)
  7月13日晚,华为低调发布2020年上半年财报。财报显示,华为三大业务齐头并进,实现销售收入4540亿元,同比增长13.1%,净利润率增长9.2%。其中,消费者业务收入为2558亿元,同比增长1...
日期:07-14
三川智慧董事长一行莅临摩天之星参观考察_三川智慧高管
  2020年11月,三川智慧科技股份有限公司董事长李建林和董事会成员郑田田一行莅临摩天之星参观考察。摩天之星董事长李厚德先生于总部地王大厦39楼,热情接待了这次来访。  ...
日期:07-16
“黑客”攻击服务器伺机敲诈被警方抓捕_公司系统被黑客攻击勒索
  两名“90后”男青年,为了钱财竟然扮起“黑客”,攻击中小公司服务器伺机敲诈。近日,福田警方专程前赴上海抓获两嫌疑人。   9月29日18时许,深圳某医院的一名员工到福田公...
日期:07-24
数百贴吧参与“爱心包裹”行动   互联网成最大公益平台
  日前,一场旨在动员全社会力量捐购装有文具及体育用品的“爱心包裹”的公益接力行动,正在全球最大中文社区平台贴吧如火如荼展开。截至目前,百度为“爱心包裹”活动搭建的...
日期:07-29
苏宁美的首批反向定制洗衣机发布,C2M计划引爆家电市场
  1月1日,苏宁美的联手打造的C2M反向定制新品正式开售,包括小天鹅水魔方系列洗衣机、比佛利国米定制洗衣机。这也是苏宁易购“冰箱洗衣机C2M反向定制”20年计划的重要开端...
日期:07-23
网易财报2020q2_一图看懂网易Q2财报:营收232亿元,Non-GAAP净利润54亿元
西门子是诺基亚的吗数字化核心技术   讯 北京时间8月18日下午消息,网易(Nasdaq: NTES;HKEX: 9999)今日发布了截至6月30日的2022年第二季度财报。财报显示,网易第二季度净营收为...
日期:08-20