您的位置:首页 > 媒体评论

AMD、Intel已用上Chiplet,英伟达落后了?_amd显卡比不过英伟达

发布时间:2023-01-17 02:05:04  来源:互联网     背景:

虽然摩尔定律已经逐渐走到尽头,但我们却来到了一个更加看点十足的时代,不同于以往每隔18个月靠工艺迭代带来的常规演变,以英特尔、英伟达和AMD为首的芯片巨头之间的竞争变得异常激烈。从英特尔、英伟达、AMD三家的产品布局来看,三家几乎都集齐了CPU、GPU甚至是DPU产品线。如今,他们正在酝酿更大的规划!

随着近日AMD推出CPU和GPU组合的下一代数据中心APU——Instinct MI300,自此,三家的“多PU组合”争斗战已然打响。在此之前,英特尔的Falcon Shores XPU混合搭配CPU + GPU,英伟达的Grace Hopper Superchip是Grace CPU + H100 GPU的组合,都是如出一辙。他们都在做一件伟大的事情:在一个芯片中集成CPU、GPU和AI加速器,最终成为一个类似APU的产品,目标是更广阔的超级计算市场。但是在实现方式上,英伟达落后了?

英特尔的XPU计划之一:Falcon Shores

首先来说下英特尔的XPU计划?XPU是指使用多种计算架构以最好地满足单个工作负载的执行需求的想法,这是英特尔过去几年来最感兴趣的一个方向。英特尔希望将X86和Xe结合起来用于超级计算/HPC市场。这也导致了英特尔开始研发从CPU、GPU个一些ASIC产品(如IPU、VPU、FPGA)等等各种产品。

在英特尔2022年年度投资者会议上,英特尔披露了一个代号为Falcon Shores的处理器新架构,它将x86 CPU和Xe GPU硬件组合到单个Xeon插槽芯片中,利用下一代封装、内存和 I/O 技术,为计算大型数据集和训练巨大 AI 模型的系统提供巨大的性能和效率改进。不过英特尔的目标似乎不仅仅是将CPU和GPU集成在一起,英特尔正在寻求为拥有绝对海量数据集HPC用户开辟市场——这种数据集无法轻松适应独立GPU相对有限的内存容量。

Falcon Shores的目标是在2024年推出,采用埃米级制程,这意味着它可能会使用Intel 20A或Intel 18A制造工艺制造。英特尔预计Falcon Shores在多个指标上比当前一代产品增长5倍,包括每瓦性能提高5倍,单个 (Xeon) 插槽的计算密度提高5倍,内存容量增加5倍,内存带宽增加5倍。

图源:pcper

英特尔表示,Falcon Shores的混合设计是通过使用tile(也称为小芯片)实现的,通过提供x86和Xe内核之间的灵活比例,这将使芯片制造商在设计过程的后期配置芯片方面具有更大的灵活性。

AMD发布Instinct MI300 APU

近日,AMD在CES 2023上披露了其下一代数据中心处理器Instinct MI300,被AMD称之为下一代数据中心APU。它采用了13个Chiplet,共有1460亿个晶体管,MI300可以说是AMD迄今为止最大的芯片。

该芯片的计算部分由九个5nm小芯片组成,它们包含CPU或GPU内核,但AMD没有详细说明每个小芯片的使用数量。这九个裸片被3D堆叠在四个6nm基础裸片之上,而且这些裸片是有源的中介层,可以处理 I/O和各种其他功能。从下图中可以清晰的看到,Instinct MI300中心芯片侧面的八个HBM3堆栈。

图源:Future

amd和英伟达的差距

MI300的关键优势除了将CPU内核和GPU内核放在同一设计中的操作简单性之外,还在于它可以让两种处理器类型共享一个高速、低延迟的统一内存空间。这将使在CPU和GPU两个核之间快速且轻松的传递数据,能让每个核处理他们最擅长的计算方面。此外,它还可以通过让两种处理器类型直接访问同一内存池,简化插槽级别的HPC编程。

当贝激光投影X3

但是MI300芯片并不是批量产品,因为其价格昂贵且相对稀缺,所以它们不会像EPYC Genoa数据中心CPU那样得到广泛部署。AMD预计将在2023年下半年交付Instinct MI300。但是,这一Chiplet的设计技术将会衍生出更多的变体。

英伟达Grace Hopper Superchip

不同于英特尔和英伟达采用Chiplet架构的做法,英伟达首款GPU+CPU组合——Grace Hopper Superchip还是单芯片的方式,下图是渲染图。

amd显卡比不过英伟达

Nvidia对其Grace Superchip的渲染图:两个带有RAM的处理器合二为一

NVIDIA®Grace Hopper架构将NVIDIA Hopper GPU与NVIDIA Grace™ CPU结合在一起,在单个超级芯片中连接高带宽和内存一致的NVIDIA NVLink Chip-2-Chip(C2C)®互连,并支持新的NVIDIA NVLink开关系统。

NVLink C2C是NVIDIA为超级芯片开发的内存相干、高带宽和低延迟互连。它是Grace Hopper超级芯片的核心,提供高达900 GB/s的总带宽。这比加速系统中常用的x16 PCIe Gen5通道的带宽高7倍。结合NVIDIA NVLink切换系统,所有运行在最多256个NVLink连接的GPU上的GPU线程现在都可以以高带宽访问高达150TB的内存。

NVIDIA Grace Hopper超级芯片逻辑一览(图源:英伟达)

英伟达表示,该超级芯片将为运行TB级数据的应用程序提供高达10倍的性能提升,英伟达已承诺在2023年上半年推出其超级芯片。

可以看出,英特尔、英伟达和AMD都开始在CPU+GPU组合上发力,他们所采用的方式:要么芯片继续平铺做大,要么拼3D堆叠、Chiplet、拼架构,目前从各家的CPU+GPU组合型产品推出的时间上来看,AMD和英伟达都在2023年,而英特尔将在2024年。软件支持方面,英特尔有oneAPI,英伟达有CUDA,AMD似乎还稍逊一些。而在架构方面,英特尔、AMD均已奔向3D Chiplet,但英伟达似乎仍在单芯片上努力。

英伟达何时拥抱Chiplet?

airpods pro拆机分解

Chiplet用于CPU已经不是新闻了,AMD多年来一直在其Ryzen和Epic等CPU处理器中使用Chiplet设计并取得了巨大成功。英特尔也于2023年1月11日正式发布了基于Chiplet设计的第四代至强CPU-Sapphire Rapids,它通过内置加速器将目标工作负载的平均每瓦性能提升了2.9倍,在优化电源模式下每个CPU节能可高达70瓦,将总体成本降低52%-66%。

但是就目前的情况来看,GPU也已迈入了Chiplet时代。如今英特尔和AMD已经均已发布了3D Chiplet CPU和GPU中的产品。而英伟达无论是GPU还是CPU似乎还在单芯片上努力,英伟达要落后了吗?

2023年1月11日,英特尔发布了其首款Chiplet小芯片封装的GPU,代号Ponte Vecchio,GPU Max系列单个产品整合47个小芯片,集成超过1000亿个晶体管。这是英特尔性能最高、密度最高的通用独立GPU。英特尔的这一芯片的具体性能对比情况暂未可知,但是我们暂且可以看看AMD与英伟达的GPU性能对比。

AMD最新一代的GPU Navi 31,是AMD第一款、也可以说是历史上第一个基于Chiplet设计的GPU,AMD的两款最新显卡Radeon RX 7900 XTX和Radeon RX 7900 XT均是基于Navi 31。其中,XTX是旗舰机型,拥有更多的shader处理器,更高的内存带宽,更多的显存,而XT则是有些弱化的版本。

如果我们将AMD的显卡和英伟达的RTX 4080作对比,AMD的GPU的性能非常接近英伟达的RTX 4080。据chipsandcheese的评测对比数据,如下图所示,英伟达的4080采用4nm制程,晶体管密度比AMD的低一些,面积也更大一些,但英伟达4080具有更高的SM数量,这意味着寄存器文件和FMA单元相比AMD要有更多的逻辑控制。英伟达还具有更简单的缓存层次结构的优势,它仍然提供相当大的缓存容量。

AMD 7900/6900与英伟达4080的比较(图源:chipsandcheese)

英伟达的GPU目前做法还是将所有的晶体管,都放在一个更大的单芯片上,采用尖端工艺4纳米节点。

而AMD的Navi 31基于Chiplet设计和先进的RDNA3架构。其裸片由GCD核(图形计算芯片)和 MCD内存小芯片(内存缓存芯片)组成。从下图可以清晰的看到,中间部分是5nm制程的GCD核,周围分别是6颗6nm制程的MCD,包含内存控制器和Infinity缓存。这说明,着色器处理器和其他单元比较获益于先进工艺,而对于内存控制器和缓存来说则不必需要使用最先进的工艺。

AMD Navi 31裸片(图源:AMD)

两种不同工艺的芯片组装在一起,所使用的尺寸更小,与此同时,Chiplet的设计方式使得晶圆的缺陷芯片数量也少的多,从这个意义上来说,Chiplet架构的使用降低了成本。Chiplet的设计还助于通过在图形芯片上使用更少的区域来实现VRAM连接,从而实现更高带宽的 VRAM 设置。但是也不是万利的,代价就是AMD必须支付更昂贵的封装解决方案,因为简单的封装走线在处理GPU的高带宽要求方面表现不佳。

此外,AMD Navi 31 GPU很重要的一项创新是Infinity Link总线,为何要说到这个呢?因为Chiplet的设计方式肯定会产生更多的延迟,而GPU是对延迟极其敏感的,所以AMD特意为此开发了全新的Infinity Link总线(即 Infinity Fanout Links 系统)来连接GDC和MCD部件,从而在GCD和MCD小芯片部件之间实现5.3 TB/s的带宽,这种超级先进的互连系统无疑是小芯片GPU设计的关键决定因素。

可以说,AMD的Navi 31为图形处理器世界带来了真正革命性的小芯片GPU设计,如果这一设计取得成功,那么未来GPU就可以不用依赖先进工艺来提升性能,而是通过堆叠更多的GCD来实现。GPU市场迎来新的战争。

索尼ps5日本售价

写在最后

3D IC设计逐渐成为了主流,Chiples也进一步崛起,在芯片大厂的推动下,基于Chiplet的3D IC设计进一步展示了其说服力。Chiplet将彻底改变这个行业。英伟达何时采用Chiplet,备受业界关注,不过估计也快了,毕竟黄仁勋已指出,"Moore's Law is dead" 。

感谢amd让我用上便宜的英伟达


返回网站首页

本文评论
棉花被和羽绒被哪个暖和_棉花被羽绒被羊毛被…什么被子最能温暖寒冬中的我?
渐渐入冬的夜晚,躺在床上,一句古诗弹幕般浮现在脑海里:布衾多年冷似铁,娇儿恶卧踏里裂。保暖的被子太重要了。问题是:你知道什么样的被子最保暖吗?在讲被子之前,有必要先说说保暖。...
日期:12-03
《流浪地球 2》竟然有十几种规格,这电影票该咋选?_流浪地球2上映日期
眼看着就快过年了,而作为过年期间一个不可或缺的娱乐项目 —— 看电影,最近被提及的频率也渐渐高了起来。春节档作为兵家必争之地,赶在这个时间点上映的电影可以说都是狠角色,尤...
日期:01-11
端侧ai是什么_端侧AI普及,到底卡在哪了?
“我们的AI芯片设计出来了,但是没多少人能用起来。”这是两三年前端侧AI芯片CEO们的烦恼。“面对十多款端侧AI芯片,选型就是一个难题。”一位AI应用的开发者在2022年依旧面对...
日期:10-19
不差钱的爱美客 深陷多元化焦虑_爱美客宏观分析
出品 | 子弹财观作者 | 晴天编辑 | 蛋总穷人的烦恼千篇一律,富人的烦恼五花八门。在热钱翻涌的资本市场中,“不缺钱”的爱美客并不淡定。8月24日,爱美客发布2022年上半年财报,上...
日期:08-31
2023开年脑洞之一:视频号拿下李子柒?_李子柒视频2020最
李子柒为视频号转基因。马化腾沙场点将,明示微信视频号商业化必须提速。而抖音快手的先发优势,意味着视频号无法按部就班,亟需出奇制胜。2023年,谁来为视频号踩下这至关重要的一...
日期:01-06
华为“不造车”的承诺,快到期了_华为不造车 为什么有效期三年
作者 | 飔痕导语:华为智选模式已经初获成功。接下来,华为会否撕下最后一层窗户纸、开始全面造车?从供应商,到全面主导近日,各大车企纷纷公布9月交付数据。引发市场广泛关注的,除了...
日期:10-23
马斯克成功了_马斯克把公开给他纠错的工程师开除了
“He’s”fired.”马斯克的裁员大戏还在继续,而最新的这“一集”,矛头直指一名在推特待了6年的工程师。甚至The Verge都这样描述:虽然马斯克已经开除了数千人,但最新的人事变动...
日期:11-24
2022年双12打了一个哑炮
原标题:今年双12打了一个哑炮今年双12在悄无声息中结束了,没一家电商平台公布自己的战报,就好像双12从来没来过一般。一个核心原因是,当前的物流还没完全通畅。不少消费者吐槽,即...
日期:12-14
英伟达ai绘画_人人都能用的“AI 作画”,要成为英伟达的杀手锏?
如果说2021年是“元宇宙”的元年,那么2022年或许就是“AI作画”的元年。稍微对互联网热点有所关注的人都不难发现,最近,“AI作画”产出的作品似乎已经成了一股互联网风潮。这些...
日期:10-27
探路3年、解散400名员工,亚马逊无人配送车为何关停?「一名亚马逊公司高管还表示,无人机配送将在5个月内实」
原标题:警钟!亚马逊无人配送车项目关停,探路3年、解散400名员工近期,亚马逊的无人配送车项目Scout突然宣布关停。而仅在4个月前,作为亚马逊无人交付计划中的一个重要明星项目,Scou...
日期:10-19
造出光刻机 其实不用急_光刻机造出来了吗
原创 陈俊一 亿欧网全文5826字,阅读约需12分钟文|陈俊一编辑 | 常亮题图 | unsplash最近,中国影视领域罕见的芯片创业题材电视剧《纵横芯海》宣布杀青。该剧讲述的,是集成电路产...
日期:09-29
售价百万的比亚迪,谁买?_比亚迪过百万的车
作者 | 黎明编辑 | 艾小佳酝酿了很久的比亚迪百万级新品牌仰望,终于正式发布了。在1月5日的发布会上,董事长王传福亲自出马,带来了仰望的首款车型U8,还发布了一款百万级超跑U9。...
日期:01-07
先涨价再打折_“先涨价再降价”老套路为何难禁止
作者/张涛漫画/陈彬10月24日晚8点,各大电商平台的“双十一”预售正式开启,今年“双十一”大促进入实质性阶段。近日有网友发现某平台在售的手机在悄然涨价。山东的沈女士爆料...
日期:10-30
零跑汽车IPO:研发投入不足,如何画圆全域自研的大饼?_零跑汽车计划IPO
作者:鲁镇西2022年9月,多家造车新势力公布了8月交付数据。埃安、哪吒、零跑位列交付量前三名,同样位列同比增速前三名,分别为27021辆、16017辆、12525辆。从排名不难发现,造车新...
日期:09-24
冲刺69亿 巨头们的NFT生意上路了「NFT怎么投资」
原标题:冲刺10亿美金 巨头们的NFT生意上路了越来越多的全球行业巨头,打起了NFT的主意。Meta(全球最大的社交平台)、Ticketmaster(美国最大的票务平台)、耐克(全球最大的运动品牌)、N...
日期:09-06
修复 7 处“高”等级漏洞,Mozilla 电子邮件客户端 Thunderbird 102.6.0 发布更新
  12 月 15 日消息,Mozilla 近日推出了 Thunderbird 102.6.0 版本更新。本次更新修复了 7 处安全漏洞,这些漏洞均标记为“High”(高),是仅次于“critical”(关键)级别的漏洞。 ...
日期:12-16
变着花样割韭菜?电商主播转型带货NFT_眼下,直播带货风头正劲,成为电商圈
“NFT就像买画,”David在Twitter的聊天室Spaces中告诉听众,“你们要成为能发现梵高的人。”无线电铁路频率用NFT持有者的财富神话做铺垫,David适时引出了直播的主角:某项目新上...
日期:08-29
蜜雪冰城三年赚30亿的秘密 藏在加盟商的账单里「蜜雪冰城加盟费明细表利润」
文 | 豹变,作者 | 张梦依,编辑 | 刘杨3元的冰淇淋,4元的柠檬茶,6元一杯的珍珠奶茶,蜜雪冰城不仅攻占了下沉市场,也用实力证明了新式茶饮“下沉之王”的吸金能力。9月22日晚间,证监...
日期:09-28
扒一扒,中国芯片产业都缺哪些人才?_制造芯片中国还缺什么
文 | 文 | MIR睿工业 前段时间看到央视采访深圳一位微电子公司的董事长称:“以前招一个人才,假设要 40 万,现在就要 120 万才能招聘到他们认为具有相同能力的人,大概整个行业...
日期:12-10
Stadia关闭 谷歌把寒气传递给腾讯、网易
纵然早在预料之中,但谷歌突然宣布关闭旗下云游戏服务Stadia的消息,还是让人猝不及防。9月29日,Stadia副总裁兼总经理菲尔·哈里森(Phil Harrison),在谷歌官方博客上发表文章宣布,St...
日期:10-10