您的位置:首页 > IT热点资讯

英特尔详细介绍Ponte Vecchio 性能可达英伟达A100平台的2.5倍_Ponte Vecchio intel

发布时间:2022-08-23 15:08:32  来源:互联网     背景:

在 Hot Chips 34 大会期间,英特尔再次详细介绍了 Sapphire Rapids HBM 处理器 + Ponte Vecchio(2-Stack)GPU 平台的潜力,称该服务器平台的性能可达英伟达 A100 竞品的 2.5 倍。英特尔首席 GPU 计算架构师 Hong Jiang 在演讲中指出,Ponte Vecchio 具有三种配置。

从单一 OAM、到配备 Xe Links 的 x4 子系统,Ponte Vecchio GPU 不仅能够单独运行、也可部署于 Sapphire Rapids 双路服务器平台之上。

Ponte Vecchio intel

其中 OAM 支持 4 GPU 和 8 GPU 平台的 all-to-all 拓扑,辅以英特尔 oneAPI 软件堆栈。

Ponte Vecchio intel

作为一个零级(Level Zero)API,其为跨架构编程支持提供了低层级的硬件接口。

Ponte Vecchio intel

oneAPI 主要特性如下:

● 提供面向其它工具和加速器设备的接口;

● 支持精细的增益控制、以及低延迟的加速器特性;

● 具有多线程设计;

● 将 GPU 作为驱动程序的一部分而提供。

Ponte Vecchio intel

性能指标方面,2-Stack Ponte Vecchio GPU 配置(如单一 OAM 上的配置),可提供高达 52 TFLOP 的 FP64 / FP32 算力。

Ponte Vecchio intel

另有 419 TFLOP 的 TF32(XMX Float 32)、839 TFLOP 的 BF16 / FP16,以及 1678 TFLOPs 的 INT8 算力。

Ponte Vecchio intel

索尼x90j 4khdr

英特尔还详细说明了 Ponte Vecchio 的缓存大小 / 峰值带宽 —— 比如 GPU 上的寄存器为 64 MB,提供 419 TB/s 的带宽。

Ponte Vecchio intel

L1 缓存也为 64 MB,带宽 105 TB/s(4:1)。L2 缓存为 408 MB,带宽 13 TB/s(8:1)。HBM 内存池高达 128 GB,辅以 4.2 TB/s(4:1)的带宽。

Ponte Vecchio intel

以下是英特尔为 Ponte Vecchio 配备的系列计算效率(compute efficiency)技术。

Ponte Vecchio intel

Register File(寄存器文件):

● Register Caching(寄存器缓存)

● Accumulators(累加器)

Ponte Vecchio intel

L1 / L2 Cache:

● Write Through(直写)

● Write Back(回写)

● Write Streaming(流式写入)

● Uncached(不缓存)

Ponte Vecchio intel

Prefetch(预取):

● 支持 L1 和(或)L2 缓存的软件(指令)预取;

● 支持到 L2 获取指令和数据的 Command Streamer 预取。

Ponte Vecchio intel

英特尔解释称,更大的 L2 缓存,可为 2D-FFT 和 DNN 等工作负载带来巨大的效益,并且分享了完整 Ponte Vecchio GPU 和 80 / 32 MB 模块之间的一些性能比较。

Ponte Vecchio intel

此外英特尔搬出了运行 CUDA 和 SYCL 的英伟达 Ampere A100,与使用 SYCL 的 Ponte Vecchio GPU 平台展开了性能横比。

Ponte Vecchio intel

在 miniBUDE(一种可预测配体与目标结合能的计算工作负载)中,Ponte Vecchio GPU 模拟测试结果的速度,更是 Ampere A100 的 2 倍。

Ponte Vecchio intel

另外在 ExaSMR 核反应堆设计仿真设计中,英特尔 Ponte Vecchio GPU 也以 1.5 倍领先于英伟达竞品方案。

Ponte Vecchio intel

不过需要指出的是,英伟达早已向市场投放了性能更加强悍的 Hopper H100,所以英特尔这里拿 Ampere A100 进行比较还是相当投机取巧的。

Ponte Vecchio intel

言归正传,英特尔概述了 Ponte Vecchio 旗舰数据中心 GPU 的一些关键特性,例如 128 个 Xe 内核、128 个光追(RT)单元、HBM2e 显存、以及连接到一起的 8 个 Xe-HPC GPU 。

Ponte Vecchio intel

该芯片在两个独立的堆栈中提供了高达 408 MB 的 L2 缓存、之间通过 EMIB 互连,且各部分芯片混用了 Intel 7 和台积电 N7 / N5 等多个工艺节点。

Ponte Vecchio intel

由两块(2 Tiles)组成的每个堆栈有 16 裸片,最大的 active die 尺寸为 41 m㎡、Compute Tile 则是 650 m㎡ 。

Ponte Vecchio intel

以下是 Ponte Vecchio GPU 的完整小芯片 / 工艺节点描述:

● 英特尔 7nm

中国电信2021年天翼网关4.0集中采购项目

● 台积电 7nm

● Foveros 3D 封装

● EMIB 互连

● 10nm 增强型 Super Fin

● Rambo Cache

● HBM2 高带宽显存

Ponte Vecchio intel

以下是英特尔 Ponte Vecchio 芯片的 47 块(Tiles)组成:

● 16 个 Xe HPC(内/外部)

surface 更新系统

● 8 个 Rambo Cache(内部)

● 2 个 Xe Base(内部)

● 11 个 EMIB(内部)

● 2 个 Xe Link(外部)

● 8 个 HBM(外部)

Ponte Vecchio intel

Ponte Vecchio GPU 使用了 8 个 HBM 8-Hi 堆栈,总共包含 11 个 EMIB 互连,完整封装尺寸为 4843.75 m㎡ 。

Ponte Vecchio intel

设计中还提到了高密度 3D Forveos 封装的 Meteor Lake CPU,可知其 bump pitch 的间距为 36u 。

Ponte Vecchio intel

【总结】Ponte Vecchio GPU 不是一个单独的芯片,而是由 47 个不同工艺制程的小芯片“组合”得来。

Ponte Vecchio intel

遗憾的是,受英特尔多次跳票的影响,使用 Ponte Vecchio GPU 和 Sapphire Rapids CPU 的 Aurora 超级计算机项目也被迫推迟。

即便如此,英特尔还是透露了下一代 Rialto Bridge GPU 。可知作为 Ponte Vecchio GPU 的继任者,其有望于 2023 年开始提供样品。


返回网站首页

本文评论
李在镕在三星的股份_三星迎来“李在镕时代” 全力拥抱新蓝图
  [环球时报驻韩国特约记者 张 静]在芯片产业的寒风中,三星迎来“李在镕时代”。据韩联社27日报道,三星电子副会长、三星集团实际掌权人李在镕当天正式出任三星电子会长。李...
日期:10-28
打破外资“垄断”,造车新势力争夺豪华车市场蛋糕「新势力造车对传统汽车的威胁」
  作者/武子晔  长期被外资车企统治的豪华车市场出现裂缝,打破坚冰的主要是中国造车新势力公司。  证监会最新上险数据显示,豪华车8月上险总量达35.6万辆,同比增长14.6%,...
日期:09-29
汽车制造新挑战:芯片中国厂商占比不足5%,究竟该如何破局?_汽车芯片发展
  讯 12月16日下午消息,“2022科技风云榜”年度盛典今日举行,今年活动主题为“守正创新,科技向上”。在汽车分论坛上,太蓝新能源CEO李彦,芯驰科技副总裁陈蜀杰,小马智行COO、上...
日期:12-17
新能源车产销两旺拉动业绩 动力电池企业角逐激烈
  《投资者网》葛凡梅  编辑; 汤巾  2022年以来,在政策推动以及市场高需求的背景下,新能源汽车行业高景气度延续。  根据Clean Technica公布的全球新能源乘用车销量数...
日期:09-09
安全无极致,真融宝多重防护为用户资金保驾护航
  资金安全问题,再怎么用心都没错!互联网金融时代,投资者最关注的莫过于资产安全问题,互联网理财的问题往往爆发在产品安全和技术安全两方面。所以,如果要做一个值得投资者用...
日期:10-10
中国牵头,首个移动终端生物特征识别技术ISO国际标准正式发布
近日,国际标准化组织(ISO)官网正式发布了我国主导制定的全球首个移动终端生物特征识别技术领域的国际标准,该标准以IIFAA的团体标准为技术基础。ISO是国际公认最权威的标准化组...
日期:12-14
iphone14pro价格_万元很贵吗?iPhone14 Pro全球热卖:苹果赚大 将占高端手机60%市场
原以为现在全球通胀情况下,iPhone 14应该比14 Pro系列更好卖(毕竟便宜),但事实确截然相反,万元机型热卖会让苹果获得哪些?按照供应链的说法,苹果已经要求供应商富士康重新调整一些i...
日期:09-24
爆炒不跑烟!米家智能净烟机P1发布:首发价3699元
8月11日消息,今日晚间,小米举行新品发布会,正式发布小米MIX Fold 2、小米手表S1 Pro、Redmi K50至尊版等多款新品,此外,米家产品米家智能净烟机P1也在此次发布会上登场。目前,米家...
日期:08-13
苹果13卖爆了_苹果品控暴跌?网友连拆60台iPhone 14PM
  中关村在线  iPhone的品控一直被不少用户追捧,不过从iPhone 14来看苹果的标准可能下降了。根据一位网友在社交平台上发布的帖子,他认为苹果的质量控制从iPhone Xs Max时...
日期:10-27
苹果圣诞节发布会_苹果发布会最便宜新品来了:仅需98元 是一根挂绳
今天苹果举行了秋季新品发布会,此次发布会发布了iPhone 14在内的8款新品,其中手机价格5999元-13499元,手表价格1999-6299元,耳机价格1899元。除了这些新品外,苹果还发布了一款Air...
日期:09-08
与心梗患者家属谈话_与心梗"赛跑",分秒必争!牢记这两个"120",关键时刻能
与心梗"赛跑",分秒必争!牢记这两个"120",关键时刻能当生活平稳进行时,突发事件总是会打破原本的安宁,搞得人措手不及。而突发的急性病症就是其中一种,在与死神的赛跑中,每一分每一...
日期:07-22
人工智能芯片公司地平线据悉考虑筹集1亿至2亿美元新资金_地平线机器人融资情况
讯 北京时间8月18日下午消息,据报道,人工智能芯片初创企业地平线正考虑筹集1亿至2亿美元新资金。   知情人士说,拥有英特尔支持的这家公司正在在顾问机构帮助之下,评估投资者...
日期:08-19
丰巢“我要霸屏”业务惹纠纷,龚俊诉肖像侵权索赔101万元_丰巢霸屏审批
  记者/白帆  近日,知名艺人龚俊(以下显示为“原告”)起诉深圳丰巢科技有限公司(以下简称为“丰巢”或“被告”)肖像权纠纷一审法律文书在天眼查App上公开。苹果商店韩国地区...
日期:09-21
iPhone Wi-Fi断连_先别更新!用户反馈iOS 16.1出现Wi-Fi断连问题
10月28日,据macrumors报道,在Reddit、Twitter和Apple支持社区论坛里有多位用户反馈,他们的手机在更新到iOS 16.1后,手机会出现Wi-Fi断连问题。这些用户表示,虽然他们使用iPhone的...
日期:10-29
双十一直播格局生变:罗永浩俞敏洪转战淘宝,抖音淘宝正面对决
  记者/范佳来 吴雨欣  实习生/姜霁轩  今年“双十一”,两大抖音主播罗永浩、俞敏洪都将现身淘宝直播间。;  10月19日,澎湃新闻记者获悉,前抖音直播带货“一哥”罗永浩...
日期:10-22
运费暴涨4倍仍缺滚装船,汽车出口海运压力如何缓解?_海运费 涨
  作者:吴绵强;;责编:刘泽南  中国的滚装船运力仅占全球总运力的5%左右,相对于持续井喷的汽车出口形势,显然是严重的运力不足。  10月24日,繁忙的南沙汽车码头,蔚蓝色的海面...
日期:10-29
支持音乐播放 佳明推出Forerunner 645 Music手表
支持音乐播放佳明推出Forerunner645Music手表当当网 营收佳明(Garmin)作为专业运动手表品牌,近期推新品的速度不慢,继12月18日发布带移动支付功能的Vivoactive3后,近日又推出了一...
日期:07-16
华尔街调侃称特斯拉面临打地鼠难题:困难一个接一个
家用路由器稳定7月6日消息,电动汽车制造商特斯拉第二季度新车交付量两年来首次下降,华尔街分析师调侃称,这可能是因为该公司陷入了“打鼹鼠”困局。受疫情、供应链混乱以及成本...
日期:08-27
中兴通讯获新浪2022科技风云榜年度领先通讯服务商奖「中兴通讯新浪财经」
  讯12月16日下午消息,由新浪财经客户端、联合主办的“2022科技风云榜”线上年度盛典今日开幕,今年活动主题为“守正创新,科技向上”。  活动现场,来自各领域的专家学者、众...
日期:12-18
嘀嗒出行上线全国首个出租车车机端“智慧出行”系统「嘀嗒出行网页版」
嘀嗒出行上线全国首个出租车车机端“智慧出行”系统随着交通新基建的开展,出租车作为四轮出行市场的主要运力,其数字化转型升级已成为各城市推动巡游车出租车改革攻坚的重要抓...
日期:07-22