您的位置:首页 > 互联网

AI 几小时设计芯片超越人类:谷歌 AlphaChip 登 Nature,已设计出三代旗舰 TPU

发布时间:2024-09-28 14:57:48  来源:互联网     背景:

谷歌的 AlphaChip,几小时内就能设计出芯片布局,直接碾压人类专家!这种超人芯片布局,已经应用在 TPU、CPU 在内的全球硬件中。人类设计芯片的方式,已被 AI 彻底改变。

能设计芯片的 AI 黑科技来了!就在刚刚,谷歌 DeepMind 推出名为 AlphaChip 的 AI 系统。

无论是设计最先进的用于构建 AI 模型的 TPU,还是数据中心的 CPU,它在相关的众多领域,都产生了广泛影响。

在谷歌的许多款芯片设计中,它都取得了出色的效果,比如 Axion 芯片(一种基于 Arm 的通用数据中心 CPU)。

AlphaChip 设计芯片,用的是强化学习的原理。

也就是说,芯片布局设计对它来说是一种游戏,就像 AlphaGo 一样,它在游戏中,学习如何设计出最好的芯片布局。

6500组装机配置单

几小时内,它就能生成超出人类水平,或是与人类专家相当的芯片布局了。

现在,它已经用于设计多代 TPU 芯片(TPU v5e、TPU v5p 和 Trillium)。而且跟人类专家相比,AlphaChip 放置的块数越来越多,线长也减少了许多。

布局五年,谷歌多代 TPU 全由 AI 设计

其实谷歌对于这个 AI,已经布局多年了。早在 2020 年,团队就发表了一篇预印本论文,介绍了谷歌的全新强化学习方法,用于设计芯片布局。

论文地址:https://arxiv.org/ pdf/2004.10746

后来在 2021 年,这项工作发表在了 Nature 上,并且进行了开源。

论文地址:https://www.nature.com/ articles / s41586-021-03544-w

而自从首次发表这项工作以来,谷歌内部一直在对它进行改进。今天,团队发表了 Nature 附录,详细描述了具体方法,及其对芯片设计领域的影响。同时,他们还发布了一个预训练的检查点,分享了模型权重,公布模型名称为 AlphaChip。

谷歌表示,AlphaChip 是最早用于解决现实世界工问题的强化学习方法之一。

在数小时内,它就可以生成超人或类似的芯片布局,而不需要花费数周或数月的人类。它设计的芯片布局,已经被用于世界各地的芯片中,包括数据中心和移动电话。

为了设计 TPU 布局,AlphaChip 首先在来自前几代的各种芯片模块上进行实践,例如片上和片间网络模块、内存控制器和数据传输缓冲区。这一过程被称为预训练。

然后,团队在当前的 TPU 模块上运行 AlphaChip,以生成高质量的布局。

与之前的方法不同,AlphaChip 在解决更多芯片布局任务时变得更好、更快,类似于人类专家的工作方式。

对于每一代新的 TPU,包括谷歌最新的 Trillium (第 6 代),AlphaChip 都设计了更好的芯片布局,并提供了更多的总体布局图,从而加快了设计周期,产生了更高性能的芯片。

条形图显示了谷歌三代 TPU 上 AlphaChip 设计的芯片块的数量,包括 v5e、v5p 和 Trillium

条形图显示,跟 TPU 物理设计团队生成的布局相比,AlphaChip 在 TPU 三代产品中的平均有线长度减少

工作原理:一边设计,一边奖励

其实,设计芯片布局并不是一项简单的任务。

一般来说,计算机芯片有许多相互连接的模块、多层电路元件组成,所有这些部件都由纤细无比的导线连接起来。

此外,还有许多复杂且相互交织的设计约束,必须同时满足。

由于设计的复杂性,60 多年来,芯片设计工程师一直在努力自动化芯片布局规划过程。

谷歌表示,AlphaChip 的研发,从 AlphaGo 和 AlphaZero 中汲取了经验。

众所周知,通过深度学习和博弈论,AlphaGo 和 AlphaZero 逐渐从 0 掌握了围棋、国际象棋和将棋的潜在规则。

AlphaChip 同样是采用了,将芯片底层规划视为一种游戏的策略。

从空白栅格开始,AlphaChip 每次放置一个电路元件,直至放置完所有元件。

然后,根据最终布局的质量,给予模型奖励。

一种全新的基于边的图神经网络让 AlphaChip,能够学习相互连接的芯片元件之间的关系,并在芯片之间进行泛化,让 AlphaChip 在设计的每种布局中都有所改进。

左图:动画显示 AlphaChip 在没有任何经验的情况下,将开源的 Ariane RISC-V CPU 置入。右图:动画显示 AlphaChip 在对 20 个 TPU 相关设计进行练习后,放置相同的块。

AI 大牛带队,2 页浓缩版力作

让我们从最新论文中深扒一下,AlphaChip 的整个训练过程。

值得一提的是,这项研究依旧是由 Jeff Dean 带队,所有核心要素全都浓缩在了这两页论文中。

论文地址:https://www.nature.com/ articles / s41586-024-08032-5

预训练

与以往方法不同的是,AlphaChip 是基于一种强化学习的方法。

这意味着,当它解决了更多芯片布局问题的实例时,会变得更好、更快。

正如 Nature 论文(2021 年),以及 ISPD 2022 后续研究中所讨论的那样,这种预训练过程显著提升了 AI 的速度、可靠性、布局的性能。

顺便提一句,预训练也能培养出 LLM,像 Gemini、ChatGPT 令人印象深刻的能力。

自此前研究发表以来,谷歌便开源了一个软件库,以重现论文中描述的方法。

小米怎么设置触屏有圆圈

开发者们可以使用这个库,对各种芯片进行预训练,然后将预训练的模型应用到新的块。

GitHub 地址:https://github.com/ google-research / circuit_training

基于最新的 AlphaChip 训练过程,研究人员在库中添加了预训练的 20 个 TPU 块模型检查点(checkpoint)。

显然,如果不进行任何预训练,AlphaChip 就无法从先前的经验中学习,从而规避了学习方面的问题。

训练和计算资源

随着 RL 智能体(任何 ML 模型)的投入训练,它的损失通常会逐渐减少。

最终会趋于平稳,这代表着模型对其正在执行的任务有了尽可能多的了解,对外表现就是收敛。

从训练到收敛,是机器学习的标准做法。如果不按照这个路径来,可能会损害模型的性能。

AlphaChip 的性能随应用的计算资源而扩展,在 ISPD 2022 论文中,谷歌团队曾进一步探讨了这一特性。

论文地址:https://dl.acm.org/ doi / 10.1145/3505170.3511478

正如 Nature 论文中所描述的,在对特定块进行微调时,使用了 16 个工作单元,每个单元由 1 个 GPU 和 32 个 RL 环境组成,通过多进程处理共享 10 个 CPU。

总言之,用较少的计算资源可能会损害性能,或者需要运行相当长的时间,才能实现相同(或更差)性能。

初始布局

在运行 Nature 论文中评估方法之前,团队使用了来自物理综合的近似初始布局,以解决 hMETIS 标准单元集群大小不平衡的问题。

RL 智能体无权访问初始布局,并且不复杂放置标准单元。

尽管如此,谷歌作者还是进行了一项消融研究,排除了任何初始布局的使用,并且也没有观察到 AlphaChip 性能下降。

如下表 1 所示。

具体来说,他们跳过了单元集群重新平衡的一步,而是将 hMETIS 集群不平衡参数降低到最低设置(UBfactor = 1)。

由此,这使得 hMETIS 生成更平衡的集群。

基准

在 Nature 论文中,研究人员采用了 10nm 以下制程的 TPU 块进行实验得出的结果。

这个技术节点的大小,正是现代芯片的典型尺寸。之前许多论文报告中,采用较早的 45nm、12nm。

从物理设计角度来看,这种较老的技术节点尺寸的芯片,有着显著的不同。

比如,在 10nm 以下的芯片中,通常使用多重图案设计,这会在较低密度下导致布线拥堵的问题。

来源:Pushing Multiple Patterning in Sub-10nm: Are We Ready?

因此,对于较早的技术节点尺寸,AlphaChip 可能需要调整其奖励函数,以便更好地适应技术。

展望未来:AI 将改变整个芯片设计流程

自从 2020 年发布以来,AlphaChip 已经生成了每一代谷歌 TPU 使用的超人芯片布局。

可以说,正是因为它,才能使大规模放大基于 Transformer 架构的 AI 模型成为可能。

无论是在 Gemini 这样的 LLM,还是 Imagen 和 Veo 这样的图像和视频生成器中,TPU 都位于谷歌强大的生成式 AI 系统的核心。

另外,这些 AI 加速器也处于谷歌 AI 服务的核心,外部用户可以通过谷歌云获得服务。

谷歌数据中心的一排 Cloud TPU v5p AI 加速器超算

如今,谷歌的三代旗舰 TPU 芯片,已经在世界各地的数据中心中制造、部署。

随着每一代 TPU 的发展,AlphaChip 和人类专家之间的性能差距不断扩大。

从 TPU v5e 中的 10 个 RL 放置模块和 3.2% 的布线长度减少,到 TPU v5p 中的 15 个模块和 4.5% 的减少,再到 Trillium 中的 25 个模块和 6.2% 的减少。

AlphaChip 还为数据中心 CPU(Axion)和谷歌尚未公布的其他芯片,生成了超越人类的布局设计。

而其他公司,也在谷歌研究的基础上进行了改进。

比如联发科就不仅用 AlphaChip 加速了最先进芯片的开发,还在功耗、性能和面积上对芯片做了优化。

糯米广告宣传

如今,AlphaChip 仅仅是一个开始。

谷歌对未来做出了大胆畅想:AI 将实现芯片设计全流程的自动化,通过超人算法以及硬件、软件和机器学习模型的端到端协同优化,芯片设计的周期会显著加快,还会解锁性能的新领域。

谷歌表示,非常期待和社区合作,实现 AI 芯片以及芯片 AI 之间的闭环。

参考资料:

  • https://deepmind.google/discover/blog/how-alphachip-transformed-computer-chip-design/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=

  • https://x.com/JeffDean/status/1839308592408834559

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


返回网站首页

本文评论
一网红开价50万元卖自己的微信号 法院:不行!_高价卖微信号的人是真的吗
近日,江苏省高级人民法院公布的江阴法院一起有关微信买卖的典型案例引发关注。   2019年9月,医美网红程某以人民币50万元的价格将9个微信号转让给赵老板用于营销,没想到赵老...
日期:08-12
步步高加入 OPPO、vivo、小米联合建立的金标联盟「步步高商标是啥样的」
IT之家 4 月 24 日消息,移动智能终端生态联盟(金标联盟)4 月 21 日官宣,步步高正式加入金标联盟。如果发现阿里巴巴上存在禁限售规则管控商品金标联盟由中国智能终端厂商(IT之家...
日期:04-24
苹果官网iOS 18宣传文案“真的很你”遭吐槽 网友:比机翻还机翻_苹果官方宣传壁纸
快科技7月3日消息,苹果中国大陆官网上线iOS 18介绍页面,介绍了iOS 18新设计和新功能。然而,介绍页中的真的很你”宣传文案在网上引起了许多数码博主和网友的吐槽。有博主直呼苹...
日期:07-04
​重回增长背后:阿里云在AI淘到了金,还要“卖铲子”
声明:本文来自于微信公众号连线Insight(ID:lxinsight),文/陈锋,编辑/子夜,授权转载发布。“1+6+N”组织变革后的第一个季度,阿里巴巴交出了一份远超市场预期的成绩。8月10日,阿里巴...
日期:08-15
极光:生活要精致,56.3%的一线女青年愿意投3000-5000在出租房屋装饰上
  在消费升级的驱动下,消费者开始注重生活品质的提升,精品电商行业由此兴起。据此,极光(Aurora Mobile, NASDAQ:JG)联合小米有品推出《2020品质生活消费洞察报告》,解析新消...
日期:07-14
华为三折叠手机即将发布 余承东:研发历时5年
7月16日 消息:昨晚,华为消费者业务CEO余承东与董宇辉共同主持了一场直播活动,期间不仅探讨了华为手机和研发相关话题,余承东还首次对外透露了华为下一代折叠屏手机的相关信息。...
日期:07-16
国产手机快充哪家最好「国产大团结!华为、小米、OPPO、vivo携手,推动手机快充标准化」
近日,中国通信标准化终端协会终端快速充电技术与标准推进委员会技术工作组(CCSA/TC626/WG1)召开了会议,对包括《移动终端融合快速充电技术要求(第二阶段)》、《移动终端融合快速充...
日期:11-10
今天是小米SU7发布99天:雷军和团队聚餐庆功_小米雷军2020年
快科技7月4日消息,小米创办人雷军发微博表示,今天是小米SU7发布99天,我们办了一个总结会,大家也聚餐庆祝一下。手机锂离子电池最新科技资料显示,小米SU7于3月28日发布,4月3日开始...
日期:07-05
百果园天虹物美尖峰对话:会员如何为企业带来巨大增长?
声明:本文来自于微信公众号见实(ID:jianshishijie),作者:见实,授权转载发布。你我都知道,会员用户比非会员用户所贡献的销售额、消费频次、客单、活跃度等等重要指标,都要高出很多...
日期:12-16
游戏史上秀的3A大作之一 《巫师3》销量破4500万:好评如潮「巫师三发售量」
如果推荐一款好玩而且口碑又高的游戏,那么CDPR波兰蠢驴开发的《巫师3》准没错,7年来这款游戏好评如潮,现在的总销量也创造了一个新纪录4500万。CDPR公司CEO日前在一次会议上公...
日期:11-11
点冰淇淋下单25份麦乐鸡!麦当劳AI员工疯狂点餐惨遭解雇,翻车视频全网疯转
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】麦当劳宣布其与IBM合作进行的得来速人工智能语音点餐技术测试期结束,该技术已在100多家...
日期:06-18
联想YOGA T1智能眼镜来了:1999元!10月24日预售_联想m100智能眼镜APP
中关村在线消息:近日,联想公布了YOGA T1智能眼镜的售价,首发价为1999元,将在10月24日开启预售。这款智能眼镜其实就是联想海在外发布的Glasses T1AR眼镜,搭载了Micro OLED屏,官方...
日期:10-24
中国联通服装制造军团:新一代纺织服装 全产业链数字化协同基础设施引领者
中国联通服装制造军团:新一代纺织服装 全产业链数字化协同基础设施引领者 通信产业网|2023-07-04 10:05:04作者:崔亮亮来源:通信产业网【通信产业网讯】(记者 崔亮亮)从一丝到一...
日期:07-04
华为耳机freebudsstudio评测「P70绝佳配件!华为FreeBuds Lipstick 2口红耳机曝光:今天发布」
快科技4月10日消息,近日华为开启了密集的新品发布,每天通过官微发布新产品。据爆料,今天上午华为将推出FreeBuds Lipstick 2口红耳机,10:08开启预售,4月18日正式开售。目前已经被...
日期:04-10
中国天眼天线口径「中国天眼取得重要成果!发现迄今轨道周期最短脉冲双星」
中国天眼”FAST自2016年9月落成启用以来,为我国探索外太空做出了巨大贡献。清蒸鱼的做法 家常简单做法华为mate40绝版麒麟据中国科学院官网,日前,国际学术期刊《自然》发表中国...
日期:06-22
叮当快药三大措施助力北京消费季 科技赋能健康生活
  以 “新消费·爱生活”为主题的北京消费季于6月6日正式启动。作为北京消费季重点参与企业,叮当快药推出亿元健康消费券、医用口罩1元购以及慢病药直降价三大惠民措施,...
日期:07-14
三星s8处理器骁龙「唯一四边等宽的小屏骁龙8 Gen3旗舰!三星S24 1月登场」
快科技12月23日消息,博主i冰宇宙透露,三星Galaxy S24系列将于1月18日(北京时间)正式发布。和上代产品布局一样,这次发布会三星将同时推出Galaxy S24、Galaxy S24 和Galaxy S24 Ul...
日期:12-24
曝苹果正在开发更便宜的混合现实头显 AR眼镜项目暂停
苹果尚未宣布其首款混合现实头显,但我们已经听到了很多关于该公司在这款新产品方面的长期计划的传言。该信息一直在提供有关苹果新款AR / VR头显的多个细节,周二报道称,苹果的...
日期:01-20
马斯克近期推特「马斯克就推特案出庭作证的时间延迟至10月6日至7日」
  讯 北京时间9月27日晚间消息,据报道,特斯拉CEO埃隆·马斯克就推特案出庭作证的时间延迟至10月6日至7日。rtx3060支持4k吗iPad pro 9.7英寸...
日期:09-28
抖音上的语言翻译神器「抖音上线地方方言自动翻译功能 由多语言翻译模型等提供支持」
9月25日 消息:抖音宣布正式上线地方方言自动翻译功能。创作者可以使用该功能,“一键”将多种方言视频转化出普通话字幕,方便公众观看。具体使用时,创作者可在抖音投稿主界面点...
日期:09-25