您的位置:首页 > 互联网

小扎豪赌大模型!Meta重磅推出定制芯片MTIA v1和全新超算

发布时间:2023-05-21 07:53:16  来源:互联网     背景:


新智元报道

编辑:拉燕 Aeneas

【新智元导读】全世界都在卷大模型,小扎也急了。如今,Meta为了发展AI,在定制芯片和超算上下了大赌注。

Meta也有纯自研芯片了!

本周四,Meta发布第一代AI推理定制芯片MTIA v1和超算。

可以说,MTIA对Meta是一个巨大的福音,尤其是现在各家都在卷大模型,对AI算力的需求变得越来越高。

小扎最近表示,Meta看到了「以有用和有意义的方式向数十亿人介绍人工智能代理的机会」。

显然,随着Meta加大对AI的投入,MTIA芯片和超算计划将是Meta与其他科技巨头竞争的关键工具,现在没有哪家巨头不在AI上投入大量资源。


可以看到,凭着定制芯片和超算,Meta在AI上下了大赌注。

MTIA

在最近的一次线上活动中,Meta拉开了开发自己的基础设施的序幕。

新芯片全名是Meta训练和推理加速器,简称MTIA。


MTIA是一种ASIC,一种将不同电路组合在一块板上的芯片,允许对其进行编程,以并行执行一项或多项任务。

Meta副总裁兼基础设施负责人Santosh Janardhan在一篇博客文章中写道,MTIA是Meta「针对推理工作负载的内部定制加速器芯片系列」,它提供了比CPU「更高的计算能力和效率」,并且「为我们的内部工作负载定制」。

通过结合MTIA芯片和GPU,Janardhan 表示,Meta相信「我们将为每个工作负载提供更好的性能、更低的延迟和更高的效率。」

不得不说,这是Meta实力的投射。其实,一直以来,Meta在应用AI友好型硬件系统方面进展并不迅速。这影响了Meta和竞对(如微软、谷歌等)保持同步发展的能力。

Meta基础设施副总裁Alexis Bjorlin在一次采访中表示,构建属于自己的硬件,Meta就有能力控制堆栈的每一层,包括数据中心设计到培训框架。

这种垂直的整合水平对于大规模推动AI研究边界是必不可少的。

在过去的十年里,Meta花费了数十亿美元聘请顶级数据科学家来构建新型AI模型。

Meta也一直在努力将其许多更宏伟的AI创新研究投产,尤其是生成式AI。

一直到2022年,Meta一直主要用的是CPU和专为加速AI算法而设计的芯片组合来维持其AI的运行。

而CPU和芯片的组合在执行这类任务的效率上通常会低于GPU。


于是Meta取消了原本打算在2022年大规模推广的定制芯片,转而订购了价值数十亿美元的英伟达GPU。

引入这些GPU,Meta需要对旗下的几个数据中心进行颠覆性的重新设计。

而为了扭转这一局面,Meta计划开发一款内部芯片,预计于2025年推出。这款内部芯片既能训练AI模型,还能运行AI模型,可谓性能强大。

主角终于来了——新芯片名叫MITA,全称Meta Training and Inference Accelerator.

这款芯片可以用来加速AI训练和推理的效率。

研究团队表示,MTIA是一种ASIC,指的是一种在一块板上组合不同电路的芯片。通过编程,该芯片能同时执行一项或多项任务。


专为AI工作负载定制的AI芯片Meta

要知道,科技巨头公司的竞争说白了玩儿的就是芯片。

比方说谷歌的TPU,用来训练Palm-2和Imagen。亚马逊也有自己的芯片,用于训练AI模型。

此外,有消息称微软也在和AMD开发一款叫Athena的芯片。

这不,MITA的到来也是Meta不甘示弱的表现。


Meta表示,2020年他们创建了第一代的MITA——MITA v1,采用的是7nm工艺。

该芯片内部内存可以从128MB扩展到128GB,同时,在Meta设计的基准测试中,MITA在处理中低复杂度的AI模型时,效率要比GPU还高。

在芯片的内存和网络部分,还有不少工作要做。随着AI模型的规模越来越大,MITA也即将遇到瓶颈。Meta需要将工作量分担到多个芯片上。

对此,Meta表示,会继续完善MITA在运行推荐的工作量时每瓦的性能。


早在2020年,Meta就已经为内部工作负载设计了第一代MTIA ASIC。

此推理加速器是共同设计的全栈解决方案的一部分,包括芯片、PyTorch和推荐模型。

该加速器采用台积电 7nm工艺制造,运行频率为800 MHz,在INT8精度下提供102.4 TOPS,在FP16精度下提供 51.2TFLOPS。它的热设计功率(TDP)为25W。


在高层次上,加速器由处理元件 (PE)、片上和片外存储器资源以及互连组成的网格组成

加速器配备了运行系统固件的专用控制子系统,固件管理可用的计算和内存资源,通过专用主机接口与主机通信,并在加速器上协调作业执行。


内存子系统将LPDDR5用于片外DRAM资源,可扩展至128GB


该芯片还具有128MB的片上SRAM,在所有PE之间共享,为频繁访问的数据和指令提供更高的带宽和更低的延迟


网格包含64个以 8x8 配置组织的PE;PE通过网状网络连接彼此并连接到内存块。网格可用于运行整个作业,也可以将其划分为多个可以运行独立作业的子网格

MTIA加速器安装在小型双M.2板上,可以更轻松地聚合到服务器中。这些主板使用PCIe Gen4 x8链路连接到服务器上的主机CPU,功耗低至35W。


带有MTIA的测试板示例

MTIA软件(SW)堆栈旨在为开发人员提供效率和高性能。它与PyTorch完全集成,将PyTorch与MTIA结合使用,就像将PyTorch用于CPU或GPU一样简单。

适用于MTIA的PyTorch 运行时管理设备上的执行和功能,例如MTIA张量、内存管理和用于在加速器上调度运算符的 API。


MTIA软件堆栈

有多种方法可以创作可在加速器上运行的计算内核,包括使用PyTorch、C/C++(用于手动调优、非常优化的内核)和一种称为KNYFE的新领域特定语言。


使用五种不同的DLRM(从低复杂度到高复杂度)来评估具有代表性生产工作负载的MTIA


评估发现,与NNPI和GPU相比,MTIA更有效地处理低复杂度(LC1和LC2)和中等复杂度(MC1和MC2)模型。研究者也认识到,他们尚未针对高复杂性(HC)模型优化MTIA

不过,MTIA芯片似乎还有很长的路要走——据媒体报道,它要到2025年才能问世。

RSC

也许未来的某一天,Meta能把大部分训练AI、运行AI的工作交给MITA来完成。

但就目前而言,还是得更多依赖自己的超算:Research SuperCluster,简称RSC。


RSC于2022年1月首次亮相,与Penguin Computing、英伟达和Pure Storage合作组装,已完成第二阶段的建设。

现在,RSC包含2000个英伟达DGX A100系统,16000个英伟达A100 GPU。

在全力以赴的情况下,Meta实现了近5 exaflops 的算力(一个exaflop是每秒quintillion,即十亿亿次)。


随着分配的GPU数量的增加,训练时间可以大大减少。在过去的一年里,Meta利用这种巨大的规模,已经培训了一些产生影响的项目

此前,Meta一直在致力于建设「下一代数据中心设计」,争取「优化AI」,「构建更快、更具成本的效益」。

Janardhan说,Meta对超级集群(RSC)人工智能超级计算机的强大功能非常有信心,「我们相信它是世界上最快的人工智能超级计算机之一。

抖音网红商业合作

那么问题来了,Meta为什么要建造这么一台内部使用的超级计算机呢?


首先,别的科技巨头公司给的压力太大了。几年前,微软与OpenAI合作,搞了个AI超级计算机。最近又表示要和AMD合作,在Azure云中构建一台新的AI超级计算机。

除此以外,谷歌一直在吹捧自己的以AI为重点的超级计算机,有26000个Nvidia H100 GPU,完全碾压Meta。

当然除了这个原因,Meta还表示,RSC还允许Meta的研究人员使用自己公司生产系统中的真实案例来训练模型。

这与该公司以前的人工智能基础设施不同,后者仅利用开源和公开可用的数据集。


RSC AI超级计算机用于推动多个领域的AI研究边界,包括生成式AI,Meta希望为AI研究人员提供最先进的基础设施,使他们能够开发模型,并为他们提供一个培训平台来推进AI的发展。

在巅峰时期,RSC可以达到近5 exaflops的计算能力,该公司声称这使其成为世界上最快的计算能力之一,远远超过世界上许多最快的超级计算机。

Meta表示,它将使用RSC来训练LLaMA。

Meta表示,最大的LLaMA模型是在2048个A100 GPU上训练的,这花了21天。

随着Meta试图在其他科技巨头越来越猛的人工智能计划中脱颖而出,Meta显然对AI硬件也要有一番布局。


除了MTIA之外,Meta还在开发另一种芯片来处理特定类型的计算工作负载。

这种芯片被称为Meta可扩展视频处理器 (MSVP),是Meta内部开发的首个ASIC解决方案,专为满足视频点播和实时流媒体的处理需求而设计。

早在几年前,Meta就开始构思定制的服务器端视频芯片,并在2019年宣布推出用于视频转码和推理工作的 ASIC。

而Meta的定制芯片,目的就是在加快视频工作的处理速度,如流媒体和转码等等。

Meta的研究人员表示,「未来,MSVP将使我们能够支持更多Meta最重要的用例和需求,包括短视频——能够高效交付生成AI、AR/VR和其他元宇宙相关的内容。」

紧追猛赶的Meta

如果今天这些产品要找一个共同点的话,那就是Meta正在拼命地试图加快它涉及人工智能的步伐,特别是生成式AI。


今年2月份,小扎就曾表示要成立一个新的顶级生成式AI团队。

用他的话说,就是要给公司的研发来一波氮气加速。

首席科学家Yann LeCun表示,Meta计划部署生成AI工具来在虚拟现实中继续大展宏图。

目前,Meta正在探索WhatsApp和Messenger中的聊天体验,Facebook和Instagram和广告中的视觉创建工具,以及视频和多模式体验。

不过,在某种程度上,Meta也感受到了来自投资者的压力正变得越来越大,投资者担心Meta的发展速度不够快,无法占领生成式AI的市场。


对于像Bard,Bing Chat或ChatGPT这样的聊天机器人,Meta疲于应对。在图像生成方面也没有取得什么进展。

而后者正是另一个爆炸性增长的关键领域。

如果相关专家的预测正确,生成式AI软件的总潜在市场可能达到1500亿美元。

高盛(Goldman Sachs)预测,它将使GDP增长7%。

就算是其中的一小部分,也可以消除Meta在AR/VR头显、会议软件等元宇宙技术投资方面所损失的数十亿美元。

Meta负责增强现实技术的部门Reality Labs发布的报告中显示,Meta上季度净亏损40亿美元。

参考资料:

https://ai.facebook.com/blog/meta-training-inference-accelerator-AI-MTIA/

https://ai.facebook.com/blog/supercomputer-meta-research-supercluster-2023/

https://ai.facebook.com/blog/meta-ai-infrastructure-overview/


返回网站首页

本文评论
小鹏汇天飞行汽车旅航者 X2 获迪拜飞行许可 即将海外公开首飞_小鹏汇天飞行器旅航者X2
9月29日消息:据小鹏汇天官方微博消息,小鹏汇天飞行汽车旅航者X2在迪拜民航局监管下进行了严谨的评审工作,顺利通过特定运行风险评估,并获得在迪拜开展海外首次公开飞行许可。10...
日期:09-30
各个大长腿超短裙吸睛:淄博一群175美少女接送游客非官方行为
五一假期临近,你要出去游玩吗,也会凑热闹去淄博吃烧烤不?近日,网传山东淄博为了迎接五一”来吃烧烤的游客,派出一群1米75青春美少女骑电驴接送。iqoo neo 6价格视频画面显示,10名...
日期:04-28
石头科技上半年营收29.23亿元 同比增长24.49%「石头科技上半年营收29.23亿元 同比增长24.49多少倍」
8月29日消息,A股上市公司石头科技(股票代码:688169)披露了2022年度中期业绩,公司实现营业总收入29.23亿元,同比增长24.49%,净利润达到6.17亿元;基本每股收益6.59元/股。截止报告期末...
日期:08-30
推特前雇员举报推特“易受外国政府利用”,扯上中俄_推特 国外
【环球时报驻美国特约记者 英辰 环球时报记者 张旺】据美国有线电视新闻网(CNN)24日报道,被推特公司解雇的前安全主管佩特·扎特科向美国国会、司法部以及联邦监管机构举报称,推...
日期:09-08
移动互联网十年
2011年8月16日,北京798艺术中心。 台上,雷军每公布一项技术参数,台下就传来一阵几乎要......
日期:09-28
Win10命不久矣!微软全屏弹窗新花招逼你升Win11:连点3次拒绝才退出
过去用Win10是支持微软,现在用居然成了得罪微软。日前,部分Windows 10用户反馈,收到了全屏弹窗通知,内容是解锁免费升级Windows 11的体验。东南亚上市互联网公司智能手机更新换...
日期:02-03
微软称Windows受自动运行恶意软件感染下降_windows恶意软件 运行命令
(清雨)北京时间6月18日消息,据国外媒体报道,微软似乎已经解决了自动运行恶意软件感染其操作系统的问题。自动运行恶意软件对WINDOWS感染次数示意图微软恶意软件防护中心日前发...
日期:07-30
微信头像用久了会褪色吗「微信头像莫名其妙褪色!官方回应:优化中」
2月12日下午,有网友反映,微信头像莫名其妙出现褪色的情况,用了一段时间之后与原图相比,清晰度和色彩都明显变得更黯淡了。有的网友表示,自己两三年没有换过头像,也没有换过手机,但...
日期:02-13
3个月激增6100万中老年网民,互联网也懵了_中老年人互联网
谁会花心思去了解一位老人呢?在腾讯产品岗的面试题中,有一道经典题:“如何向60岁的老人推广无人机?”2020年以前,你大可以发挥想象力去作答,现实中也不会真有智能产品的推销员...
日期:12-12
五折半价、千元直降还不够?苏宁冰洗将推24期免息(苏宁半价活动)
  日前,苏宁家电“开仓计划”正在如火如荼进行。苏宁联合行业各大品牌,在各个家电品类选定了众多型号商品,将价格压到底,全力满足消费者的健康换新需求。   2月24日,苏宁冰...
日期:10-15
阿里达摩院机器智能实验室「阿里达摩院已内测类ChatGPT对话机器人? 官方回应」
凤凰网科技讯 2月8日消息,针对网传阿里达摩院正在研发类ChatGPT的对话机器人的传闻,阿里方面回应凤凰网科技表示,这个确实在研发中,目前处于内测阶段。后续如有更多信息,我们会第...
日期:02-10
荣耀 X40 GT 5G 新机官宣:性能跃级标杆
10月8日消息:荣耀手机官方微博今日上午宣布,荣耀 X40 GT 新机即将登场。官方海报显示,荣耀 X40 GT 支持5G,号称「性能跃级标杆」。据了解,上个月荣耀有一款新机通过3C认证,认证信...
日期:10-21
中概股周二收盘多数下跌 每日优鲜跌超14% 趣店跌超10%(每日优鲜美国ipo首日开盘破发)
苹果怎么下载比特派线上超市经营模式荣耀20 pro跑分一加6发布会ix25自驾游   北京时间27日凌晨,美股周二收跌。零售巨头沃尔玛下调盈利预测导致零售股大跌。美联储将从今天...
日期:07-31
毕马威中国领先金融科技五十强_宇信科技入选毕马威中国领先金融科技50强
  1月18日,毕马威对外发布"2020中国领先金融科技企业50强",宇信科技凭借深耕金融科技领域廿余载所积累的综合实力,成功入选。一同入榜的还有京东数科、度小满金融、微众银行...
日期:07-10
新面孔过半,但月涨粉千万的时代一去不复返
声明:本文来自于微信公众号 卡思数据(ID:caasdata6),作者:岳遥,授权转载发布。10月抖音涨粉榜已出,我们先来看榜:如果说,今年以来的抖音月涨粉榜持续呈现出了低迷之势,那么时间走到...
日期:11-19
微信:对散布疫情谣言的账号进行限期或永久封禁处理
  1月26日消息 微信安全中心发布《关于新型冠状病毒肺炎相关谣言专项治理的公告》,称为了构建更加绿色健康的微信生态环境,将成立“新型冠状病毒肺炎”相关谣言的清理专项,...
日期:03-16
品牌商介入鞋类B2C 好乐买称不担心货源封锁
  6月16日消息,鞋类B2C垂直领域再爆巨头加入。这周二,有消息爆出,百度联合百丽将推自主B2C网站,主营鞋帽和服装。这是继腾讯投资好乐买之后,又一个互联网巨头企业加入鞋类B2C...
日期:07-30
三星980 pcie「7450MB/s最快PCIe 4.0!三星990 Pro SSD海外预售:11月14日开卖」
今年8月份,三星正式发布了990 Pro PCIe 4.0 NVMe M.2固态硬盘,如今终于要开卖了。根据美亚官网显示,目前三星990 Pro已开启预售,将于11月14日开卖,1TB 189美(约1375元人民币),2TB 30...
日期:11-05
北斗立大功:新疆3000亩“棉田”以往需要30人管理 现在仅需2人「新疆万亩棉田」
近日,在新疆巴音郭楞蒙古自治州尉犁县,由2个人种植管理的3000亩超级棉田”喜获丰收,棉花亩产可达400公斤。丰收的喜悦也有北斗农机的一份功劳。据中国北斗卫星导航系统官方消息...
日期:11-17
12亿春晚红包活动收官,众安保险送灯笼,亮相专场红包雨(21年春晚红包活动)
  2月12日,备受瞩目的春晚红包活动收官。据抖音发布的数据,今年春晚红包总互动次数达703亿,直播间累计观看人次12亿。春晚观众通过集灯笼和刮红包雨,领取来自保险科技龙头众...
日期:07-16