您的位置:首页 > 互联网

微软自曝花数亿美元为OpenAI组装超算开发ChatGPT 使用数万个英伟达芯片

发布时间:2023-03-14 09:41:18  来源:互联网     背景:

3月14日消息,美国当地时间周一,微软发文透露其斥资数亿美元帮助OpenAI组装了一台AI超级计算机,以帮助开发爆火的聊天机器人ChatGPT。这台超算使用了数万个英伟达图形芯片A100,这使得OpenAI能够训练越来越强大的AI模型。

OpenAI试图训练越来越大的AI模型,这些模型正在吸收更多的数据,学习越来越多的参数,这些参数是AI系统通过训练和再培训找出的变量。这意味着,OpenAI需要很长时间才能获得强大的云计算服务支持。

为应对这一挑战,当微软于2019年向OpenAI投资10亿美元时,该公司同意为这家AI研究初创公司组装一台巨大的尖端超级计算机。但问题在于,微软没有任何OpenAI所需的东西,也不完全确定其能否能在不破坏Azure云服务的情况下构建如此庞大的设备。

为此,微软不得不想方设法将英伟达的数万个A100图形芯片连接起来,并改变服务器在机架上的放置方式以防止断电。A100图形芯片是培训AI模型的主力。微软负责云计算和AI业务的执行副总裁斯科特·格思里(Scott Guthrie)没有透露该项目的具体成本,但其暗示可能达数亿美元。

微软Azure AI基础设施总经理尼迪·卡佩尔(Nidhi Cappell)说:“我们构建了一个系统构架,它可以在非常大的范围内运行且十分可靠,这是ChatGPT成功的重要原因。这只是我们从中得出的一个模式,还会有许许多多其他的模型。”

基于这项技术,OpenAI发布了爆火的聊天机器人ChatGPT。在去年11月上线后几天,它就吸引了100多万用户,现在正被纳入其他公司的商业模式。随着企业和消费者对ChatGPT等生成式人工智能(AIGC)工具的兴趣越来越大,微软、亚马逊和谷歌等云服务提供商将面临更大的压力,以确保他们的数据中心能够提供所需的巨大算力。

与此同时,微软现在也开始使用它为OpenAI构建的基础设施来训练和运行自己的大型AI模型,包括上个月推出的新必应搜索聊天机器人。该公司还向其他客户销售该系统。这家软件巨头已经在研发下一代AI超级计算机,这是微软与OpenAI扩大合作的一部分,微软在交易中增加了100亿美元投资。

格思里在接受采访时说:“我们并没有为OpenAI定制任何东西,尽管其最初是定制的,但我们总是以一种泛化的方式构建它,这样任何想要训练大型语言模型的人都可以利用同样的改进技术。这真的帮助我们在更广泛的范围内成为更好的AI智能云。”

训练规模庞大的AI模型需要在某个地方有大量相互连接的图形处理单元,就像微软组装的AI超级计算机那样。一旦模型投入使用,回答用户查询的所有问题(这个过程称为推理)需要略有不同的设置。为此,微软还部署了用于推理的图形芯片,但这些处理器(成千上万个)在地理上分散在该公司60多个数据中心里。微软表示,现在该公司正在添加用于AI工作负载的最新英伟达图形芯片H100以及最新版Infiniband网络技术,以更快地共享数据。

新的必应仍处于测试阶段,微软正在逐步从申请测试名单中增加更多用户。格思里的团队与大约20多名员工每天都要举行会议,他将这些员工称为“pit crew”,原指赛车中车队后勤维护组的技师。这些人的工作是找出如何让更多的计算能力快速上线,以及解决突然出现的问题。

三星猎户座芯片到底怎么样

云服务依赖于数千个不同的部件,包括服务器、管道、建筑物的混凝土、不同的金属和矿物,而任何一个组件的延迟或短缺,无论多么微小,都可能导致整个项目中断。最近,“pit crew”团队不得不帮助解决电缆托盘短缺的问题,这是一种篮状的装置,用来固定从机器上顺下来的电缆。因此,他们设计了一种新的电缆桥架。格思里说,他们还致力于研究如何在世界各地的现有数据中心压榨尽可能多的服务器,这样他们就不必等待新的建筑竣工。

当OpenAI或微软开始训练大型AI模型时,这项工作需要一次完成。工作被分配给所有的GPU,在某些时候,这些GPU需要相互交流来分享他们所做的工作。对于AI超级计算机,微软必须确保处理所有芯片之间通信的网络设备能够处理这种负载,并且它必须开发出最大限度地利用GPU和网络设备的软件。该公司现在已经开发出一种软件,可以用来训练数十万亿个参数的AI模型。

因为所有机器都是同时启动的,微软不得不考虑安放它们的位置,以及电源该应该放在哪里。否则,数据中心最终可能会断电。Azure全球基础设施总监阿利斯泰尔·斯皮尔斯(Alistair Speirs)说,微软还必须确保能够冷却所有这些机器和芯片,该公司在较凉爽的气候中使用蒸发;冷却方式、在较冷的气候中使用室外空气,在炎热的气候中使用高科技沼泽冷却器。

格思里说,微软将继续致力于定制服务器和芯片设计,以及优化供应链的方法,以尽可能地提高速度、提高效率和节省成本。他说:“现在令世界惊叹的AI模型是基于我们几年前开始建造的超级计算机构建的,而新模型将使用我们现在正在训练的新超级计算机。这台计算机要大得多,可以实现更复杂的技术。”

快手直播间活动

微软已经在努力使Azure的AI功能更加强大,推出了新的虚拟机,使用英伟达的H100和A100 Tensor Core GPU,以及Quantum-2 InfiniBand网络。微软表示,这将允许OpenAI和其他依赖Azure的公司训练更大、更复杂的AI模型。

微软Azure AI企业副总裁埃里克·博伊德(Eric Boyd)在一份声明中说:“我们发现,我们需要构建专门的集群,专注于支持大量的培训工作,而OpenAI就是早期的证据之一。我们正与他们密切合作,了解他们在建立训练环境时需要的关键条件,以及他们需要的其他东西。”(小小)


返回网站首页

本文评论
超越RTX 3060是有条件的 Intel显卡喜新厌旧:要看平台、游戏「rtx 3060和2070」
Intel在9月底正式发布了Arc A770及A750系列显卡,这是Arc品牌下的旗舰级显卡,算上A380、A310及A580等,代号炼金术师”的GPU家族布局算是完成了。售价方面,A750 8GB显卡售价289元,A...
日期:10-12
迅雷股份占比「迅雷:第二季度营收7830万美元 同比增长41.9%」
  讯8月16日晚间消息,今日,迅雷公布了截至2022年6月30日第二季度未经审计的财报。据财报显示,迅雷第二季度总营收为7,830万美元,同比增长41.9%,符合预期收入指引。基于通用会计...
日期:09-27
美FTC不再将扎克伯格列为Within反垄断诉讼案被告人
  讯 北京时间8月24日下午消息,据报道,美国联邦贸易委员会(FTC)今日表示,已将Facebook母公司Meta CEO马克·扎克伯格(Mark Zuckerberg)从一起反垄断诉讼中除名。该诉讼旨在阻止Me...
日期:08-25
优酷iPad2客户端升级打体验牌 便捷与高清合璧_ipad2优酷看不了
  作为国内最早全站支持苹果iPad的视频网站,优酷的HD客户端也同期于去年上线,并在今年5月iPad2上市前进行客户端升级,推出了对应支持苹果iPad2的优酷客户端。   最新推出...
日期:07-30
AirTag被主人用来追踪宠物:结果狗狗误食 送往急诊室
AirTag是苹果公司于2021年4月21日凌晨在2021苹果春季新品发布会上推出的一款蓝牙跟踪设备。其直径为31.9毫米,厚度为8.0毫米,重量为11克。每日优鲜上市股价它因为体积小,很容易...
日期:01-31
联想小新pad刷emui_联想小新 Pad 推送 ZUI 12.5 更新:升级 Android 11,横屏也能刷抖音
  7 月 5 日消息 今日 10 点联想为旗下多款平板电脑正式推送了 ZUI 12.5 系统更新,支持机型包括 YOGA Pad Pro、小新 Pad Pro 2021、小新 Pad Plus、小新 Pad Pro 和小新...
日期:01-21
三星980pro是pcie4.0吗「三星回应 990 Pro SSD 使用 PCIe 4.0 而非 5:根据市场情况判断」
IT之家 9 月 1 日消息,上周,三星正式发布了 Samsung990 PRO PCIe 4.0SSD,官方称 990 PRO 充分平衡了高速度、高能效和高可靠性的要求,采用了 3D TLC(3bit)颗粒以及新的自研主控,顺...
日期:09-17
预制菜新星竟是校园贷鼻祖 贾乃亮等发声与趣店“割席”
网友:收割完大学生之后又对准“宝妈”   近日,高调进军预制菜的趣店因以校园贷起家引发争议,与其合作的傅首尔、贾乃亮等多位明星连番发声与之“割席”。7月26日晚,#贾乃亮致...
日期:07-31
比4680更强 宁德重申麒麟电池一季度量产:10分钟快充 1000公里续航_4680电池续航能力
作为全球动力电池一哥,宁德时代在电池技术上准备了多条技术路线,去年发布了麒麟电池,比4680圆形电池性能更优秀,可轻松实现电动车1000公里续航,解决续航焦虑。抖音直播违规推广麒...
日期:02-08
荣耀Magic处理器「荣耀Magic 5将售3000多:首批搭载骁龙8 Gen2」
荣耀在上周发布并发售了荣耀X40 GT手机,随后有消息称,荣耀将把重点放在荣耀Magic 5中。荣耀Magic 5将会搭载骁龙8 Gen 2芯片,这颗芯片将在在下个月高通发布会中正式推出,随后的...
日期:10-24
百度手机浏览器内测 支持Android和Symbian_手机百度浏览器兼容性设置
  移动互联网作为下一个互联网热点,越来越成为兵家必争之地。昨天,一向自称专注搜索业务的百度也正式启动手机浏览器的内测,采用邮件邀请机制进行先期的试用。目前,这一产品...
日期:07-27
国内疫情百度_PHEIC上榜百度疫情热搜,百度官方辟谣“疫区国”
  根据百度“疫情地图”更新的疫情通报,截止1月31日15时,国内确诊病例达9737例,一日内增长上千例。疫情蔓延引发全民关注,从百度APP今日疫情热搜可以看出,除了新型肺炎实时动...
日期:01-01
消息称亚马逊计划裁员1万人 创公司纪录「亚马逊离职」
11月15日 消息:据《纽约时报》报道,亚马逊计划最早于本周开始裁员,影响约10,000名员工和技术人员,这不到亚马逊全球员工总数的1%。知情人士称,此次裁员是亚马逊历史上规模最大的...
日期:11-19
在天猫获超1000万名会员数品牌已超40家「天猫入驻品牌数量」
10 月 8 日消息,距离今年天猫双 11 还有一个月。数据显示,在天猫获得超过 1000 万名会员的品牌已超过 40 家。据介绍,会员可以让品牌直接服务消费者,是品牌在天猫双 11 实现确定...
日期:10-10
女子帮妈妈烧锅把美甲烧化了上热搜:网友纷纷看不懂
如今的很多热搜话题,着实令人看不懂,有的是花钱推的,有的则看不到什么意义。比如这个女子帮妈妈烧锅把美甲烧化了”的话题。网上的一则视频显示,1月25日初六,安徽阜阳,一女子回老...
日期:01-28
媒体:“快递中发现特大假药案”的警示与启示_物流快递公司协助卖假药
  时本  涉案金额2.1亿元,涉及全国31个省、直辖市、自治区,涉案犯罪嫌疑人达50余人……近日,由公安部挂牌督办的四川省最大一起生产、销售假药案被宜宾警方破获。9月28日,当...
日期:09-30
强热带风暴级!今年第20号台风纳沙来了:10级风力_21级台风风速
10月16日,据中国气象局消息,今年第20号台风纳沙”已于今天上午加强为强热带风暴级,其中心上午10点钟位于海南西沙永兴岛东偏北方向约970公里的海面上,就是北纬19.3度、东经121.1...
日期:10-18
youtube视频流量_YouTube计划推出流媒体视频在线商店服务
8月15日消息,据报道,近日,Alphabet旗下YouTube正计划推出其流媒体视频在线商店服务。   知情人士称,YouTube已重新与娱乐公司就参与该平台进行谈判,这一平台在YouTube被称为“...
日期:08-16
科技6点半:93万天价iPhone 13 Pro/iPhone 15配置曝光「iphone 13 pro 加价」
科技6点半,带您快速浏览今天手机行业发生的大事,每天18点30分准时送出,欢迎关注近日,俄罗斯奢饰品牌Caviar再次为iPhone 14 Pro设计出了一件“极致奢华”的新款替换外壳:机身后盖...
日期:10-28
谷歌和英伟达加入索尼行列 对微软收购动视暴雪计划表达担忧
  [TechWeb]1月13日消息,据国外媒体报道,索尼一直主张微软收购动视暴雪的提议是反竞争的,应该被阻止。如今,谷歌和英伟达成为最新两家试图阻止这笔交易的公司。  据外媒报道...
日期:01-13