您的位置:首页 > IT热点资讯

算力gh/s_ChatGPT正在榨干算力,如何打赢这场算力攻坚战?

发布时间:2023-03-10 15:26:35  来源:互联网     背景:

如何用更少的电,输出更高的算力?

史上用户增速最快消费级应用ChatGPT,自去年 11 月底发布以来,让全球为其狂欢,各方势力仍持续为此“上火”:用户急着试探ChatGPT是否真的有那么聪明,每天有超过 2 亿的人都在疯狂抛出各式各样的问题“刁难”ChatGPT,并展现自己的“调教”成果;

算力ghs

(ChatGPT每日点击访问量统计 图源:国盛证券研究所)

国内互联网大厂们基于要“活下去”的心愿和讲更动听的AI故事,急着与ChatGPT扯上关系:一时间百度、腾讯、阿里等纷纷拿出相关技术布局以及底层设施储备,为中国的ChatGPT奋力一战;

近 3 个月过去,ChatGPT热度丝毫未减,有关部门也在努力

2 月 24 日,东数西算一体化算力服务平台在宁夏银川正式上线发布。据悉,东数西算一体化算力服务平台将瞄准目前最稀缺、刚需迫切的ChatGPT运算能力,以支撑中国人工智能运算平台急需的大算力服务。

目前,该平台已吸引曙光、中国电子云、天翼云、阿里云、华为、中兴等大算力头部企业,以及国家信息中心、北京大数据研究院等中国主要大数据机构入驻。

各方势力蜂拥而至,足以见得,目前的算力填补不了ChatGPT们的需求,众志成城,才能打赢ChatGPT算力攻坚战。

本文试图探究,ChatGPT到底需要多大的算力?升级算力的路子是什么?

ChatGPT,企图榨干算力

通用AI时代来临,人类对于算力的需求正逐渐失控。

伴随着摩尔定律失效,大模型时代来临,算力不再“淡定”,每5- 6 个月就要翻倍,以困兽冲破牢笼之势飞速增长:

算力 p

(模型发布时间及算力变化 图源:浙商证券)

2018 年,谷歌带着 3 亿参数BERT模型,闯进大众视野,开启大规模预训练模型时代;在这之后,OpenAI、英伟达、微软先后推出 15 亿参数的GPT-2、 83 亿参数的Megatron-LM、 170 亿参数的图灵Turing-NLG,各个大厂暗自较劲,参数规模从十亿级别竞争到了百亿级别。

2020 年 6 月,OpenAI又将算力“战场”拔高了一个层级:推出 1750 亿参数的GPT-3,把参数规模提高到千亿级别。随后一山更比一山高:微软和英伟达在 2020 年 10 月联手发布了 5300 亿参数的Megatron-Turing自然语言生成模型(MT-NLG)。

2021 年,国内迎来预训练大模型元年。在这一年里,华为、百度、阿里等中国企业开始发力:

华为云联合北京大学发布盘古α超大规模预训练模型,参数规模达 2000 亿;

百度推出ERNIE 3.0 Titan模型,参数规模达 2600 亿;

贾跃亭 法拉第股份

阿里达摩院的M6 模型参数达到 10 万亿,又将大模型参数带到新的高度 ……

在这之中表现最为亮眼的,莫过于从GPT- 3 迭代而来的ChatGPT, 2022 年底一出世就博得全球目光,无论是在模型预训练阶段,还是模型被访问阶段,ChatGPT都对算力提出“前所未有”的要求。

在模型预训练阶段,从GPT- 1 到GPT-3,从GPT-3 Small到GPT-3 175B,对算力的需求呈指数型增长。

在大模型的框架下,每一代 GPT 模型的参数量均高速扩张,参数量从GPT- 1 的1. 17 亿个,翻了 1029 倍至GPT-3 的1750 亿个;

具体来看,在GPT- 3 历代模型中,短短 2 年,参数量便从GPT-3 Small的1. 25 亿个,翻了 1399 倍至GPT- 3 的 1750 亿个,未来GPT- 4 还要翻倍:根据 Altman 的介绍,预计GPT- 4 的参数将会达到 2800 亿个。

与此同时,在模型被访问阶段,ChatGPT对算力同样有着“狂热”需求:

王功权私奔现状

据Similarweb数据,ChatGPT官网在 2023 年 1 月 27 日- 2 月 3 日一周内吸引的每日访客数量高达 2500 万。假设以目前的稳定状态,每日每用户提问约 10 个问题,则每日约有2. 5 亿次咨询量。

如果想要“消化”掉这2. 5 亿次咨询量,根据国盛证券测算,需要大量的A100 GPU芯片“连夜赶工”:

假设每个问题平均 30 字,单个字在A100 GPU上约消耗350ms,则一天共需消耗729, 167 个A100 GPU运行小时,对应每天需要729,167/24=30, 382 片英伟达A100 GPU。

也就是说,目前每天2. 5 亿次咨询量,需要30, 382 片英伟达A100 GPU同时计算,才能把ChatGPT“喂饱”,以下是ChatGPT部分耗费(电费以0. 08 美元/kwh计算):

算力gh/s

而以上图表所显示的,仅仅是2. 5 亿咨询量需求下,使用英伟达A100 GPU相关设备,ChatGPT所需要的算力成本。

其背后对能源的消耗,更是“触目惊心”。

环球零碳研究中心曾粗略合计了ChatGPT全生命周期的碳足迹:自 2022 年 11 月 30 日运行以来,其制造设备的碳排放量超过了33. 41 吨,模型训练碳排放超过 552 吨,运行 60 天碳排放约为229. 2 吨。

也就是说上线两个月的ChatGPT,全过程碳排放超过了814. 61 吨,而这,相当于 186 个丹麦家庭每年消耗的能量。

现阶段ChatGPT背后的大模型仍在迭代,每日访问量仍在递增,未来还会有更多的ChatGPT们涌现。彼时,算力以及其背后的功耗还能顾得过来吗?

对此,苏妈表示了担忧:在ISSCC2023 上,苏妈表示根据目前计算效率每两年提升2. 2 倍的规律,预计到 2035 年,如果想要算力达到十万亿亿级,则需要的功率可达500MW,相当于半个核电站能产生的功率,“这是极为离谱、不切合实际的”。

算力大战是怎么回事

(2010- 2040 功率发展情况 图源:2023 IEEE international Solid-State Circuits Conference)

为了达到这样的效果,我们的计算效率起码要每两年提升2. 2 倍,才能匹配上 2035 年的算力需求。苏妈坦言,尽管用上目前最 先进的计算技术、最 先进的芯片,也满足不了ChatGPT们。

而当ChatGPT吞噬完大量算力、能源,“吃饱喝足”之后,各国打的不再是算力之争,而是“国运之争”:一旦搭载ChatGPT的人形机器人能够大批量地上岗时,吃人口红利的国家不再有显著的优势。

ChatGPT们,包括未来的人形机器人们,正对算力、能源“虎视眈眈”,同时对人类的威胁也不容小觑:往小了看,影响到个人职业发展,往大了看,牵扯到国家竞争力。

存算一体承载和释放ChatGPT

而一切的一切,都得从打好算力之争开始。

传统的AI1. 0 时代的代表企业,例如AMD已经开始探寻新的出路:依靠系统级创新实现更大的突破。系统级创新,即从整体设计的上下游多个环节协同设计来完成性能的提升。

一个经典案例是,在对模型算法层面使用创新数制(例如 8 位浮点数FP8)的同时,在电路层对算法层面进行优化支持,最终实现计算层面数量级的效率提升:相比传统的 32 位浮点数(FP32),进行系统级创新的FP8 则可以将计算效率提升 30 倍之多。而如果仅仅是优化FP32 计算单元的效率,无论如何也难以实现数量级的效率提升。

于是,为解决“如何用更少的电,输出更高的算力”这一终 极命题,业内给出不少技术及方案:量子计算(量子芯片)、光机芯片、芯粒(Chiplet)、3D封装、存算一体……。同时也有团队将这些技术进行结合,以期达到系统级创新。

在这之中,现在能够兼容CMOS工艺又能尽快量产的有芯粒、3D封装、存算一体。而芯粒、存算一体是目前业内普遍认为,能够突破 AI 算力困境,进行架构创新的两条清晰路线。

浙商证券指出,面对未来潜在的算力指数增长,短期使用芯粒异构技术加速各类应用算法落地,长期来看,打造存算一体芯片,或将成为未来算力升级的潜在方式。

算力 pib

(架构创新路线 图源:浙商证券)

芯粒异构技术成为“种子”选手的原因是,该技术能够突破先进制程的封锁,且大幅提升大型芯片的良率、降低设计成本、芯片制造成本。

而之所以说是短期,是因为该技术路径需要牺牲一定的体积和功耗,导致其目前只能在基站、服务器、智能电车等领域广泛使用。

为解决这一“小缺陷”,目前在学术界,已有团队选择将芯粒异构技术与存算一体架构相融合,以期达到1+1> 2 的效果:

在ISSCC2022 上,复旦大学芯片与系统前沿技术研究院刘明院士团队提出多芯粒的存算一体集成芯片——COMB-MCM。

据团队表示,电路上COMB-MCM采用存算一体设计,能够降低功耗、提高系统算力。在存算一体的加持下,该芯片具有精度无损且支持非结构化稀疏的自适应能效调节特点,也就补足了芯粒异构技术的短板。

既是芯粒异构技术的最 佳拍档之一,同时也是未来架构创新路径之一,存算一体为何能博得多方“欢心”?

这是因为存算一体成功打破了“三堵墙”:

在传统冯·诺伊曼架构之下,芯片的存储、计算区域是分离的。计算时,数据需要在两个区域之间来回搬运,而随着神经网络模型层数、规模以及数据处理量的不断增长,数据已经面临“跑不过来”的境况,成为高 效能计算性能和功耗的瓶颈,也就是业内俗称的“存储墙”。

算力 p

(存储墙限制具体表现 图源:浙商证券)

存储墙相应地也带来了能耗墙、编译墙(生态墙)的问题。例如编译墙问题,是由于大量的数据搬运容易发生拥塞,编译器无法在静态可预测的情况下对算子、函数、程序或者网络做整体的优化,只能手动、一个个或者一层层对程序进行优化,耗费了大量时间。

这“三堵墙”会导致算力无谓浪费:据统计,在大算力的AI应用中,数据搬运操作消耗90%的时间和功耗,数据搬运的功耗是运算的 650 倍。

而存算一体能够将存储和计算融合,彻底消除了访存延迟,并极大降低了功耗。基于此,浙商证券报告指出,存算一体的优势包括但不限于:具有更大算力(1000TOPS以上)、具有更高能效(超过10-100TOPS/W)、降本增效(可超过一个数量级)······

存算一体,正在冲破三堵墙“解救”ChatGPT,加速算力升级。

大算力芯片需扎好马步

华为手机吊打小米手机

除了架构创新,芯片本身的升级迭代也非常重要。作为基石的底层芯片,需要足够“大”,AI大算力应用才能高楼平地起。

bte算力大战

(ChatGPT研究框架 图源:浙商证券)

那么AI大算力说的“大”到底是多大?

以 2020 年发布的GPT3 预训练语言模型为例,采用的是 2020 年最 先进的英伟达A100 GPU,算力达到624 TOPS。 2023 年,随着模型预训练阶段模型迭代,又新增访问阶段井喷的需求,未来模型对于芯片算力的需求起码要破千。

再例如自动驾驶领域,根据财通证券研究所表明,自动驾驶所需单个芯片的算力未来起码1000+TOPS。

目前巨头已开始卷上1000+TOPS的SoC,主要用于自动驾驶领域:在 2021 年 4 月,英伟达就已经发布了算力为1000TOPS的DRIVE Atlan芯片。到了今年,英伟达直接推出芯片Thor达到2000TOPS。

故,大算力背景下,大算力芯片起码得是1000+TOPS选手。

而在符合大算力条件下,也需要考虑到“用料”的功耗、造价问题。

目前,在存算一体架构优势下,亿铸科技为当前的算力、能耗困局,给出一条解题思路:选择有着面积更小、微缩性好等特性的RRAM实现“同等能耗,更大算力;同等算力,更低能耗”,为各大数据中心、自动驾驶等应用领域“排忧解难”,在数字经济时代,实现绿色算力。

算力 g

而在存算一体架构下,传统SRAM、闪存(Flash ) 均有着致命的缺陷,无法实现在大算力赛道的降本增效:

SRAM面积较大,占据了英伟达数据中心级GPU总逻辑面积的约50%。而一个A100 GPU的成本就在 1 万美元以上,根据测算,成熟产品每GB SRAM内存的成本将在 100 美元左右,最贵的存储器当属SRAM。

除了成本难压之外,SRAM也存在着不稳定的问题。SRAM 的问题在于它的静态电流大,当大量的 SRAM 堆积在芯片上时,会产生一种被称为 DI/DT 的工程性问题(也就是电流在短时间内大量变化),应用落地极具挑战性。

基于这两点考虑,SRAM 并不适合做大算力场景。据了解,目前采用 SRAM 的这些公司大都在基于边缘端做小算力的场景,比如语音识别、智能家居的唤醒、关键命令词的识别等。

同时,Flash也面临着因微缩性差导致不稳定的问题。传统存储器的局限性让行业逐渐将目光逐渐转向了新型存储器:

  • 比如近期英飞凌宣布其下一代 AURIX ™微控制器 ( MCU ) 将采用新型非易失性存储器 ( NVM ) RRAM ( ReRAM ) ;

  • 亿铸科技自 2020 成立以来,就专注于研发基于RRAM的全数字存算一体大算力AI芯片。

ChatGPT,需要存算一体的“解救”,也需要该架构下,更物美价廉(微缩性好、单位面积小、成本低)的新型存储器RRAM的大力支持。

亿欧获悉,亿铸科技今年将诞生首颗基于RRAM的存算一体AI大算力芯片。届时,或许“ChatGPT们”以及其下游的应用能够基于该芯片,更轻松地吸取算力,更快实现“智力”升维。


返回网站首页

本文评论
华为麒麟后 曾经第三大手机处理器三星Exynos也倒了:转攻汽车「三星exynos处理器相当于骁龙」
在华为麒麟芯片受阻后,手机处理器市场,再次回到了高通和联发科唱主角戏的局面。华为开发者大会鸿蒙操作系统发布媒体最新报道称,管理三星手机业务的MX分部,已经成立了新的手机芯...
日期:12-15
森海塞尔hd260耳机测评_森海塞尔全新升级的HD 660S2耳机 富有感染力的低音和更广阔的音域
德国韦德马克, 2023 年 2 月 8 日——森海塞尔全新的HD 660S2 耳机扩展了600 系列的性能,该系列长期以来一直是高性能高保真耳机的标杆。森海塞尔为了满足高保真用户群体的需...
日期:02-09
小米13发布时间泄露:下周四!_小米13号发布会有什么
小米下代旗舰手机小米13已经完成入网,就等发布会就可以开售了,近日博主熊猫很禿然爆料了小米13的发布信息,小米13系列手机将于12月1日也就下周四发布,但并没有说是否首发,小米官...
日期:12-12
云米推出高速5G CPE:3.4Gbps理论下行速率 一秒下载一部电影_云米5G CPE
云米推出高速5GCPE:3.4Gbps理论下行速率一秒下载一部电影10月21日,云米在北京推出高端AI科技家电品牌coKiing,并同时发布了VIoT5GCPE(CustomerPremiseEquipment,客户终端设备),这...
日期:07-22
华为官网上架Mate50 RS保时捷版手机壳 999元起!_华为保时捷rs手机壳价格
作为华为Mate 50旗舰系列中的顶配机型,Mate 50 RS保时捷设计版以独特的赛道外形设计和12999元的售价一枝独秀。同时,这款机型的官方配件也走是高端路线,从华为官网的信息来看,华...
日期:09-23
小米12T Pro两亿像素定了!或卖5200元「小米10pro1亿像素」
中关村在线消息:10月8日,据相关爆料,卢伟冰最近在社交平台中发布了有关小米12T系列产品,其中提到了小米12T和小米12T Pro两款机型,小米12T Pro获奖采用6.67英寸AMOLED面板,分辨率...
日期:10-09
华为公司年销售收入为15000万元_徐直军:预计华为全年实现销售收入6369亿元
12 月 30 日讯:据澎湃新闻报道,华为轮值董事长徐直军表示,预计华为全年实现销售收入 6369 亿人民币,经营结果符合预期。蔚来et7和es8蔚来汽车三季报和硕代工iPhone国庆节期间大...
日期:12-30
799元!华为Mate 50系列5G通信壳上架:保时捷版899元「华为手机保时捷mate20限量版」
近日,由数源科技SoyeAlink为华为Mate 50系列打造的5G通信壳正式上架,该手机壳已经适配华为Mate 50全系机型。详情页显示,该通信壳提供石墨黑、丁香紫两款配色,其中Mate 50和Mate...
日期:09-24
特斯拉:国产Model 3/Y将大幅降价“消息不实”「国产特斯拉Model 3降价」
  相关新闻:特斯拉降价在即,小鹏理想彻底慌了苹果iphone14pro灵动岛演示apu a10 7850k  财联社9月30日电,针对大幅降价的传言,特斯拉方面对记者表示,该信息并不属实。今日稍...
日期:10-02
魅蓝新品发布会定档:有望推出多款生态产品_魅蓝e发布会
魅蓝今日官宣,将于8月18日19:00举行新品发布会,主题为秋日的新生”。从海报下方魅蓝lifeme”字样可看出,魅蓝的这次发布会大概率是推出围绕魅蓝Lifeme方面的产品,比如智能家居、...
日期:08-16
26层养猪大楼火了:用生产iPhone方式养猪 可年产120万头「中国高楼养猪」
最近一段时间湖北鄂州市一栋26层高的养猪大楼火了,受到很多网友关注。据悉,该项目位于湖北鄂州市碧石渡镇虹桥村,总投资40亿元,建设两栋26层高养殖大楼,建筑面积80万平方米,待两栋...
日期:02-13
起身或者蹲下时,膝盖会“咔咔”响?出现这些症状一定要重视「蹲下的时候膝盖咔咔响」
起身或者蹲下时,膝盖会“咔咔”响?出现这些症状一定要重视apple pay在中国应用范围日常生活中国美的购物app相信很多人都有过这样的经历有时起身或者蹲下的时候会听到膝盖“咔...
日期:07-22
20h2版本升级win11_Win11首个大版本更新来了!22H2版本终于全面推送
对于关注Win11动向的用户来说,22H2”大概是一个已经听到耳朵起茧子的词了,作为Win11正式上线以来的首个大版本更新,它理所应当的获得了大量用户的关注。华为耳机freebuds lite...
日期:09-21
顺丰寄丢11000元手机仅赔1000:合同纠纷超100个「顺丰丢手机怎么赔偿」
近日,广东深圳夏女士价值11000元iPhone手机被顺丰寄丢,但顺丰却根据保价只赔偿1000元,引发运输合同纠纷热议。据悉,夏女士在今年3月份将一部全新未拆封的iPhone13 Pro Max从深圳...
日期:09-07
每年回国的华裔科学家才1400名?流失去美国的却高达数万名_美国禁止回国的35位科学家
运营商财经 康钊/文前段时间,据《亚洲周刊》报道,根据美国哈佛大学、普林斯顿大学、麻省理工学院(MIT)的一份联合报告显示,已有1400名华裔科学家返回中国发展。就这一消息,让很多...
日期:01-28
骁龙8+配120W神仙秒充 Redmi K50宇宙大作稳了
Redmi K50宇宙终极大作也就是之前传闻中的Redmi K50 Ultra定档8月,卢伟冰已经用上,且发文称“新手机真好用 稳了”。今天数码博主@数码闲聊站 再次爆料称Redmi K50 Ultra将配...
日期:07-31
还不知道怎么选购家用投影仪?一文教你如何买到合适且性价比高的投影
最近很多朋友都在寻找怎样才能买到一台优 秀的家用投影仪,毕竟大几千的东西,还是要做足准备,并不是说随随便便冲着大促优惠下单购买就完事了的,投影仪的音画表现,实际配置,售后服...
日期:11-02
moto X30 Pro发布:2亿像素传感器配骁龙8+ 售3699元起
凤凰网科技讯(作者/贾楠) 8月11日消息,摩托罗拉于今日机型线上发布会,发布moto X30 Pro、moto S30 Pro、moto razr 2022等产品。其中moto X30 Pro首发了两亿像素传感器,搭载骁龙8...
日期:08-13
蓝牙耳机啥牌子好?测评专员盘点2022蓝牙耳机分享名单「蓝牙耳机品牌测评」
蓝牙耳机这几年风头正劲,厂家的竞争也十分激烈,体验更好的同时价格也越来越亲民。但要说到蓝牙耳机啥牌子好,我想很多新手都不太了解。身为数码测评专员,雷朋每年都会接触到超多...
日期:08-04
华为mate50卫星电话_华为Mate50系列或将支持卫星通信 抢先iPhone实现卫星通讯?
9月2日 消息:华为Mate50即将发布,今日余承东预热称,该机将搭载“向上捅破天”的通讯技术。而据此前爆料,余承东暗示的技术,有可能是Mate50早于iPhone抢先实现卫星通讯。谷歌华为...
日期:09-03