您的位置:首页 > 互联网

存算一体架构有什么优点「以存算一体架构创新,迎AI 2.0时代」

发布时间:2023-08-08 13:42:43  来源:互联网     背景:

起初,ChatGPT爆火出圈是一件令人兴奋的事。无论是AI行业相关从业者,还是关注科技发展趋势的普通人都能真切感受到这股扑面而来的热浪,仿佛 “每条大街小巷,每个人的嘴里,见面第 一句话,就是AIGC”。ChatGPT的横空出世,不仅带来了AI的“iPhone”时刻,还使处在下行周期的全球半导体市场迎来转折点。据毕马威报告,ChatGPT等人工智能平台的出现,有望促进产生新的应用程序和平台,创造为行业和未来几年带来数千亿美元收入的细分市场。

同时,这个 “超费电”、“超费钱”又“超聪明”的“三超大户”也给社会增添了许多焦虑情绪。前微软全球副总裁、百度COO奇迹创坛创始人陆奇表示:“从现在开始,不论工作还是创业,请确保自己跟AI有关”, “AIGC不是什么当下风口,风口意味着投机主义,未免太低估AI对世界发展的影响。” 时代正在发生变化,你我皆应有所准备。

AI 2.0时代到来108模型“好汉”各显身手,谁会成为MaaS四小龙“

也许再过几年回头看, 2023 会是人工智能发展史上不可忽视的一年。就像《 2001 太空漫游》里的那块黑色石板,它第 一次出现时,猿猴们围着它好奇地打转,最终受到启发,学会了使用工具,进化成了人类;而当它再一次出现时,又引导人类向着更高维度前进,穿过万千星海,直到成为宇宙本身。

2012 年,Alexnet一鸣惊人,一举摘得imagenet图像识别类的冠 军,将图像识别的正确率提升到85%。以CNN为核心的人工智能技术,机器开始在计算机视觉(CV)等领域超越人类,开启了AI 1.0时代

realme 865手机

十年后, 2022 年底,ChatGPT横空出世,建立在海量数据训练的基础上,克服了单领域、多模型的限制,也打破了人类对于传统NLP人机交互中“人工智障”的偏见,驱动各行各业的AI应用进入2.0时代。我们很幸运,可以在短短十年间,见证人工智能跨时代的两个突破节点。

从今年 3 月以来,AIGC与大模型产品几乎是爆发式地推出,呈现出百花齐放之势,AI领域的模型更新已经是按周来迭代。就在不久前,Meta将其LLama2 的模型开放商用。模型越来越大,应用越来越多。当前国产大模型已经达到 108 个,正如水浒 108 好汉,人工智能领域自媒体走向未来甚至以“谁是 36 天罡?谁是 72 地煞?”为题评选出了百模争霸排行榜。

在刚刚闭幕的 2023 年世界半导体大会(WSCE)上,AI大算力芯片公司亿铸科技副总裁李明发表了题为《以存算一体架构创新,迎AI 2.0时代》的演讲,他预测,最早在明年,国内也可能初步形成MaaS(Model as a Servic, 模型即服务)四小龙的竞争格局就像在2014- 2017 年,基于CNN AI网络,国内也曾形成了CV(机器视觉)应用四小龙的竞争格局,继而引领了AI视觉领域数年的蓬勃发展。

三星心系天下w205g

存算一体芯片

华为gt手表微信提醒怎么弄

算力、能源双重挑战计算架构创新是“解药”

生成式AI惊艳全世界的背后离不开超大算力的加持。最近,IDC、浪潮 信息和清华大学全球产业研究院联合发布了2022-2023全球计算力指数评估报告》。报告指出,“计算力与经济增长紧密相关,计算力指数平均每提高 1 个点,数字经济和GDP将分别增长3.3‰和1.8‰”。首 次揭示了算力即生产力的事实。

眼下,transformer的划时代革新,不但会促成AI向通用人工智能AGI领域发展,还会引领第二次AI应用场景的爆发。而在此过程中,势必会产生上千亿美金的算力需求。

据中国信通院等机构的调研数据,ChatGPT的单日运营算力消耗占整个 2021 年中国智能算力总规模的3%。而这只是Open AI的一个模型而已,如果中国的百大模型持续蓬勃发展,对国内的智能算力要求将达到惊人的天文数字。

存算一体化设计理念

“假设目前的ChatGPT3 平均每张H100 每秒可以生成 6 个tokens(FP16,参数350GB),在不考虑级联或者模型稀疏化的前提下,假设每人每天提 5 个问题,每个问题会和GPT交互 5 次,每次消耗 30 个token,那么每人每天会消耗 750 个token,如果每天有 1 亿人在线使用查询,就需要约 15 万颗H100 芯片,仅仅H100 卡的硬件成本会达到 50 亿美金以上。如果计算系统成本的话, 100 亿美金也很难覆盖。” 李明补充道。

算力需求不断提升带来的挑战除了贵,还有费电。在今年国际集成电路设计领域最 高级别会议ISSCC上,AMD全球CEO LisaSu表示,目前实现Exascale(百亿亿次计算)的超级计算机功耗已经到达 2100 万瓦。而根据Green500的预计,到 2035 年,实现Zettascale(十万亿亿次计算)级别的一台超级计算机的功率会达到500 MW,相当于半个核电站的发电功率,到那时,世界再多的核电站也难以支撑如此大电力的消耗。而 2035 年离我们也并不遥远。

存算一体技术

回到ChatGPT3 的场景假设,亿铸科技认为,未来随着大模型的普级,如果有 1 亿人同时在线,在线提问率提升到30%,每个promt占 30 个token的话,就差不多需要 1700 万颗H100 芯片来提供其推理算力,每颗H100 的功耗在750W左右,该模型每天假设只运行 10 个小时,这些H100 芯片所在的数据中心一年的耗电量将超过三峡大坝的发电量。

从技术环境来看,未来数据量会越来越大、模型算法越来越复杂,算力要求越来越高,而支撑底层算力的摩尔定律却几近终结。巨大的剪刀差落在AI大算力芯片企业产业链的肩 上,从而带来了巨大的压力:比如有效算力的增长率、软件的编译、数据的带宽、存储的成本、能效比、生产工艺等等。

以AI云端推理卡为例,近年来由于工艺制程“卷不动”等种种原因,成本、功耗、算力难以兼顾。目前国内主流AI芯片厂商、初创企业纷纷谋求计算架构创新,试图找出兼顾性能、规模、能源利用率的方案,突破算力天花板。

清华大学集成电路学院副院长尹首一教授认为,在当前国际产业环境下,需要重新审视芯片算力公式,在可获取的低世代成熟工艺下去寻找持续提升算力的新途径,其中包括在芯片面积上探索先进集成技术和先进封装技术发展的可能性,以及在算力方面更加聚焦新型计算架构

存算一体技术

存算一体乘风起,扶摇直上解困局

李彦宏对中国科技贡献

存算一体化概念的提出最早可以追溯到上个世纪七十年代,斯坦福研究所的Kautz教授团队于 1969 年提出了存算一体化的概念,期望直接利用内存做一些简单的计算,减少数据在处理器与存储器之间的搬移。

2016 年的ISCA上,存算一体的相关论文开始出现。到了Micro 2017,英伟达、英特尔、微软、三星、加州大学圣塔芭芭拉分校等都推出了他们的存算一体系统原型。世界上第 一颗存算一体芯片在ISSCC2018 年首 次出现,今年已经是存算一体芯片工程落地走过的第 7 个年头了。

近年来关于存算一体相关的报道、研究源源不断涌现。学界,ISSCC上存算/近存相关的文章数量迅速增加:从 20 年的 6 篇上涨到 23 年的 19 篇;其中数字存内计算,从 21 年被首 次提出后, 22 年迅速增加到 4 篇。产界,巨头纷纷布局存算一体,国内陆陆续续也有近十几家初创公司押注该架构,这“扶摇直上”的架势,不仅仅是因为存算一体是天生为AI大模型计算而生的一种架构,乘了大模型的“东风”,更是因为该架构解决了长久以来造成算力发展困局的根本原因——“存储墙”。

存算一体架构是相对于传统冯·诺伊曼架构下的存算分离而言的。从技术理论的角度来看,要从阿姆达尔定律讲起。阿姆达尔定律是硬件加速设计的基本定律。这个定律包括两个因子,一个是加速器规模α,可以用先进的工艺或者优化设计去提升其工作频率,叠加之后就形成了 “裸算力”;而另一个因子F则是在计算周期里数据访存所占的百分比。

IBM的科学家做过一个研究,在存算分离的冯·诺依曼架构下,F值达到了90%以上,也就是每一次计算,数据搬运访存的时间超过90%,功耗也超过90%这意味着即使现在用5nm,将来做到0.5nm;现在花 1 亿做一颗芯片,将来花 10 亿去做一颗芯片,可以提升的性能空间也只有10%。

存算一体化设计理念

那么,如何减小F值呢?近存储计算是一种途径。例如,特斯拉的Dojo D1 用近存储,如果能将F值降到0.2、0.3,这意味着即使工艺还是7nm,性能也会提升3- 4 倍。

存内计算则是更进一步——亿铸科技希望通过存算一体(CIM)F值降低到0.1以下,如此一来,未来芯片的性能提升将主要取决于工艺的提升和设计的优化。

存算一体超异构开启AI算力芯片换道发展之路

据李明透露,亿铸早就已经根据ReRAM(RRAM)的特性着手使用先进异构封装的方式来实现系统级的芯片优化方案;在今年 3 月,亿铸科技正式公布了存算一体超异构芯片这一创新理念。它将会以存算一体(CIM)AI加速计算单元为核心,同时将不同的计算单元进行异构集成,以实现更大的AI算力以及更高的能效比,同时提供更为通用的软件生态,使得CIM AI大算力芯片真正满足AI算力增长第二曲线的需求,开启一条AI大算力芯片换道发展之路。

这颗存算一体芯片可实现基于75W功耗达到单芯片1P的算力,相比传统冯·诺依曼架构的AI推理芯片提升 10 倍左右的能效比,同时还能兼顾软件通用性。

李明表示,通过亿铸“四新一强”的整体优势,也就是存算一体架构创新、ReRAM新型忆阻器的应用创新、全数字化技术路径应用创新、存算一体超异构系统级创新以及极强的专业团队阵容,一定可以成为AI2.0时代破局的一道光


返回网站首页

本文评论
华为10月发布会曝光,继续押注折叠屏「华为折叠屏手机发布会」
据爆料,华为在10月份将有一场发布会,这也是在9月份的秋季发布会之后,又一波新品即将面世。来自数码博主提供的信息,华为10月份发布会定在本月底25号左右,新品包括华为P50Pocket n...
日期:10-09
APP也有春节档?三招教你“锁住”假期用户(春节放假app)
  春节除了是个扫福求红包,阖家团圆的日子,更是APP运营者营销推广的好时机。忙碌了一年的人们更习惯于在此期间下载一些APP来满足休闲娱乐的需求,各类APP自然也是使出浑身解...
日期:10-12
百度百家号“创作人”认证上线 可获得更多广告收入_百家号创作者登录入口
7月20日 消息:百度旗下百家号宣布上线『创作人』认证。redmi note 10 pro拍照『创作人』是百家号作者通过认证方式,展示自己原创能力,从而获得更高的广告收入和更好的创作权益...
日期:07-20
国美开启iQOO Z1手机预售 144Hz竞速屏让你重新认识游戏_【速发】vivo IQOO Z1 144Hz竞速屏 5G旗舰手机
  5月19日下午,iQOO发布了全新旗舰手机Z1,而Z系列也是iQOO打造的全新手机系列。iQOO Z1最大的亮点则是搭载了天玑 1000 Plus 5G 芯片,产品也是首款搭载旗舰天玑系列芯片...
日期:07-14
小米平板6啥时候出「小米平板6将推14英寸版!与MIX Fold 3同步推出」
快科技8月1日,今天,知名数码博主数码闲聊站爆料消息,称小米平板6将推出一款Max版本,预计与小米MIX Fold3同步推出。据介绍,小米平板6Max将是小米首款14英寸大屏的旗舰平板,平板搭...
日期:08-01
各种搞怪单机游戏 4399游戏盒让你步步惊心_4399游戏盒的小游戏
  中秋去国庆来,眼看国庆七天大假就要来临!大家有没想法怎么HAPPY的过呢?没想法不代表不HAPPY,在4399游戏盒玩玩那些“简约不简单”的休闲游戏吧!各种搞怪各种有趣,不管是打...
日期:07-23
抖音推出“抖音端内在线履约”功能_抖音上线官方创作服务平台
10 月 11 日消息,抖音电商日前发布了关于教育培训抖音端内在线履约功能及迁移公告。公告称,随着用户对于购买课程、课程学习等流程体验要求不断提高,目前,抖店购买课程需去其他...
日期:10-12
腾讯发布超强算力集群HCC 性能提升3倍「腾讯超级计算中心」
4月14日 消息:腾讯宣布发布面向大模型训练的新一代HCC高性能计算集群(申请内测地址:cloud.tencent.com/act/pro/hccpnv5),整体性能比过去提升了3倍。它搭载了NVIDIA H800Tensor...
日期:04-14
iPhone 14 Plus震动马达面积惊人,安卓几无一款能比,游戏手机实锤?「iphone12 震动马达」
10月9日消息 iFixit拆解发现,iPhone 14 Plus搭载一块罕见的正方形震动马达体,面积远大于同系列的其它三款手机。数码博主肥威提供的参考信息显示,iPhone 14/14 Pro马达面积约18...
日期:10-12
Redmi K30手机首发骁龙765G,官方带来深度解读_redmi k30 765g
  12月5日消息 昨天,高通亮相了全新的骁龙765和骁龙765G 5G移动平台,今天高通正式公布了这两款处理器的详细规格。在今天下午,Redmi红米手机官方也带来了骁龙765G的深度解读...
日期:04-22
售价将近8000块钱 老外发现谷歌Pixel 7 Pro屏幕巨耗电
今日消息,XDA发现,谷歌Pixel 7 Pro屏幕耗电量惊人。哈弗H6国外具体来说,Pixel 7 Pro在600尼特亮度下的功耗是3.5W-4W之间。相比之下,三星Galaxy S22 Ultra在1100尼特亮度下的功...
日期:10-15
12亿春晚红包活动收官,众安保险送灯笼,亮相专场红包雨(21年春晚红包活动)
  2月12日,备受瞩目的春晚红包活动收官。据抖音发布的数据,今年春晚红包总互动次数达703亿,直播间累计观看人次12亿。春晚观众通过集灯笼和刮红包雨,领取来自保险科技龙头众...
日期:07-16
每周AI大事件|安卓版ChatGPT上线、OpenAI关闭AI检测器、B站推大模型
欢迎来到的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。Part1动态[国内要闻]网易有道发布“子曰”大模型...
日期:07-28
百度绘图员是做什么的「业界人士称百度画图AI训练素材非套壳,采用英文开源图片素材」
3月23日 消息:今日,针对部分网友有关“文心一言文生图功能”的反馈,百度官方回应称,文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。“在大模...
日期:03-24
iPhone 14 Plus明天首销 6999起 没发售就破发「苹果14号预售什么时候发货」
明天,也就是10月7日,iPhone 14 Plus将正式首销,该机有着6.7英寸的大屏,首发售价为6999元起,首批参与iPhone 14 Plus预订的用户,今明两天就会收到快递信息,明天上午就能拿到手机了。...
日期:10-11
彻底“玩转”车内空间,上汽大通MAXUS MIFA 9试驾体验_上汽大通maxus内饰
当“电动、智能、舒适”成为MPV消费者选车关键词,全球多人出行领域,全尺寸纯电MPV的“风口”已经到来。需求决定市场,在国家开放二胎、鼓励三胎政策的刺激下,更大空间、高度舒适...
日期:09-19
雷克萨斯 es降价_丰田“加价神车”半年销量暴跌30%!雷克萨斯ES又全面涨价
作为丰田旗下的豪华汽车品牌,雷克萨斯一直的销量都很不错,特别是雷克萨斯ES,可以说是占据了雷克萨斯的半壁江山。即便是被网友疯狂吐槽“同级别动力最弱”,但也丝毫不影响该车的...
日期:08-16
崩坏星穹铁道始发测试「《原神》开发商新作:米哈游《崩坏:星穹铁道》预约超2000万」
今天,《崩坏:星穹铁道》官方宣布,游戏全平台预约人数已经达到了2000万人。目前,距离该作开启预约刚刚过去一周的时间,这意味着,在短短的七天时间内,就已经有上千万人预约了游戏。z7...
日期:04-01
车船税没白交 一电动出租车涉水漂过:燃油车主集体看呆_车船税电动车免吗
近日台风杜苏芮来袭,不少地方遭遇了强降雨,引发城市内涝,淹没了很多低洼路段,这个时候,很多司机就犯了难,毕竟强行通过很容易出事,所以当大家都一筹莫展时,一台可以顺利通过的车也就...
日期:07-29
华为回应“放弃在英国剑桥建10亿英镑研究园区”传闻:仍在评估该项目_网易订阅
英国《每日电讯报》3月5日消息,据悉,华为已放弃在英国剑桥建设一座10亿英镑(约合12亿美元)研究园区的计划。报道称,华为原本计划在这块500英亩的土地上建造尖端设施,用于开发宽带...
日期:03-06