您的位置:首页 > 互联网

韦乐平 著作「韦乐平:大模型面临跨群跨域跨云挑战」

发布时间:2024-04-10 23:28:06  来源:互联网     背景:

韦乐平:大模型面临跨群跨域跨云挑战 通信产业网|2024-04-10 11:08:39作者:胡媛来源:通信产业网

【通信产业网讯】(记者 胡媛)近几年,人工智能特别是2023年ChatGPT的狂飙式发展现实使人们相信,人工智能不再能仅仅看作是一项能够改变未来发展和商业模型的新技术和商业工具,而将在很大程度上重塑世界格局和人类社会,影响到每一个国家、机构、企业和个人。

ChatGPT开创AI新时代

中国电信集团科技委主任韦乐平认为,算力、数据、算法是AI的基础、根本和灵魂。AI的三层次模型包括,任务模型即模型的应用;领域模型即行业模型;认知模型(AGI)即通用AI,能看、能听、能思考、能规划,实现真正类人的智能。

首先,芯片水平决定AI计算能力的物理上限,关键是GPU及其应用生态。目前,高端芯片制程,特别是GPU及其应用生态是我国AI发展的最大短板。

其次,数据要素是数字经济的核心生产要素和重要经济资源。数据的规模、质量和治理体系决定了AI应用的效果和质量。数据的可用数量和质量也是我国短板。

最后,算力离开算法只是一个巨大的高耗能电热器,基于深度学习的高效智能算法是发挥算力作用,规避低效蛮力计算的的必然方向。

极氪ceo向车主致歉

“ChatGPT开创AI新时代。”韦乐平表示,ChatGPT是AI驱动的自然语言处理工具,GPT-4版本不仅能聊天,而且已具备多模态能力和自主学习、自我进化能力,正成为一款智能决策和创作系统。

韦乐平指出,虽然ChatGPT引入基于人类反馈的强化学习(RLHF),使得模型训练和推理结果与人类常识、认知、需求、价值观对齐,还能自己创编新知识。 但ChatGPT还存在一些技术局限。

第一,蛮力计算无地洞,估计GPT-6可能需要10万张H100卡,耗电7百万度,加州电网也难支撑。算力尽头是能源,靠核聚变电厂(奥特曼)。

第二,海量的高质量语料库和高效算法训练才能使模型拟合真实世界,GPT4模型参数已达约1.8万亿(超松鼠大脑),离人脑(100万亿)不太遥远,但仍有荒谬应答(幻觉),幸顿称为“白痴天才”。

第三,生成式AI尚处于期望膨胀期,潜力不可低估,也不应无限夸大,并不适用一切场景,多数场景有更多其他AI技术更适用。

生成式AI尚处于期望膨胀期

在韦乐平看来,生成式AI尚处于期望膨胀期,2~5年进入成熟期。

为了支持越来越大的模型训练新需求,规避伴随而来的性能、处理时长和成本的挑战,GenAI需要最佳联网技术的支撑。

第一,以太网。传统以太网难以支持大模型训练,但是基于强大以太网生态上的无损以太网,特别是超级以太网仍将是最重要的联网技术。

第二, PCIe。可以为复杂的GenAI扩展距离、简化系统架构、减少功耗。

第三,芯片光互连。相比芯片电互连,可以大幅提升计算集群的扩展性(超100T),功耗很低,物理尺寸也更小。

韦wei

第四,CXL。不仅可以继续用来增大服务器的内存规模,而且将越来越多的用来承担GenAI训练的加速器作用。

韦平简介

第五,IB。目前是性能最佳的成熟联网技术,但是封闭和价高,仍将维系在高端大模型训练市场的相当份额。

未来大模型跨群跨域跨云的挑战

“大模型价值在应用。”韦乐平强调,大模型在最尖端领域,高技术、高投入,高能耗、高风险。仅ChatGPT等5-6个基础大模型能够长期存活。在次尖端领域,行业大模型层出不穷,成千上万,各领风骚。在泛在应用,无穷无尽,是各类大模型真正体现价值和商业落地的地方。

同时,小模型的作用不容轻视。大模型训练所需要的技术、算力、语料以及成本很高,却通而不专,在面向具体运行环境的适应性和经济性方面,往往小模型更加实用,省钱、省力、省时间。目前,已经有多种小模型产品问世。

由于单站资源受限,未来可能需要在园区、AZ乃至更大范围内由多个物理集群构成一个超级逻辑集群进行联合训练才能支撑超大模型的训练。推理本身与具体业务场景相关,更可能需要跨域跨云实施。

韦乐平指出,未来大模型跨群跨域跨云的挑战。距离增大导致时延变大,高频次通信的效率将降低,导致网络吞吐量降低,影响GPU利用率。此外,故障概率也将增大。

韦乐怡 广西

韦乐平建议,解决不同集群间参数的传递和同步以及大量数据跨群跨域跨云传输的不同时延导致的训练速度减慢的问题。

一方面,训练任务被拆分到不同集群上实行并行训练,根据不同的训练任务和场景,采用数据并行、流水线并行、张量并行等多种不同策略。

另一方面,采用空芯光纤从物理层上直接降低数据传递时延(降33%)。

韦乐平认为,目前的AI依然只是技术,还不算是科学,深度学习已开始遇到发展瓶颈。

责任编辑:胡媛


返回网站首页

本文评论
中国电信:在通用大模型方面今年还会有新的成果「电信系统模型」
8月9日 消息:在昨日晚间的2023半年度业绩会上,中国电信公告称,2023年上半年营收2586.8亿元,同比增长7.7%;净利润201.53亿元,同比增长10.2%。同时,在会上,中国电信董事长兼首席执行...
日期:08-09
HTC年会大撒1300万新台币奖金,最大奖是20万元现金
  IT之家1月5日消息 虽然目前HTC的手机部门面临很大的困境,但HTC 2018年是盈利的,主要是向谷歌出售了Pixel手机业务部门的11亿美元交易所带来的。   据悉,HTC于4日在南港...
日期:12-18
高通和微软合作构建 Snapdragon 计算平台上的生成式人工智能
5月24日消息:在 Microsoft Build 2023 活动中,高通技术公司展示了其在设备上人工智能方面的最新创新,包括在 Snapdragon 计算平台上运行生成式人工智能,并为在搭载 Snapdragon...
日期:05-24
美团闪购:七夕“标配”鲜花订单是去年同期3倍 美妆宠物成90后送礼新选项
  8月14日,美团闪购发布的七夕送礼消费报告显示,今年七夕通过外卖送花送礼的订单,近7成是90后。在他们过节送礼的热情催化下,作为主力军的鲜花外卖订单量达到了去年七夕的3倍...
日期:09-03
联通链:融合新一代信息技术,助力数智产融可持续发展(联通智网创新中心)
  近日,2021世界人工智能大会在上海盛大召开,大会以“智联世界,众智成城”为主题,展示了全球大数据、人工智能、区块链等新一代信息技术的最前沿发展趋势,旨在推动全球科技创...
日期:11-12
工信部:春节假期移动数据流量快速增长,5G流量占比达一半_过年移动流量
2024年春节,通信业网络运行安全稳定,通信服务平稳有序,移动数据流量、国际和港澳台漫游业务快速增长,实现2024年良好开局。一、5G流量占比达一半,视频类APP持续活跃2024年春节期...
日期:02-20
智享会x法大大丨《员工体验全景调研》重磅发布:七成企业关注电子签应用
7 月 13 日,智享会与法大大联合出版的《员工体验全景调研》报告正式发布。该报告围绕员工体验,从“数字化全流程角度切入,提高员工便捷性”“聆听员工心声、驱动员工敬业度”...
日期:07-14
一度因黑客攻击被迫停服:狼人杀游戏《鹅鸭杀》服务器重新上线
近日,早在2021年就上架的狼人杀题材游戏《鹅鸭杀》突然在国内爆火,成为了各大主播直播时的宠儿”。元宇宙概念头部企业首次覆盖vr激增的人气虽然让游戏获得了不低的知名度,但也...
日期:01-13
paypal员工数量「PayPal将裁员约2000人 约占员工总数7%」
2月1日消息,据国外媒体报道,当地时间周二,PayPal表示,将裁员约2000人,约占公司员工总数的7%,此次裁员将在未来几周内进行,离职员工将获得遣散费。腾讯股票回购历史PayPal首席执行官...
日期:02-01
对标美团、支付宝? 百度App上线“发现”频道深耕服务(支付宝口碑和美团)
  近日,有网友发现最新版百度App菜单栏上线了“发现”频道,将原来的“有料”的位置取消,替换成了“发现”,同时新增服务中心、购物、健康和小程序等入口。这一排兵布阵被外界...
日期:07-16
2024福布斯中国杰出商界女性:孟晚舟跃居第二
3月8日 消息:《福布斯中国杰出商界女性100》是福布斯中国每年发布的榜单,旨在关注女性在商业领域的表现。今年榜单着重关注女性在商业竞争中的角色转换和认知,展示女性领导者...
日期:03-08
消息称张勇将卸任阿里集团董事会主席兼CEO_阿里巴巴董事张勇
【】6月20日消息,据《豹变》消息,张勇或将卸任阿里巴巴集团董事会主席兼首席执行官,未来将专注阿里云的业务发展。张勇卸任之后的继任者,目前还不得而知。对此,阿里集团方面暂未...
日期:09-23
别克GL8被比亚迪拉下神坛!腾势D9 5月销量11005辆:全市场MPV销冠
快科技6月2日消息,腾势汽车公布了5月份销量数据,其5月共交付11005辆,比亚迪腾势D9也将别克GL8拉下神坛,登顶单月全市场MPV销量冠军。同时,腾势D9仅用7个月,就创下新能源豪华汽车品...
日期:06-02
中概股周四收盘涨跌不一 荔枝飙升近41% 网易有道跌超6%(荔枝股票行情)
京东苏宁国美电商大战   北京时间19日凌晨,美股周四震荡收高,股指尝试延续近来涨势。市场关注美联储未来加息路径,并等待下周的央行杰克逊霍尔年会。投资者还在消化几位美联...
日期:08-20
iPhone备忘录被曝莫名清空 苹果回应:将尝试帮忙恢复_抹掉iphone备忘录还在吗
10 月 10 日讯:针对“苹果备忘录被莫名清空”的情况,苹果客服回应称,会尝试在系统中帮忙恢复,如无法恢复将反馈给工程师。MIX FOLD的大屏尺寸为多少英寸?...
日期:10-14
饭卡植入手机「伪装成正常饭卡的手机令家长担忧:废弃旧手机改造而成」
近期,初高中学生间悄然兴起一种新型手机,外形酷似饭卡,难以被老师察觉,已经对学生的学习生活造成了不小的影响,引发了家长们的广泛担忧。苹果6跟苹果6plus有什么区别这种手机其实...
日期:04-09
部分性能媲美锂电 钠离子电池即将爆发:这类电动车受益「电动自行车的锂电池技术」
锂电池已经成为电动车动力的主要来源,然而它也面临着成本高、安全性等问题考验,下一代动力电池中,钠离子电池已经处于产业化前夕,部分性能指标媲美锂电,有望在A00级电动车等市场...
日期:10-14
三星Galaxy S24 Ultra真机首曝:屏幕曲率更小 接近直屏视效
快科技12月30日消息,知名数码博主i冰宇宙”放出了三星Galaxy S24 Ultra的真机图,手机的屏幕曲率同比上代大幅缩减,更接近平面。俄罗斯天然气取暖政策华谊兄弟电影世界是谁投资...
日期:12-31
字节跳动朝夕光年工作室「复盘朝夕光年之败:字节大力、不出创新」
大力出奇迹这件事,在游戏产业成为伪命题。OPPO R17快充大力只会出爆款,但可能只是一个复盘别人成功的高仿和超越。针对近几日传闻的游戏业务大规模调整,在研项目裁撤一事,字节跳...
日期:11-28
2岁母牛被卖跪地不走感动网友 愿出资买下:通人性一幕让人心酸
河北承德一牛市上,一头2岁母牛被卖后跪地不走,场景令人动容。14日上午,牛市经纪人告诉记者,现在该牛还在家里养着,有人欲出4万元买下。遇见就是缘分,他们想为它找个好去处。我们不...
日期:10-16