您的位置:首页 > 互联网

图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象

发布时间:2024-05-11 11:55:56  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】这几天的维也纳,上演了一场AI圈的狂欢。在ICLR2024上,图灵巨头LeCun、Bengio纷纷现身,直接让现场挤爆,变成追星现场。

这几天,AI届的盛会——ICLR在维也纳举办。

OpenAI、Meta、谷歌、智谱AI等世界前沿AI科技企业齐聚一堂。

现场名流云集,星光耀眼,走几步就能偶遇一位发过颠覆性paper的大咖。

毫无意外地,ICLR2024展厅也变成了追星现场。热闹的气氛,快把屋顶掀翻了。

图灵三巨头中的著名e人LeCun,提前就在X上大方公布出自己的行程,满怀期待地等着和粉丝们相见了。

在评论区,不仅有粉丝激动打卡,甚至还有准备现场递简历的。

粉丝们果然不虚此行,在现场,LeCun口若悬河地讲解,热情的观众们在周围形成密实的包围圈。

言归正传,在整个ICLR活动上,Meta团队将分享25余篇论文和两个研讨会。这次,LeCun团队在ICLR上发表了以下两篇论文。

论文地址:https://arxiv.org/abs/2305.19523

论文地址:https://arxiv.org/abs/2311.12983

另一位图灵巨头Yoshua Bengio,也显示了自己的超高人气。

现场观众总结道:一个人真的需要在他的领域中做到独一无二,才能让他的会议室外排起如此长的队伍!

此前LeCun和Hinton都对此发表过言辞激烈的意见,Bengio的态度似乎一直比较模糊,迫不及待想知道他对于AGI是什么看法了。在即将到来的5月11日,他就会在一场关于AGI的Workshop中发表演讲。

值得一提的是,Bengio团队也在今年的ICLR上获得了杰出论文荣誉提名。

论文地址:https://openreview.net/pdf?id=Ouj6p4ca60

谷歌Meta隔壁,智谱AI也在

现场,谷歌开源模型Gema、机器人智能体背后框架Robotics Transformers,以及其他开创性的研究一并呈现。

紧挨着Meta和谷歌,展厅中间有一家非常亮眼的公司——智谱AI。

现场的童鞋正为大家介绍GLM-4、ChatGLM等一系列研究成果。

这一系列展示,引起了众多国外学者的围观。

现场的近两千名与会嘉宾和学者,认真听了GLM大模型技术团队的介绍。

介绍内容包括了GLM系列大模型的多项前沿研究成果,涵盖数学、文生图、图像理解、视觉UI理解、Agent智能体等领域。

在现场,大家热烈讨论起了对Scaling Law的看法。而GLM团队,对此也有独到见解——

相比模型大小或训练计算量,智能涌现和预训练损失有更加紧密的联系。

比如,著名的OpenAI996研究员Jason Wei,认真读过智谱AI这篇讲预训练损失的论文后,表示十分赞叹。

论文中,团队通过训练30+个不同参数和数据规模LLM,评估了其在12个中英文数据集上的表现。

论文地址:https://arxiv.org/abs/2403.15796

结果观察到,只有当预训练损失低于某个阈值时,LLM会出现涌现能力。

而且,从预训练损失的角度定义涌现能力,效果优于仅依赖模型参数或训练量。

智谱AI的此番表现,也让越来越多外国网友意识到——

19岁获得博士的Stability AI研究主任Tanishq表示,CogVLM这类最有竞争力、为开源生态做出重大贡献的开源基础模型,就是来自中国。

这位游戏工作室的前CEO,去年就开始用CogVLM和Stable Diffusion做完整的开源版本了。

是的,自CogVLM自发布之后,其强大的能力便引起了外国网友的惊呼。

在今年1月的LLM排行榜中,也有人发现——

当时Gemini和GPT-4V远远领先于任何开源LLM,唯一一个例外,就是CogVLM。

可见,这波国产大模型出海,智谱AI已经闷声不响地在国外建立了自己的巨大影响力。

特邀演讲

展厅精彩演示之外,今年的ICLR,共邀请了七位特邀演讲嘉宾,分享他们对AI的见解。

有来自谷歌DeepMind的研究科学家Raia Hadsell,佐治亚理工学院副教授&FAIR首席科学家Devi Parik,有来自马克斯·普朗克计算机科学研究所(MPI-SWS)的主任Moritz Hardt,唯一一家中国团队是智谱AI 的GLM 大模型技术团队。

Raia Hadsell

谷歌DeepMind科学家Raia Hadsell的演讲题目是——在人工智能发展的起伏过程中学习:通向AGI道路上的意外真理。

经过数十年的稳定发展和偶尔的挫折后,AI正处在一个关键的拐点。

AI产品已经爆炸式地进入主流市场,我们还未触及到scaling红利的天花板,因此整个社区都在探讨下一步的方向。

在这次的演讲中,基于20多年在AI领域的经验,Raia探讨了我们对AGI发展之路的假设,如何随时间发展而变化。

与此同时,她还揭示了,在这个探索的过程中,我们得到的意外发现。

从强化学习到分布式架构,再到神经网络,已经在科学领域发挥着潜在的革命性作用。

Raia认为,通过汲取过去的经验教训,可以为AI未来的研究方向提供重要的洞见。

Devi Parikh

另一边,FAIR首席科学家Devi Parik给所有人讲述了,自己生活中的故事。

从演讲题目可见略知,Parik的分享内容,非比寻常。

在ICLR大会上,在解释为什么技术环境是现在这个样子时,大家会重点针对互联网、大数据和算力的发展,展开讨论。

然鹅,鲜有人关注那些微小,但重要的个人故事。

其实,每个人的故事,都可以汇聚成为推动技术进步的重要力量。

通过这种方式,我们可以彼此学习,相互激励。这让我们在追求目标时,更加坚韧和高效。

Moritz Hardt

德国MPI-SWS主任Moritz Hardt带来了新兴的科学基准的演讲。

oppoa17在生产吗

显然,基准测试成为机器学习领域的核心支柱。

自20世纪80年代以来,虽然人类在这个研究范式下取得了诸多成就,但对其深层次的理解仍然有限。

在此次演讲中,Hardt通过一系列选定的实证研究和理论分析,探索基准测试作为一门新兴科学的基本原理。

他具体讨论了标注错误对数据质量的影响、模型排名的外部验证性,以及多任务基准测试的前景。

与此同时,Hard还展示了许多案例研究。

这些挑战了我们的传统看法,还突显了发展科学基准测试的重要性和益处。

GLM Team

中国这边,智谱AI的GLM大模型技术团队,也带来了ChatGLM通往AGI之路的精彩演讲。

值得一提的是,这也是国内首次在国际顶级会议上展示大模型相关的主题演讲。

这次演讲,首先从中国的角度,介绍AI在过去几十年的发展历程。

同时,他们以ChatGLM为例,阐述自身在实践过程中获得的理解和洞见。

2024AGI前瞻:GLM4.5、 GLM-OS、 GLM-zero

在ICLR上,GLM大模型团队介绍了面向AGI的GLM三大技术趋势。

通往AGI的必经之路在哪里?

业界对此意见不一。有人认为是智能体,有人认为是多模态,有人说,Scaling Law是通往AGI的必要非充分条件。

而LeCun坚持认为,LLM是通往AGI的一条歧路,靠LLM带不来AGI。

对此,团队也提出了自己的独特观点。

首先,他们讲到了GLM-4的后续升级版本,即GLM-4.5及其升级模型。

GLM-4的后续升级版,将基于超级认知(SuperIntelligence)和超级对齐(SuperAlignment)技术,同时在原生多模态领域和AI安全领域有长足进步。

GLM大模型团队认为,在通往AGI的路上,文本是最关键的基础。

而下一步,则应该把文本、图像、视频、音频等多种模态混合在一起训练,变成一个真正的原生多模态模型。

同时,为了解决更加复杂的问题,他们还引入了GLM-OS概念,即以大模型为中心的通用计算系统。

这一观点,与Karpathy此前提出的大模型操作系统的观点,不谋而合。

在ICLR现场,GLM大模型团队详细介绍了GLM-OS的实现方式:

基于已有的All-Tools能力,再加上内存记忆(memory)和自我反馈(self-reflection)能力,GLM-OS有望成功模仿人类的PDCA机制,即Plan-Do-Check-Act循环。

具体来说就是,首先做出计划,然后试一试形成反馈,调整规划然后再行动以期达到更好的效果。

依靠PDCA循环机制,LLM便可以自我反馈和自主进化——恰如人类自己所做的一样。

此外,GLM大模型团队还透露,自2019年以来,团队就一直在研究名为GLM-zero的技术,旨在研究人类的无意识学习机制。

当人在睡觉的时候,大脑依然在无意识地学习。

GLM大模型团队表示,无意识学习机制是人类认知能力的重要组成部分,包括自我学习、自我反思和自我批评。

人脑中存在着反馈和决策两个系统,分别对应着LLM大模型和内存记忆两部分。

因此,GLM-zero的相关研究将进一步拓展人类对意识、知识、学习行为的理解。

美大集成灶自动抽烟

尽管还处于非常早期的研究阶段,但GLM-zero可以视为通向AGI的必经之路。

而这,也是GLM大模型团队首次向外界公开这一技术趋势。

国内顶流技术团队

2020年底,GLM大模型技术团队研发了GLM预训练架构。

2021年训练完成百亿参数模型GLM-10B,同年利用MoE架构成功训练出收敛的万亿稀疏模型。

2022年还合作研发了中英双语千亿级超大规模预训练模型GLM-130B并开源。

而过去一年里,团队几乎每3-4个月,就完成一次基座大模型的升级,目前已经更新到了GLM-4版本。

不仅如此,作为国内最早入局LLM公司,智谱AI曾在2023年就设立了一个雄心勃勃的目标——全线对标OpenAI。

GLM大模型技术团队构建了基于AGI愿景的完整大模型产品矩阵。

在GLM系列之外,还有CogView文生图模型、CodeGeeX代码模型,多模态理解模型CogVLM,再到GLM-4V多模态大模型和All-Tools功能以及AI助手智谱清言。

与此同时,GLM大模型技术团队的研究人员,在业界有着极高的影响力。

比如,圈里爆火的李飞飞主讲斯坦福大学CS25课程,每次都会邀请Transformer研究前沿的专家,分享自己的最新突破。

而目前已经确定,CS25课程的嘉宾中,就有来自智谱AI的研究员。

CogVLM

团队开发的开源视觉语言模型CogVLM,一经发布就引发了业界关注。

3月Stability AI公布的一篇论文就显示,因性能太出色,CogVLM直接被Stable Diffufion3拿来做图像标注了。

论文地址:https://arxiv.org/abs/2403.03206

CogAgent

在此基础之上,基于CogVLM改进的开源视觉语言模型CogAgent,主要针对的是用户图形界面GUI的理解。

而CogAgent的相关论文,已经被国际计算机视觉领域级别最高的学术会议CVPR2024收录。

要知道,CVPR以录取严格著称,今年论文录取率只有约2.8%。

论文地址:https://arxiv.org/abs/2312.08914

ChatGLM-Math

针对LLM解决数学问题,GLM大模型团队提出了Self-Critique的迭代训练方法。

即通过自我反馈机制,帮助LLM同时提升语言和数学的能力。

论文地址:https://arxiv.org/abs/2404.02893

这一方法,包含了两个关键步骤:

首先训练一个从LLM本身生成Math-Critique模型,以评估模型生成数学问题答案,并提供反馈信号。

其次,通过拒绝采样微调和DPO,利用新模型对LLM自身的生成进行监督。

GLM大模型团队还设计了MATHUSEREVAL基准测试集,以评估新模型数学能力,结果如下:

显而易见,新方法显著提升了LLM的数学问题解决能力,同时仍能提升其语言能力。重要的是,它在某些情况下优于参数量增加两倍的大模型。

GLM-4跻身全球第一梯队

在OpenCompass2.0基准测试中,智谱AI新一代基座大模型的实力不容小觑。

在总榜排名中,GLM-4位列第三,位居国内榜首。

在不久前SuperBench团队发布的《SuperBench大模型综合能力评测报告》中,GLM-4也跻身全球第一梯队。

特别是在最关键的语义理解,智能体能力上,GLM-4更是国内第一,力压一众竞争对手。

刚刚过去的大模型元年,热闹非凡的百模大战打了一年。

2024年,若想化身为AGI元年,全世界大模型团队还有很长的路要走。

参考资料:

https://iclr.cc/virtual/2024/invited-talk/21802


返回网站首页

本文评论
传马斯克接管后推特削减80%服务器订单
集微网消息,知名分析师郭明錤日前在其社交平台账户透露,马斯克入主后,推特(Twitter)已将服务器订单削减了80%,不利于其主要供应商纬颖来年保持出货动能。同时,由于几乎所有推特采购...
日期:12-12
马斯克的"读脑"设备首次植入人体,科学家期待什么?担忧什么?
2月4日消息,埃隆·马斯克(Elon Musk)创建的Neuralink旨在改变我们对脑机接口的认知,让科幻变成了现实。1月29日发布的消息中,马斯克宣布Neuralink已成功将其“读脑”设备首次植入...
日期:02-06
中共中央政治局常务委员会召开会议
中共中央政治局常务委员会召开会议听取全国人大常委会、国务院、全国政协、最高人民法院、最高人民检察院党组工作汇报纽曼蓝牙耳机推荐听取中央书记处工作报告中共中央总书...
日期:01-05
国产3A大作!《黑神话:悟空》科隆展获最佳视觉奖:试玩排队5小时超火爆
快科技8月26日消息,日前,2023年科隆游戏展各大奖项评选结果公布,国产3A大作《黑神话:悟空》获得最佳视觉效果奖项。华为企业史耀宏特斯拉刹车失灵的真相据了解,在科隆游戏展公众...
日期:08-26
骁龙8 Gen3芯片、自研电竞芯片Q1,iQOO12发布 售价3999元起_骁龙8核是什么
11月8日消息,iQOO年度旗舰iQOO 12系列正式发布,售价3999元起。iQOO 12系列搭载由第三代骁龙8移动平台,满血版LPDDR5X和UFS 4.0组成的新一代“性能铁三角”;自研电竞芯片Q1&引擎...
日期:11-09
“太空快递”发货了!_太空快递公司
据中国载人航天工程办公室消息,北京时间1月17日22时27分,搭载天舟七号货运飞船的长征七号遥八运载火箭,在我国文昌航天发射场点火发射,约10分钟后,天舟七号货运飞船与火箭成功分...
日期:01-20
高通回应「高通在CES 2024上开启出行全新时代」
通信世界网消息(CWW)在2024年国际消费电子展(CES 2024)上,高通技术公司突显其作为汽车行业优选合作伙伴的全球发展势头和领先地位,聚焦骁龙®数字底盘产品组合的广泛性、成熟度和...
日期:01-10
曝骁龙8 Gen4将采用台积电3nm制程工艺 小米15或首发_骁龙8nm处理器
  【手机中国新闻】在日前举办的骁龙技术峰会上,高通公布了大量信息,包括AI、骁龙XElite PC芯片组等等。峰会上,高通还宣布Oryon核心将于2024年应用于智能手机芯片组。该公司...
日期:11-03
淘宝商城新规遭集体反抗 反淘联盟扩至2万人_淘宝联盟规则
  10月12日消息据经济之声报道,淘宝卖家为淘宝商城送上了一个突如其来的“10·11事变”。 10号晚9点后,近7000名网友结集YY语音,对韩都衣舍、欧莎、七格格、优衣库等淘宝商...
日期:07-23
【贺新春 送温暖 话祝福】厦门市政协魏克良主席一行莅临白鸽在线参观指导
  2021年2月19日下午,厦门市政协魏克良主席、张仁苇秘书长、杜亮主任、范世高处长及秘书叶伟民一同莅临白鸽在线(厦门)网络科技有限公司(以下简称“白鸽在线”)参观指导,并...
日期:07-16
一男子和峨眉山猴子练搏击互殴 当事人回应:条件反射、请勿模仿
峨眉山的猴子又上新闻了。据@沸点视频 报道,3月3日,四川乐山,一男子峨眉山旅游和猴子练搏击互殴引发关注。视频中,该男子站在护栏边上,护栏上是一只猴子,猴子将爪子搭载男子胳膊上...
日期:03-04
iPhone 16细节曝光:钛金属材质、更重
据MacRumors报道,最近获得了有关iPhone 16、iPhone 16 Plus、iPhone 16 Pro 和 iPhone 16 Pro Max 的重量和初步信息。iPhone 16 Pro 和 16 Pro Max 将配备更大的显示屏,并且...
日期:10-01
美团接送孩子_儿童值得加入美团互助么?来看看这位妈妈的操作
  儿童节美团上线新功能,今早在美团APP看到有新内容更新,点进去一看,发现美团互助可以为家人加入了。   关于保险保障措施,作为老母亲可有一把辛酸泪,当年因为娃早产而被拒...
日期:07-14
花200元烤红薯橘子,围炉煮茶的“氛围感”仅朋友圈可见
声明:本文来自于微信公众号锌财经(ID:xincaijing),作者:陈妍,授权转载发布。围炉煮茶,成了这届年轻人的新欢。窗外冷风呼啸,小雨淅沥,屋内却是另一幅光景。生一炉炭火,摆上一壶热茶,...
日期:02-09
高校教师称殡葬专业就业率基本100%!报名人数急剧增加_殡葬就业前景
高考成绩陆续放榜,接下来就是让学生和家长们最纠结的志愿填报阶段了,这可关乎到未来的就业和人生。如何填报专业,和学生成绩、个人喜好、家庭情况、社会环境、就业形势等多种因...
日期:06-26
一天疯涨10倍!马来西亚数字支付公司又是个妖股?
  [CNMO新闻]股市这东西,有时候还真不是普通人能够把握住的。有人在其中发家致富,也有人在其中散尽家财,而后者的数量要远远超过前者。此前,CNMO报道过,一位在美国南加州大学就...
日期:08-25
京东3C数码门店开学季玩出新花样 学生专属认证福利助你装备升级
新学期,新气象!随着暑假的结束,新学期即将拉开帷幕。为了帮助同学们迎接新的学习生活,即日起至 9 月 25 日,全国超 300 家京东3C数码门店特别启动开学季活动,给大家提供优质、低价...
日期:09-01
西云数据公司待遇怎样「西云算力受邀出席1024程序员节 共话AI研发未来」
(原标题:西云算力受邀出席1024程序员节 共话AI研发未来) 在科技创新和数字化变革的浪潮下,今日,以“研发新高地,数智创未来”为主...
日期:10-24
小米mix fold使用感受「小米MIX Fold 3关键规格曝光:首次用上潜望长焦、更耐摔」
快科技6月19日消息,此前有爆料称,小米新一代折叠机皇小米MIX Fold 3会在8月左右登场,随着发布时间临近,该机的关键规格也逐渐浮出水面。今日,数码博主数码闲聊站”曝光了一款全新...
日期:06-19
比亚迪7月新能源车销量261105辆,同比增长61%「比亚迪电动车7月销量」
8月1日消息,比亚迪公布了7月销量数据,再次刷新记录创造新高。7月比亚迪累计销量261105辆,同比增长61%。今年1-7月累计销量达1517798辆,同比增长 87.63%。7月,比亚迪王朝、海洋系...
日期:08-01