您的位置:首页 > 媒体评论

谷歌报复性砸出5620亿参数大模型!比ChatGPT更恐怖 机器人都能用 学术圈已刷屏

发布时间:2023-03-11 02:04:14  来源:互联网     背景:

为应对新一轮技术竞赛,谷歌还在不断出后手。

这两天,一个名叫PaLM-E的大模型在AI学术圈疯狂刷屏。

它能只需一句话,就让机器人去厨房抽屉里拿薯片。

即便是中途干扰它,它也会坚持执行任务。

PaLM-E拥有5620亿参数,是GPT-3的三倍多,号称史上最大规模视觉语言模型。而它背后的打造团队,正是谷歌和柏林工业大学。

作为一个能处理多模态信息的大模型,它还兼具非常强的逻辑思维。

比如能从一堆图片里,判断出哪个是能滚动的。

还会看图做算数:

瑞银手机销量

有人感慨:

这项工作比ChatGPT离AGI更近一步啊!

而另一边,微软其实也在尝试ChatGPT指挥机器人干活。

这么看,谷歌是凭借PaLM-E一步到位了?

逻辑性更强的大模型

PaLM-E是将PaLM和ViT强强联合。

5620亿的参数量,其实就是如上两个模型参数量相加而来(5400亿+220亿)。

PaLM是谷歌在22年发布的语言大模型,它是Pathways架构训练出来的,能通过“思考过程提示”获得更准确的逻辑推理能力,减少AI生成内容中的错误和胡言乱语。

Pathways是一种稀疏模型架构,是谷歌AI这两年重点发展方向之一,目标就是训练出可执行成千上百种任务的通用模型。

ViT是计算机视觉领域的经典工作了,即Vision Transformer。

两者结合后,PaLM-E可以处理多模态信息。包括:

语言

图像

场景表征

物体表征

通过加一个编码器,模型可以将图像或传感器数据编码为一系列与语言标记大小相同的向量,将此作为输入用于下一个token预测,进行端到端训练。

具体能力方面,PaLM-E表现出了比较强的逻辑性。

比如给它一张图片,然后让它根据所看到的做出蛋糕。

模型能先判断出图像中都有什么,然后分成9步讲了该如何制作蛋糕,从最初的磕鸡蛋到最后洗碗都包括在内。

有人还调侃说,这机器人怎么在把蛋糕给我前先自己吃了?

还有根据图片做判断:我能在这条路上骑自行车吗?

ebay创始人 初来乍到

模型进行一系列逻辑推断:

1、不能进入

2、除了自行车

3、除了自行车以外都不能进入

4、答案是可以

这和人类思考的过程确实很像了。

不仅如此,模型的最强大之处在于,它无需经过预处理,即提前理解环境。

它做出判断和回答,完全是基于它自己的“经验”。

研究人员表示,这项成果表现出了很强的正向迁移(positive transfer)能力。

在多个领域任务的训练中,PaLM-E的表现都优于单项任务机器人模型。

而且他们还发现,语言模型的规模越大,它最终能保持的语言理解能力越强。

比如使用5400亿参数规模的PaLM时,PaLM-E在语言任务上的实际能力仅下降了3.9%。

从实验结果来看,PaLM-E在OK-VQA基准上达到新SOTA。

在模拟环境下的任务完成度也都不错。

再次验证大力出奇迹

目前这项研究已引发非常广泛的讨论。

主要在于以下几个方面:

1、一定程度上验证了“大力出奇迹”

2、比ChatGPT更接近AGI?

一方面,作为目前已知的规模最大的视觉语言模型,PaLM-E的表现已经足够惊艳了。

去年,DeepMind也发布过一个通才大模型Gota,在604个不同的任务上接受了训练。

但当时有很多人认为它并不算真正意义上的通用,因为研究无法证明模型在不同任务之间发生了正向迁移。

论文作者表示,这或许是因为模型规模还不够大。

如今,PaLM-E似乎完成了这一论证。

不过也有声音担心,这是不是把卷参数从NLP引到了CV圈?

另一方面,是从大趋势上来看。

有人表示,这项工作看上去要比ChatGPT更接近AGI啊。

的确,用ChatGPT还只是提供文字建议,很多具体动手的事还要自己来。

但PaLM-E属于把大模型能力拉入到具象化层面,AI和物理世界之间的结界要被打破了。

而且这个趋势显然也是大家都在琢磨的,微软前不久也发布了一项非常相似的工作——让ChatGPT指挥机器人。

除此之外,还有很多人表示,这再一次验证了多模态是未来。

不过,这项成果现在只有论文和demo发布,真正能力有待验证。

此外还有人发现,模型驱动的机器人,背后的开发团队在几周前被谷歌一锅端了。。。

所以关于PaLM-E的更多后续,咱们还得再蹲蹲看。


返回网站首页

本文评论
人类第一个“AI律师”的诞生、折戟与反思「律师被ai取代」
「AI 律师」首次进入法庭的尝试,被迫按下了「暂停键」。所谓「AI 律师」的本体,是 DoNotPay 开发的最新版聊天机器人。按照原定计划,被告佩戴载有 AI 机器人的耳机出庭,后者实时...
日期:02-08
不做记者后 我在淘宝打零工
新闻业前辈在工作第二年就跑遍了中国所有省份,我们工作一年了,一次差都没出过。折纸盒子没有任何意义,但也不会给你带来任何痛苦,在那些串珠子和折纸盒子的时刻,我的情绪是稳定的...
日期:12-16
ASML一直处于高度戒备状态,EUV光刻机何去何从?
原标题:EUV光刻机何去何从?ASML 一直处于高度戒备状态。去年,该公司两次提高了生产目标:它希望到 2025 年出货约 600 台 DUV 和 90 台 EUV 光刻机,而去年分别为不到 200 台和 35...
日期:09-25
游戏出海这一年 又迷茫又残酷「【深度】中国单机游戏的出海困局」
图片来源@视觉中国文 | 深燃,作者 | 李秋涵,编辑 | 魏佳“不出海,就出局”。这是游戏行业广为流传的一句话。对于各大游戏厂商来说,出海是救命稻草。“但凡是个游戏公司,从头到脚...
日期:01-12
阿里想让AliOS成为智能汽车的安卓「阿里智能汽车系统」
10 月 24 日,有媒体注意到阿里云 YunOS 空间服务的下线公告,显示因业务方向调整,YunOS 空间将在 2023 年 1 月 5 日下线。公告是 7 月 6 日发布的,但在最近才被注意到。谷歌pixe...
日期:10-30
iOS17代码泄露 却曝出了iPhone 15的“瓜”
谁能想到,iOS 17代码泄露,结果iPhone 15成了最终的“背锅侠”。surface与ipad比较近几年,苹果的保密措施做的越来越不严格,这里的不严格并不是说苹果有所松懈,而是面对的“小偷”...
日期:02-06
我朋友的19万存款一夜没了 但收获了“一万”个套路
前几天,有条 “ 十万块钱一夕消失 ” 的微博非常火。这位博主在 P2P 最火时投了 10 万元进去,P2P 平台爆雷后钱拿不出来了。前几天她打开平台发现,这十万元变成了某野鸡网上商...
日期:08-31
“炫富”的人,越来越少了吗?「越是炫富越是没有」
《了不起的盖茨比》“暴发户”“炫富”等词语,早些年常见于互联网以及各种文艺作品。然而随着经济与文化的发展,消费形式的日新月异,当下再说起这类词汇,就只剩下被鄙夷的“土气...
日期:01-08
重回C位的贾跃亭,能给法拉第未来一个未来吗?「贾跃亭 法拉利未来」
贾跃亭似乎总是可以在危机关头,化险为夷。9月26日晚间,FF法拉第未来发布公告,宣布与公司大股东FFTop(即贾跃亭掌舵的FF全球合伙人公司)就融资和董事会重组达成最终协议。现任执行...
日期:09-30
零跑的启示,中国电动车要谈生死了「电动车 零跑」
衣公子的剑——做爱读的商业评论2019年4月,上海青浦,交警拦下了一辆车。这是造车新势力零跑,邀请媒体试驾新车。交警说,临牌是假的。车辆被当场扣押,最倒霉的是正在开车的这位媒...
日期:10-10
拯救学习类APP:游戏推广等乱象丛生 如何从源头上“建闸”
最新进展!知错就改,小天才接受消协整改建议对违规APP立即下架。8月18日,北京市、天津市、河北省“三地消协”与小天才公司召开“小天才T1儿童平板电脑问题整改沟通会”。三地消...
日期:08-24
为什么中国连自行车都造不好_中国至今都造不出一辆“高档”自行车?
原创 酷玩实验室 酷玩实验室骑行车队最近成了北京各条宽阔道路上的崭新风景线,而且这些戴着头盔、穿着标准骑行服、全副武装的骑士组织,其中男女参半,健康优雅的身材曲线让人忍...
日期:09-18
我国关节炎患病率范围_中国关节炎患者超过1亿人 专家提醒:各年龄段都可能发病
据央视新闻报道,全世界关节炎患者有3.55亿人,在亚洲地区,每六个人中就有一人在一生的某个阶段会患上关节炎。华为mate50 会有5g版吗关节炎在我国的发病率约为13%,保守估计患者超...
日期:10-15
特斯拉 3g_能买一辆特斯拉,售价30万的Web3手机你见过没?
前几天,奢侈手机品牌 Vertu 发布了一款名为 Meta Vertu 的新手机。入门款的起售价 23800,而顶配版本更是达到了 308000。这价格都够托尼买一辆 Model Y 了,看来Vertu对自己的产...
日期:10-31
国际首次!中国科学家证明了复数在量子力学中“不可或缺”_量子力学近些年的成就不包括
原标题:国际首次!我科学家用严谨实验证明了复数在量子力学中“不可或缺”IT之家 10 月 9 日消息,济南量子技术研究院张强、江扬帆与中国科学技术大学潘建伟院士团队合作,用严谨...
日期:10-10
投400亿美元赴美建厂,台积电美国噩梦会重现吗?_台积电美国工厂开工
【文/观察者网 吕栋】美国总统拜登、商务部长雷蒙多等政客风尘仆仆地赶来站台,苹果、英伟达、AMD、阿斯麦、美光、微芯科技等世界级科技巨头的高管们集体到场,政商界出席的人...
日期:12-12
三星手机上线维修模式:个人隐私得到保护_三星隐私政策
  【ITBEAR科技资讯】7月31日消息,三星最近推出了维修模式,维修模式开启后,手机会自动重启,在服务中心维修时,不用担心个人信息泄露。该功能已适配Galaxy S21系列,三星称未来将...
日期:08-01
哪里的方言容易听懂_能听懂方言了!淘宝上线方言语音搜功能
  【ITBEAR科技资讯】8月8日消息,今天,淘宝官方宣布上线方言语音搜功能,该功能可以听懂天津话、东北话、山东话、河南话、河北话,打开淘宝,点击语音搜小话筒,动动嘴的功夫就可以...
日期:08-09
品牌下一步在快手拼什么?「快手品牌是什么意思」
今年616大促期间,特步在超级品牌日中凭借一场女子产品线“半糖系列”新品造势营销活动,取得了6.7亿全网曝光、3911万销售额和近24万新增粉丝的成绩,但在一年前,刚刚进入快手的特...
日期:10-10
造车不如搞汽车金融赚钱「汽车金融公司怎么赚钱」
图片来源@视觉中国文|车百智库,作者|陈重山,编辑|阿峰2023年已至,新能源汽车购置补贴到期,大多数新能源车企面临盈利大考。这时,一个利好提前出炉。2022年12月29日,《汽车金融公司管...
日期:01-15