您的位置:首页 > 互联网

智谱官网「智谱AI的AutoGLM后,Google和微软也下场来做“贾维斯”了。」

发布时间:2024-10-30 12:43:33  来源:互联网     背景:

声明:本文来自于微信公众号 数字生命卡兹克,授权转载发布。

智谱科技怎么样

昨天,微软忽然发布了一个新的模型,能够用于网页自动化操作。

他们也正式开卷跟智谱AutoGLM一样自主人工智能了。

而前天,我也在The Information网站上看到一个消息:

标题Google Preps AI That Takes Over Computers,翻译过来就是:

谷歌准备推出接管计算机的人工智能。

上周三Claude、周五智谱AI、周末Google,然后微软。

短短一周内,已经有四个公司爆出来要发布类似的产品了,其中三个已经悄悄发布产品:Anthropic的Claude,智谱的AutoGLM和微软的OmniParser。这些产品的能力有目共睹。

Goolge虽然也只是个爆料,但是大概率今年就能出来,非常心急,想把坑先占上。

而且,我知道的消息是,OpenAI内部肯定也在做,就看什么时候掏出来了。

二级市场对于这种自主人工智能,反馈也非常的正。上周五智谱的AutoGLM出来之后,在金融圈直接爆了,连智谱AI概念股都出来了。

自主人工智能,好像瞬间点燃了AI圈的热情。

又开启了新一轮的用户心智的抢占。

毕竟刚刚开卷,哪家最早发,哪家确实就是会有优势。

不过自主人工智能的热度确实有点超乎了我的想象。

不过也能理解,类似于这种你发个指令他就会全自动化去处理的AI,才符合我们对人工智能的真正的期待,才有一点,那种AI变成现实的感觉。

现在的AI,坦率的讲,虽然有一些智能,但是远远离不开人工,完全没有达到解放双手的目的,绝大多数时候都是“人工”+“智能”。

而且对于各家AI公司来说,底层模型的能力已经卷到一定的瓶颈了,看现在大模型的一些榜单,大家也一点不关心了。

需要一些更科幻的,更新鲜的刺激。

所以这个时候,自主人工智能过来接棒,就很香。

而自主人工智能完成任务的一个大致流程是:

理解用户的需求-》系统规划-》调用工具执行任务-》目标完成

这个流程看起来其实不复杂。

一年多前,就有人在做了,最经典的那个项目,github上狂揽十六万星的噬星狂魔AutoGPT。

但是AutoGPT到后面开始沉寂,其实有个很大的问题,就是完全基于大语言模型做的。

这个就有很多的局限性。

比如,纯粹的语言模型只能处理文本,而现在很多任务比如点外卖,打车都需要读取屏幕信息。大语言模型本身不能直接处理,往往需要多加一步将图片转换为文本输入。

而图片转换为文字后,对于大语言模型又会丢失很多信息。

好比你被蒙着双眼,只是语言告诉你屋里有些什么,无论语言描述多么细节,你想象力多么丰富,脑海里都无法还原得与真实一模一样。

模型的可控性比较差,模型就容易懵逼,导致任务中断,或干脆给你随机发挥,听天由命。

所以AutoGPT能做到的事情还是比较少,效果也没有那么好,慢慢就淡出大家的视野了。

直到最近这波新的自主人工智能浪潮。

但是我也挺好奇一个问题,就是这将近一年半的时间,自主人工智能为啥都什么消息,直到最近,才开始密集发声?

是各家都在卷其他赛道,无暇顾及,还是都在做,只不过遇到了瓶颈,最近才有所突破?

我就去密集咨询几家国内AI大厂的朋友。

其实大家口径也都出奇的一致。

就是大家都在稳步推进,只是最近刚好到了一个可以拿出来用的时间点,而且大家的进展其实也没有差异太多。

而这一年半,自主人工智能没咋出现在公众视野,看起来进展很缓慢的样子,其实有两个最主要的原因。

  • 多模态模型不够成熟。

  • 2. 缺太多行为数据了。

    第一个点其实很好理解。

    就是你不能让模型蒙着眼睛去规划任务,他都不知道屏幕上面的元素长啥样,纯粹靠文字来描述,这个效果肯定很差。

    所以推进这块,必须要有很强的多模态模型的基座能力作为基础。

    而多模态的模型,训起来其实就比纯粹的大语言模型复杂多了。数据量、资源的消耗都是指数级增长。本身就是慢,连Claude都是今年3月才上线多模态能力的。

    所以在模型基座上,就是会很拖沓,这个是客观的事实,不过最近几个月,大家的多模态模型已经基本都能用了,所以基座模型层面,其实就是刚好到了一个节点。

    去调研的智谱的大佬,也给出了我们同样的答案。

    第二个原因,其实就是数据上。

    虽然互联网包含大量的人类知识,但主要由静态信息(图片、文字)组成,这些静态信息无法反应一些动态的过程。

    比如,模型可以学习理解外卖界面上的脆皮炸鸡是多少钱。因为网上有大量的静态数据教会它钱是什么、能干什么。模型可以理解“钱是能买到炸鸡的”。

    但缺乏动态数据教它怎么“找到美团App,点开App,如何搜索脆皮炸鸡,然后点击下单”的这样一个动态过程。

    这个其实就跟o1的那套推理的路很像,模型不仅要知道结果,还要知道其中的过程。

    整个自主人工智能的操作路径,其实就是一个多模态的巨型思维链。

    o1和claude给大家打了个样,证明了强化学习这条路是对的,那强化基座模型的推理能力是一个应用方向,而做这种真正的Agent,又是一个强化学习应用的典型场景。

    一个偏基模,一个偏应用。

    而这套通过强化学习补充数据的范式,其实也就是今年3、4月以后,才逐渐形成的业内共识。

    姨妈提醒小程序

    所以,着就能解释,为什么过去一年半的时候,这种自主人工智能一直没啥进展,直到最近才密集发声,其实就是多模态基座和数据的原因。

    最后,再简单说说AutoGLM这种能力,大概是怎么实现的,具体细节他们也都没透露,我只能根据我的调研结果,进行一些猜测,不过AutoGLM团队最近应该会发个技术报告,到时候可以关注一下。

    比如一个最简的例子,说:微信发送“今天疯狂星期四V我50”的消息给鲜虾包。

    双11战报数据漂亮,为何阿里股价不升反跌呢

    那么大模型拿到任务后,会一边看当前屏幕的界面,一边利用思维链一步一步推理:

  • 任务可以在当前的UI界面下继续进行吗?是的话进行第2步,否的话就会思考“应该打开什么界面”然后进行下一步动作。

  • 分析当前UI和最终任务的关系,分解成一步一步的动作”

  • 现在首先需要填充输入框“今天疯狂星期四V我50”

  • 然后点击“发送”

  • 然后思考问题是否最终被解决?如果是的话结束,如果否的话回到第1步继续循环。

  • 智谱·ai

    这一切,都建立在模型能看到屏幕,能理解屏幕上那些乱七八糟的元素的基础上。他不仅需要复杂的规划能力,还需要直到这个是按钮,这个是单选控件,这个是表单,这个是开关等等。

    而滑动这个操作,反而是最麻烦的,人看起来很简单,是因为人对于UI界面,已经有数十年的经验了,滑动本身就是预测的过程,我们根据我的经验,大概能猜到这一屏如果没有我要的信息,那他可能是在下一屏。

    所以我们会进行一个滑动操作,但是对于AI来说,这个预测,反而是最难的。

    所以后面,需要继续灌数据,灌大量的行为性数据,形成泛化能力。

    让AI,有跟人类一样的,UI常识,和对交互的可预测性。

    虽然目前不是那么完美。

    中国芯片被美国卡脖子有什么解决的办法

    Claude的Computer Use和智谱的AutoGLM,都有自己的一堆问题,也远远没到一个算是完美产品的地步。

    但这毕竟也只是刚刚开始。

    当一切路径明确。

    两个月时间。

    可能,一切就变天了。


    返回网站首页

    本文评论
    vivo x200新品预售X200系列正式开售 远不止影像的全能旗舰 vivo
    来源:中关村在线10月14日,vivo X200系列新品发布会在北京水立方盛大举行,引发了行业内外的高度关注。10月19日,该系列手机正式开售,再次成为市场焦点。vivo X200系列作为vivo的年...
    日期:10-19
    华为万元机皇要被疯抢!Mate 60 RS真机泄露:对标iPhone 15 Pro Max
    快科技9月23日消息,社交平台上曝光了华为Mate 60 RS真机照。如图所示,Mate 60 RS延续了上一代的八边形镜头设计,机身为陶瓷材质。科大讯飞公司产品包装盒显示,华为Mate 60 RS全...
    日期:09-24
    智慧海洋建设方案「信通院联合发布《5G智慧海洋发展研究报告(2023年)》」
    通信世界网消息(CWW)我国一直以来高度重视海洋强国建设。党的二十大报告明确提出“发展海洋经济,保护海洋生态环境,加快建设海洋强国”等要求,我国智慧海洋迎来前所未有的发展契...
    日期:07-20
    中关村&百度联手启动星标大奖评选盛事,LIFAair实力斩获大奖(中关村电脑配置报价大全)
      12月26日,中关村在线携手百度,联合打造具有顶级影响力的科技产品评选盛事。在2019年度星标大奖评选中,LIFAair 旗下产品LAF200新风机凭借实力与口碑,以中关村评测结果为基...
    日期:06-06
    网络安全面临“人才荒” 建设人才发展体系是核心_网络安全的本质在人才
      ​近年来,全球不断发生影响恶劣的大型网络攻击及数据泄露事件,爆发式增长的网络犯罪率带来的是巨额经济损失,网络安全再度成为大众焦点。redmi k50价格  网络安全的本质...
    日期:02-11
    奥巴马夸拜登「拜登、奥巴马穿“芭比粉”西装AI伪造图片疯传网络」
    7月27日 消息:最近,国外一些社交媒体上疯传美国总统拜登和前总统奥巴马身穿粉色西装,由于最近上映的《芭比娃娃》电影口碑良好,网友也用这种方式玩起了梗。毫无疑问,这些这些照...
    日期:07-27
    中国太空空间站正式开放「中国空间站"太空菜园"画面公开!一片欣欣向荣」
    太空种菜,挑战无限!蔚来换电站达300座中国载人航天工程最新消息显示,神舟十八号飞船的宇航员叶光富、李聪、李广苏已在太空驻留逾4个月。从公开的画面中可见,宇航员在空间站内开...
    日期:10-19
    Stability AI发布30亿参数语言模型StableLM Zephyr 3B 更小更快更节省资源
    **划重点:**iphone12pro单卡版华为p20如何使用nfc功能- 网秦手机安全卫士soc解决方案...
    日期:12-08
    科技改变生活!男子为“吃福币”用上金属探测器
    在我国传统文化里,有些地方在吃年夜饭的时候,会有往饺子、包子、汤圆、馄饨里包硬币,谁要是吃到了这些福币”,那就表示来年会非常的走运,所以这个福币也算是幸运币。不过之前吃福...
    日期:01-24
    国网信通携手上海诺基亚贝尔及长飞完成空芯光纤电力长距传输应用验证
    通信世界网消息(CWW)近日,国家电网有限公司信息通信分公司联合上海诺基亚贝尔股份有限公司、长飞光纤光缆股份有限公司及旗下子公司长飞(武汉)光系统股份有限公司,开展了基于空芯...
    日期:09-29
    苹果16pro max全球超窄边框16 Pro Max配备6.9英寸屏幕 钛金属中框加持_iPhone
    来源:中关村在线英特尔核显和独立显卡能一起用吗苹果公司于今日凌晨1点在新品发布会上正式推出了备受瞩目的iPhone 16 Pro系列手机。据悉,iPhone 16 Pro Max是该系列产品中最...
    日期:09-10
    9950x用什么主板好 锐龙r9 9950x搭配主板建议 锐龙r9_r9 5950x配什么主板最好
    在为锐龙r9 9950x这款处理器选择主板时,应该优先考虑好兼容性问题,避免因兼容问题造成安装不上的情况,这款处理器推荐使用的主板为X670或者X870/X870E系列。锐龙r9 9950x用什么...
    日期:06-26
    希捷助力极空间新品发布,共同打造NAS存储新时代
    通信世界网消息(CWW)日前私有云行业领导品牌极空间私有云在北京举办2023新品发布会,推出多款重磅NAS新品。作为极空间长期的战略合作伙伴,希捷科技全球高级副总裁暨中国区总裁孙...
    日期:10-24
    雷军在车展现场招人:为中国汽车工业做出我们的贡献_雷军进军汽车销售行业
    4月25日 消息:在今日北京车展小米汽车盛大发布会上,雷军郑重地发出求贤令,诚邀天下英才共同加入小米的行列。随后,雷军通过个人公众号再次强调了这一诚挚的邀请:“我们渴望与全...
    日期:04-25
    如何通过智能电视在线学习?当贝市场亲测方法推荐_智能电视怎么打开当贝市场
          在这个特殊时期,很多学生党都采取在线上课的方式进行学习,从手机端到电脑端再到电视端,在线学习软件越来越多,到底哪些在线学习软件比较靠谱呢?今天和当贝小编一...
    日期:08-03
    豆瓣9.7分纪录片天花板!《地球脉动》首部大电影国内定档7月27日:预告片发布
    快科技7月5日消息,《地球脉动》系列首部IP大电影《地球脉动:极境生存》确认引进并首登中国大银幕,新片定档7月27日。别克8-10万买什么车好今日,片方发布大自然的史诗”版定档预...
    日期:07-05
    8k分辨率选择显卡推荐 8k分辨率需要什么显卡_8k分辨率dpi
    很多用户不知道该怎么选择显卡,8K分辨率的显示屏大家可能不太常用到,一般来说8K分辨率的显示器可以直接用GTX1070TI以上的性能显卡使用8k分辨率需要什么显卡答:建议GTX1070TI以...
    日期:02-29
    纾困在当下,赋能在未来 “助力上海中小企业纾困赋能专项行动”发布会成功举行
      2022年5月是全国中小企业服务月。为了深入贯彻落实党中央、国务院关于支持中小企业纾困解难健康发展的决策部署,响应工业和信息化部“一起益企”中小企业服务行动,5月20...
    日期:06-27
    漫威战斗力最强的英雄「漫威宇宙十大战力英雄:钢铁侠仅排第五」
    日前,漫威高调宣布时隔3年半重回中国市场,《黑豹2》和《蚁人与黄蜂女:量子狂潮》两部影片分别将于2月7日和2月17日上映。由于下一部复联电影《复仇者联盟5:康之王朝》需要等到20...
    日期:01-29
    萝卜快跑被指抢司机饭碗 百度副总裁:初衷为了提供新的出行方式
    快科技7月12日消息,据媒体报道,百度旗下的萝卜快跑”无人驾驶网约车在武汉市展现出强劲的市场潜力,订单量实现了显著增长。这一创新出行方式以其亲民的价格优势脱颖而出,有乘客...
    日期:07-13