您的位置:首页 > 互联网

超越 ChatGPT ?AutoGPT 爆火,两周斩获 50k+ Star:无需人类插手,自主完成任务!

发布时间:2023-04-14 21:54:46  来源:互联网     背景:

声明:本文来自于微信公众号CSDN(ID:CSDNnews)),作者:郑 丽 媛,授权转载发布。

刚上线两周就收获50k+ Star,看来 Auto-GPT 是真的火了!

向往的生活赞助商豆奶

图片

(项目地址:https://github.com/Torantulino/Auto-GPT?ref=jina-ai-gmbh.ghost.io)

Auto-GPT,顾名思义,其独到之处就在于 “Auto” ——可“自主”实现你设定的任何目标,即 Auto-GPT 会自己上网查资料、自己思考解决方案、自己运用相关工具……而你要做的,就是在屏幕前静静旁观这一切的发生。

面对这样一个无需人类插手、便能自主完成任务的 Auto-GPT,难怪不少网友的第一反应就是“摆烂”:

图片

有了Auto-GPT,ChatGPT 已沦为“传统 GPT”

根据官方介绍,Auto-GPT 本质上是一个基于 GPT-4语言模型所构建的实验性开源应用程序,由 GPT-4驱动,将大型语言模型 (LLM) 思想串在一起来自主实现任务。

如果说 ChatGPT 的出现让人相信未来 AI 的重要性,Auto-GPT 则将这个想法进一步升华:未来,由自主 AI 驱动的任务将成为常态。因 Auto-GPT 提出的这个可能,导致 ChatGPT 问世不到半年就已沦为许多人口中的“传统 GPT”。

美团 腾讯 股份

为了验证这种未来的可能性,最近已有不少人下场体验过 Auto-GPT,其中包括微博博主@木遥:“如果你刚开始玩 Auto-GPT 但又没玩明白,你就会焦虑 af,像我一样。”

图片

本来,木遥只是想让 Auto-GPT 解释一下 LangChain(一个围绕大型语言模型的应用开发框架)的用法,结果 Auto-GPT 直接来了一整套操作(这一系列步骤都是它自己串起来的,无需人类介入),连 LangChain 都安装了:

▶首先试着直接去 LangChain 官网爬信息。

▶被官网拒绝了,可能因为有屏蔽。

▶发现失败了之后想了想,说要不 Google 一下?

▶Google 出了很多结果。

▶读了半天这些结果,说「现在我们已经搜集了不少有用的信息了,接下来让我们安装它玩一下」

▶然后就开始动手在我的电脑上安装 LangChain……

图片

面对行动力如此“爆表” Auto-GPT,木遥忍不住感慨:“我坐在屏幕前看着这一切自动在我眼前发生,心想,我要是有它这个行动力,三个 PhD 都念完了。”

除此之外,Globus 创始人安替(Michael Anti)也分享了一个不错的 Auto-GPT 使用案例:“假设你是华为的公关,分析最近国际报道,看看下一步要改善的动作。”

图片

iOS14.6 Beta 3

对于 Auto-GPT 的表现,安替(Michael Anti)评价道:“奇点算是到了吧,又有很多行业要死了吧?”

整体来看,Auto-GPT 就像是一个机器人助理,你只需下达任务,它便会自己看着完成。但 Auto-GPT 真就完美无缺、无懈可击吗?

事实证明,至少现阶段还远远不是——Jina AI 的创始人兼 CEO 肖涵表示:“在我们庆祝 Auto-GPT 的快速崛起时,退后一步并仔细检查其潜在的缺点至关重要。”

现阶段,Auto-GPT 仍有缺陷

为说明目前 Auto-GPT 的不足之处,肖涵先大致分析了一波原理,即 Auto-GPT 主要由四部分组成:

(1)架构:Auto-GPT 是使用强大的 GPT-4和 GPT-3.5语言模型构建的,它们作为机器人的大脑,帮助它思考和推理。

(二)自主迭代:类似于机器人从错误中学习的能力。Auto-GPT 可以回顾其工作,在之前的工作基础上再接再厉,并利用其历史记录生成更准确的结果。

(三)内存管理:与矢量数据库(一种内存存储解决方案)集成,使 Auto-GPT 能够保留上下文并做出更好的决策,类似于为机器人配备长期记忆以记住过去的经历。

(四)多功能性:Auto-GPT 的功能(例如文件操作、Web 浏览和数据检索)使其用途广泛,并使其与有别于以往的 AI 迭代,就像赋予机器人多种技能来处理更广泛的任务。

基于其组成原理,肖涵指出现阶段 Auto-GPT 面临的五个重要局限:

▶成本高昂

虽然 Auto-GPT 具有卓越的功能,但由于任务是通过思维链完成的,为提供更好的推理和提示,每一步都需要调用昂贵的 GPT-4模型,这通常会最大化 token,也就带来了过高的成本。

对此,肖涵估算了一个小任务的花费:Auto-GPT 平均需要50个步骤来完成一个小任务,即成本为50*0.288=14.4美元(约人民币98.5元)。

▶不知变通

可能会有人觉得只要 Auto-GPT 能完成任务,这14.4美元倒也不亏。但问题是,这14.4美元是一次性的:哪怕你只想修改一个很小的任务条件,也需要再次支付14.4美元。

肖涵指出:“一旦生成过解决方案,再次花费相同的金额来调整参数似乎不合逻辑。这揭示了 Auto-GPT 的一个基本问题:它无法将开发和生产区分开来。”

▶容易陷入死循环

更要命的是,这14.4美元还可能“打水漂”。许多用户报告说:Auto-GPT 经常陷入循环,导致其无法解决实际问题。

“我昨天多次使用它,我发现…它从未完成过一项任务。它总是去深入挖掘、做更多的研究,但从来没有真正完成一个目标。我就放着让它持续循环了几个小时。”

图片

新能源汽车进口量

▶矫枉过正

Auto-GPT 依靠矢量数据库来进行更快的 K 最近邻(KNN)搜索,但肖涵表示这是一种矫枉过正的做法:“很多情况下,穷举搜索就足够有效了,只需不到一秒钟即可完成。相比之下,每个 GPT-4调用大约需要10秒来处理,这使得系统受 GPT 约束而不是数据库约束。”同时,这也会带来成本的增加。

▶代理机制不完善

Auto-GPT 引入了一个很有趣的概念,即允许生成代理来委派任务。然而,肖涵认为这还不够完善:“这一机制仍处于早期阶段,其潜力在很大程度上仍未得到开发。”

“又贵又慢,AI 摸鱼?”

对于以上总结的几点 Auto-GPT 缺陷,实际上早有不少用户在抱怨,还搞出了一些“闹剧”:

图片

图片

同时,Auto-GPT 的处理速度也引来吐槽,有点“AI 摸鱼”的意思:

图片

不过即便如此,Auto-GPT 还是令许多人对未来 AI 的发展趋势充满期待:

▶ “想象一下,你手里有一个 AI 代理,可以随时随地执行命令。我相信未来才刚刚开始!”

▶“这种自我改进的 AI 代表了真正 AGI 的第一个火花。”

▶“Auto-GPT 的确揭露了使用 GPT 的正确姿势。”

那么,你对于 Auto-GPT 又有什么看法呢?

参考链接:

https://weibo.com/1644684112/MBK3WCt8o

https://jina.ai/news/auto-gpt-unmasked-hype-hard-truths-production-pitfalls/

https://twitter.com/mranti/status/1646430121904013312?cxt=HHwWgIC8uaDepdktAAAA


返回网站首页

本文评论
抖音找你谈合作_饿了么和抖音达成合作 双方今日将正式官宣
讯 8月19日下午消息,获悉,饿了么和抖音达成合作,双方今日将正式官宣。switch主机总销量...
日期:08-20
iPhone 5c过时产品「iPhone 5c将被列为过时产品:教会安卓做塑料手机」
近日,苹果提供给授权服务商的备忘录显示,从今年11月1日起,苹果将把iPhone 5c标记为过时产品,终止所有相关维修和服务。小米陶瓷工艺这款在2013年9月发布,曾被列为一代神机的产品...
日期:10-15
“快手KA客户培训沙龙”解码短视频社交营销新趋势
  摘要:随着互联网流量增速放缓,“高曝光”、“黏性强”的短视频平台俨然成为品牌重要的流量入口。短视频营销有哪些新的趋势?品牌方、广告主如何玩转短视频营销,实现品牌曝...
日期:01-13
东软财经云平台等四款产品荣获创新大奖
  11月14日,由中国软件网主办,海比研究、光明网联合主办的“洞见2020中国企业服务年会”在北京香格里拉饭店成功举办。会议现场,颁布了各行业领域年度创新产品榜单,东软四款...
日期:07-13
运营商开始筹备上架苹果2022款iPad Pro_2021苹果发售计划
IT之家 9 月 1 日消息,据 MacRumors 报道,已经开始有大型零售商准备上架苹果 2022 款 iPad Pro 型号,正在将该设备添加到其系统中。IT之家获悉,苹果当前的 iPad Pro 11 英寸和 1...
日期:09-05
董明珠直播间销售额大跌「董明珠直播销售金额」
nike gps手表iphone联通lte中国移动的5g现状2022年 董明珠直播间销售额大跌 (来源:财经网) 俏江南创始人张兰于近日在个人抖音账号晒出了其...
日期:02-25
小米新款手机一亿像素「10月4日发布 小米款2亿像素手机要来了」
小米官宣10月4日举行全球发布会,发布会上将会发布小米12T和小米12T Pro至少两款新手机。京东家电 刘俊这两款手机的一大看点就是像素的提升,其中,小米12T后置主摄为1.08亿像素,...
日期:10-06
哔哩哔哩将于9月8日发布2022年第二季度财报_哔哩哔哩2020年第三季度财报
长津湖第七穿插连的英雄人物 查看最新行情   讯 北京时间8月18日晚间消息,在线娱乐平台哔哩哔哩(B站,Nasdaq:BILI,HKEX: 9626)今日宣布,将于美国东部时间2022...
日期:08-21
QQ Linux 3.1.1版发布:底层重写、支持国产自主龙芯CPU
2月24日,QQ Linux 3.1.0版本发布,采用全新架构,基于QQ NT技术架构驱动,最重要的是正式支持龙芯中科自主指令集的LoongArch龙架构平台。新版可在基于龙芯3A5000处理器的UOS、麒麟...
日期:03-30
私有云市场迎来黄金时代 中国电信天翼云竞争优势明显_中国电信天翼云的卖点
  近日,来自国家工业信息安全发展研究中心、中国权威ICT研究咨询机构计世资讯发布的《2018-2019年中国私有云市场现状与趋势研究报告》显示,中国私有云市场增势迅猛,各大云...
日期:04-04
荣耀新机X40 GT官宣:性能越级标杆 战神登场「荣耀x4笔记本」
中关村在线消息:10月8日早,荣耀手机官方微博预热了一款即将推出的新机:X40 GT,Slogan为“性能越级标杆”。官方是这样评价这款新机的:“强悍性能,非凡操控 生来强大,实力霸屏”。36...
日期:10-11
禾赛科技预计将于2月9日正式登陆纳斯达克「禾赛科技 上市公司」
凤凰网科技讯 2月8日消息,据IPO Boutique消息,禾赛科技预计将于2月9日(周四)正式登陆纳斯达克。meta发布全新vr头显比pico4强多少讯飞鼠标m110和m210MAXHUB智能会议平板suprim X...
日期:02-08
对话小牛电动CEO李彦:我们要做有独特价值主张的产品「小牛电动车 李彦」
雷递网 雷建平 8月5日报道小牛电动日前推出两款新品——全场景跨界机能座驾SQi及开挂电自全新UQi+2022版,开启两轮电自“个性化”新时代。据介绍,小牛电动2015年将智能和锂电...
日期:09-27
motorola razr折叠屏手机_三星下代折叠屏准备模仿 moto razr的魔力到底在哪儿?
  2019年智能手机行业最大的科技创新,非折叠屏设计的横空出世无疑了。在已经发布的折叠屏手机中,moto razr的设计可谓独树一帜,它延续了了razr经典的设计语言,并加入了创新的...
日期:12-02
会议平板市场混战下如何应对? MAXHUB线上新品发布会或将释放头部优势
  2019年经济下行压力叠加2020年初以来疫情,不少行业都或多或少受到一定程度的冲击。但仍有一些行业市场能够切入时代痛点实现逆流而上。比如短视频行业、电商直播行业、...
日期:07-14
飞猪发文diss携程抄袭:查重相同之处高达72.7% 错别字都一样
凤凰网科技讯 1月12日消息,1月8日入境政策放开之后,出境游需求激增,旅游公司各家开始制作各种签证、游玩攻略。飞猪今日发布一篇名为《尊敬的@携程旅游 新年快乐》的文章,戏嘲携...
日期:01-12
小米商业保理公司更名 此前小米小额贷款也发生了工商变更
凤凰网科技讯 12月30日消息,天眼查App显示,近日,重庆小米商业保理有限公司发生工商变更,企业名称变更为重庆丝路商业保理有限责任公司,岳凯卸任法定代表人、执行董事,由罗书权接任...
日期:12-30
新加坡硕士留学申请专业推荐,去新加坡留学研究生兼具商业与技术思维
  信息系统(Informaiton System)正在改变社会组织和企业的存在方式。但是,信息系统是什么?   信息系统五大要素   信息系统是对硬件和软件的补充网络的研究,人们和组...
日期:07-16
我国快递业务量再超千亿件 每天1亿件进出农村_快递业务量突破200亿件用时仅83天
  新华社北京12月2日电题:我国快递业务量再超千亿件 每天1亿件进出农村日本软银集团创始人  新华社记者戴小河  12月1日上午8点刚过,国家邮政局快递大数据平台的大屏幕...
日期:12-12
干货——固定资产管理逻辑梳理_固定资产管理理论
  固定资产管理是一项复杂且重要的工作,其涉及的层面之广、人员之多、资产之杂都容易让资产管理员在忙碌中陷入迷茫——自己所做的一切工作都是基于怎样的底层逻辑?易盘点...
日期:07-15