您的位置:首页 > 互联网

OpenAI、微软押注,大模型应用的尽头是AI Agent ?|对话面壁智能

发布时间:2023-11-16 19:03:49  来源:互联网     背景:

声明:本文来自于微信公众号 光锥智能(ID:guangzhui-tech),作者:郝 鑫,授权转载发布。

你见过Agent们“吵架”么?

“这个产品需要具备XX需求,为什么没有?”,“你提出的需求完全不合理,技术上达不到!”,现场顿时乱作一团,越来越多的“员工”也被卷进了这场大乱斗中。

激烈的争吵声越过了屏幕外,面壁智能的测试人员通过后台日志,发现Agents正在上演一场“职场大戏”。

这家完全由AI Agents组成的软件开发公司,是面壁智能基于其创新研发的开源框架ChatDev开发的SaaS产品,产品经理和技术开发的Agents们“继承”了现实中的角色,在数字世界中也“Battle”了起来。

飞利浦x1s发售价

大模型之后,应用层到底驶向何方一直是创业公司讨论的核心话题,在最近,这个问题似乎有了答案。

OpenAI再次成为了“行业模版”,通过GPTs打造Agent功能一经开放,一天内就涌现了2万多个GPTs。

而早就发现Agent确定性机会的面壁智能,也终于不用再煞费苦心地给投资人解释,究竟何为Agent,以及为什么Agent潜力巨大。

目前,在行业内关于AI Agent达成一定共识的,主要是来自OpenAI的一篇博文。在里面对AI Agent的定义为:大语言模型作为大脑,Agent有感知、规划、记忆、和使用工具的能力,能自动化实现用户复杂目标,这也奠定了AI Agent的基本框架。

(AI Agent的基本框架)

虽然AI Agent的概念早已有之,今年年初也冒出了一些昙花一现的构想,但因为底层大模型技术能力的不成熟、不完善,所以直到现在才得以爆发。

从结果来看,AI Agent发展分为两个阶段,一个是以OpenAI的GPTs为代表的单体智能,发展到后期,则进入了像面壁智能打造的ChatDev这种多智能体协作的群体智能阶段。

几乎与国外“斯坦福小镇”同期,面壁智能直接进入了群体智能的第二阶段。

(斯坦福小镇示意图)

(面壁智能ChatDev群体智能交流链示意图)

“我们从一开始就从群体智能开始切入,发布了ChatDev多智能体协作开发框架 ”,面壁智能产品负责人告诉光锥智能。

2020小米8跑分

据了解,面壁智能的核心科研成员来自于今年大模型创业浪潮中的“半壁江山”——清华大学NLP实验室,联合创始人刘知远是清华大学计算机系长聘副教授、智源青年科学家,其联合创始人、CEO也是知乎的CTO李大海。

那么,选择了一条比OpenAI还难走的路,在大模型时代,作为国内最早一批深入AI Agent的公司,面壁智能如何思考AI Agent技术,对AI Agent未来发展又有怎样的判断?带着重重疑惑,光锥智能对话面壁智能,寻找关于AI Agent的答案。

核心观点如下:

1、AI Agent就是下个时代大模型赋能整个应用场景的一种新模态。

2、现阶段,AI Agent呈现出的更多是一种“拟人化”的形式。它可被定义为“分身”、“员工”和任意“个体”。

3、Copilot和Agent不是同一个概念,Agent实现的是全自动化的决策、运行和反馈。

4、用Agent开发软件,能够把几万元的开发成本降至几十元,甚至几元。

5、大模型是Agent的“输血泵”,赋能Agent原子化能力,决定其干得好不好。

以下为对话实录:

光锥智能:面壁一词来源于《三体》中的面壁计划,面壁智能是一家什么样的公司?与其他大模型公司相比,面壁智能有什么特殊的地方?

面壁智能:面壁智能是一家集学术研究、技术开源和产品商业化为一体的公司。

整体上分为三个部分:首先是清华NLP实验室,与我们共同进行底层前沿的科研探索;其次是开源社区OpenBMB,我们会把一些前沿的一些技术、科研成果开放给更多的开发者和行业;另外就是面壁智能,基于所有的科研沉淀和开源框架,进行应用研发和整体商业化落地,由此形成了以面壁智能为枢纽的产学研联动“一体两翼”的架构。

具体到面壁智能这家公司,公司的愿景和理念是“智周万物”(Internet of Agents),即让 AI Agents连接万物,实现从“万物互联”到“万物智联”。

以前有互联网,后面有物联网,面壁智能认为在当前这个时代,大模型以及以大模型孵化的AI能力,是下一个时代新的拐点,期望把我们在大模型、AI方面的基础能力赋能到方方面面,从而让整个行业、社会有一个新的提升。

光锥智能:为什么一开始就选择了AI Agent这个方向?有哪些契机和思考?

面壁智能:大模型想要落地到具体场景,AI Agent是重要路径,它代表的是比“裸”模型更拟人的使用体验。我们判断未来会是Agent的世界,万物都是Agent。

比如电饭锅可以是Agent,放入食材后,我们跟它说要熬粥,它就会根据熬粥的逻辑,去设定相应的加热方式。冰箱也会是Agent,如果它的冷却剂漏了,它会跟我们对话,说自己需要维修了,或者它已经打完了维修电话,通知维修师傅上门时间;或者提醒我们上周蔬菜买多了,要赶紧吃掉,否则菜就坏了。

基于此,我们对于未来世界才有了“智周万物”的设想以及面壁智能的定位:一家基于大模型驱动Agent技术的公司,技术研发方向从模型基座到Agent技术,再到最终的应用。

光锥智能:在行业内,对AI Agent的定义都还没达成共识,面壁智能如何定义AI Agent?

面壁智能:现阶段,AI Agent呈现出的更多是一种“拟人化”的形式。它可被定义为“分身”,也可以被定义成某个“员工”,也可以被定义成组织中的一个“个体”,甚至到高阶阶段,也可以连接“物体”。如果单独的物体也不是最后的形态,那它的定义应该是一个完完全全新的东西。

我们认为在一个理想技术路线下,AI Agent至少应该具备以下几个能力:第一是,应该具备超级高的智商,无论是学习使用工具、规划,还是记忆、知识储备,其实都是智商的一部分;第二是,应该具备超级高的情商,需要其能够针对不同的场景和不同需求的用户有较强的自然对话能力和理解能力;第三是自省和成长迭代能力;第四多模态能力,能够模拟人的听、说、看、想,具备跟整个自然世界交流的能力;第五是价值观对齐能力,AI Agent也需要像人一样受到社会价值观和道德取向的约束;第六是可被定义的能力,根据人的需求和设定,随时变化出一个特定的形态。

光锥智能:很多人分不清Copilot与Agent,或者将二者粗略的画等号,您怎么看?如果有差异,差异在哪?

面壁智能:这还是两个不同理念的东西。假如说未来你可以去基于Agent搭建一个数字公司,对这个数字公司而言,95%的情况下可以自己运转,但过程中他会反问你,公司的核心目标是什么?期望达到的销售额是多少?你在公司的投入有多少?在实际运行过程中,遇到难以决策的问题也会寻求你的帮助,你需要把知识、经验、需求、预期等喂给它,在交互过程中实现自动化的公司经营;这跟基于人设定的逻辑,辅助处理问题的逻辑完全不一样。类似ChatDev这种群体智能自动化创造的产品、就是奔着Agent自动化运转的思路去做的实践。

光锥智能:您认为AI Agent的确定性机会在哪?在这个十分不确定的大模型时代,为什么认为这条路能行得通?

面壁智能:回顾几次工业革命变迁,背后都是生产力的跃升。从蒸汽机、电力再到如今的人工智能,生产力的变革带来了整个社会生产关系、生产工具的重塑。在大模型时代,我们认为AI Agent就是这样具有生产力性质的技术,其能力强、效率高的特性决定了,它可以在某种程度上模拟一个人、一个组织、一个公司,大幅提升生产效率和交互方式。虽然现在AI Agent发展仍在早期,但其未来的潜力却是无穷的,本身的商业化路径也十分清晰,从单体智能到群体智能,从技术到产品再到商业化,由此才坚定了我们确定AI Agent 方向的决心。

未来可能就是工程师去做构思,理解市场需求,然后将需求拆解交付给AI,让AI去完成一些低水平的重复劳动、以及部分创造性的工作,解放人的生产力。这有助于未来千行百业都能把AI相关软件应用起来,进而更好地推行全面数字化和信息化。

光锥智能:2023年至今,面壁智能在AI Agent这个方向,做了哪些探索?有哪些产品和思考?

面壁智能:基于AI Agent,我们打造了三个引擎,用以连接大模型和现实环境,它们分别是大模型驱动的AI智能体应用框架XAgent,智能体通用平台AgentVerse和多智能体协作开发框架ChatDev,以上三个引擎也被内部称为AI Agent“三驾马车”。

ToB方向AI Agent可能成为企业内部的不同工种,重塑企业组织流程,提效的同时,最后实现完全由AI Agent组建、运营起来的公司;ToC方向,AI Agent可能是智能助理等。

(XAgent数据分析示意图)

  • XAgent大模型驱动的超强AI智能体应用框架

    通过大模型打造一个像人一样,具备一个高智商、情商、记忆力的超级智能体,在真实复杂任务的处理能力已全面超越AutoGPT。

  • AgentVerse大模型驱动的智能体通用平台

    偏向通用化的Agent开发平台,在上面用户可以自定义构造专属Agent。

  • ChatDev大模型驱动的多智能体协作开发框架

    AI Agent应用的具体开发框架,目前,已经跑出了落地的ChatDev产品,核心功能是允许用户使用自然语言开发软件。

骁龙710处理器跑分安兔兔

光锥智能:能否以刚发布的ChatDev SaaS产品为例,更清晰地拆解面壁智能产品化的思路?

面壁智能:简单概括就是,让用户能够通过一句话的自然语言,去开发一款具体的软件,这将大大降低软件开发的门槛。

在这个软件公司里,会有CEO、CTO、开发经理、产品经理、测试专员、监督员等,只要用户把明确的需求告诉CEO角色的Agent,这个CEO就会基于用户的需求,组织整个软件开发流程。最后交付给用户的包含了软件产品和整个开发过程中的代码,并且所有流程都是自动化的。

(ChatDev软件开发过程)

这里面留给用户和开发者可自定义空间非常大,用户可以针对已开发出的软件提出新需求,也可以改变整个软件的开发模式。比如我定义的软件公司,跟别人默认的软件公司不一样,期望多几个测试,把这款软件变得更可信一些。那就根据这个具体的需求,多几次测试,多增加几个产品经理执行这个想法。

光锥智能:用Agent开发软件能够降低多少成本?

面壁智能:如果让软件工程师去开发,至少需要几万块钱的人工费,时间两周起步。但使用ChatDev开发,价格只需要几元到几十元,最快几分钟就能跑通一个应用。

目前,一些相对简单的软件开发流程已经完全跑通了,一个没有代码开发经验的小白用户,60%的场景应用都能完全实现。

光锥智能:怎么去训练一个ChatDev?

面壁智能:可以把这个事情理解成三步。

第一步是预设协作流程。在一个公司中,每个人都有固定的角色和分工。在群体智能场景中也需要一个预设的协作流程,比如在软件开发的过程中,就可能涉及产品经理、技术研发人员、测试人员等,每个人需要在其中发挥作用,甚至有时还会出现像人一样互相battle的情况。

第二步是指导和反馈机制。流程设计中有指导角色和执行角色,通过2个角色的互动沟通,减少执行幻觉的出现;同时任务完成后会有角色之间的反馈机制,类似现实世界中的跟老板汇报,以此来增强运行的准确性。

第三步是大模型赋予Agent原子化能力。所有AI Agent的引擎和应用都长在大模型上,光创建工作的协作流程还不够,每个人还得干活儿,可以把大模型理解成“输血泵”,AI Agent一旦有需求,大模型就把其需要的能力输送给它。

光锥智能:ChatDev产品反过来对底层的大模型能力提出了哪些调整?

面壁智能:这很大程度取决于上层应用,拆解下来看的话,大致需要几个基本的能力。

首先是复杂规划和指令遵循的能力,基于对话分析项目、拆解需求、提出正确的指令的能力。在一个协同的组织里,有不同的角色发布不同的指令特别是在复杂的生产环境中,指令可能不是简单的一句话,对于复杂的指令AI Agent能不能够有一个思维链的方法,完成一个个的拆解,并且基于这个拆解去进行实际落地,也是大模型本身要去解决的。

其次是编码能力,因为最后追求的结果是要能在真实环境里跑通,反馈、测试、修改的前提都要基于完整的代码流程。

再次是更长token的输入窗口能力,以后需要做更复杂的软件,就需要更复杂的任务理解、Prompt输入和更复杂的上下文对话能力。

最后还有格式化输出对接的能力,对知识内容的理解能力、精准的生成表达能力等大模型的综合能力。

光锥智能:如何理解大模型和AI Agent的关系?就AI Agent而言,面壁智能现在发展到了哪个阶段?

面壁智能:可以把大语言模型想象成一个哆啦A梦的魔法兜,现实中我需要的是怎么从这个兜里拿出东西,跟现实世界的真实需求去连接。我们打造的“AI Agent三驾马车”,有点像是魔法棒,将大模型的能力转化成实际的应用。

在具体应用上:ChatDev已经走过了论文研究、开源产品上线的前两个阶段,现在进入了第三个阶段——商业化产品孵化,会面向不同类型的用户开放使用,以前更多是开发者讨论的声量,现在的产品开始正式面向普通用户。同时,基于Agent产品面壁智能也在跟一些B端企业合作,尝试去辅助他们完成一些更复杂的工作。

上面提到的“三驾马车”可以视为未来诞生超级应用的土壤,现在AI Agent的基建已经逐步搭建起来;对于ChatDev产品中的哪些场景或者软件应用能够跑出来,我们也希望在用户使用过程中再去沉淀下来一些垂直的场景需求,探索更多商业化的空间。

光锥智能:如何看待OpenAI上线的“GPTs”功能?

面壁智能:OpenAI开发的GPTs,实际上属于单体智能,OpenAI开放出来的是基础Agent的构建能力,如说工具调用、基于知识库文件记忆能力。而ChatDev进化到了群体智能阶段,通过多Agent协同能去实现更复杂、贴近真实需求的应用。

光锥智能:AI Agent的未来应该是怎样的?

面壁智能:总体上来看,可能是更深层次的智能连接。我们说“智联网”发展到后面也需要把物理连接纳入进去,单体智能再往前发展也会扩展到物的智能、机器人的联动。从群体智能角度来看,ToC或许是更大的社区化的虚拟组织,每个人的Agent都能通过虚拟数据连接在一起;ToB则是虚拟的组织、企业,不同的企业和员工都能通过智能体纳入到网络当中。发展至最后,整个社会将变成一个巨大的虚实结合的网络,形成“智联网”——IoA(Internet of Agent)。

通过不同的智能体,提供了更强的生产力,重新塑造整个生产关系,整个社会的产能也会有一个很大的提升。


返回网站首页

本文评论
1个月发了4版驱动 Intel Arc显卡自信起来了:RTX 3060性价比已不能看
Intel的Arc显卡硬件架构及技术水平都不错,让玩家纠结的主要是驱动,但是2023年的Intel在这方面已经让人刮目相看了,即将过去的3月份中Intel更新了4版Arc驱动,最新的31.0.101.4257...
日期:03-30
小米营销×中国传媒大学广告学院 成立“AIoTT智能营销实验室”_小米广告部门
  11月20日,MIDC 2019小米开发者大会—互联网商业化分论坛在北京召开。分论坛现场,小米营销和中国传媒大学广告学院达成战略合作,共同成立“AIoTT智能营销实验室”。中国传...
日期:10-07
新iPad mini 7曝光:处理器升级 屏幕仍是LCD_ipad mini屏幕是几寸的
据苹果公司最新传闻,苹果有望在今年内推出iPad mini 7,但据X平台科技博主Tech_Reve的消息,iPad mini 7的升级仅为常规处理器的升级,仍无法拥有120Hz Pro-Motion高刷新屏幕。...
日期:10-11
小米10月将发布新品:小米14或亮相_小米10月新品发布会
2023-10-08 05:42:31 作者:姚立伟 小米集团卢伟冰在微博上表示,该公司将在10月份推出一系列新产品。网友猜测,这些新产品可能包括小米14系列。据了解,小米14和小米14 Pro已经获...
日期:10-08
为什么短短两周之后就鲜有人继续讨论ChatGPT了?
声明:本文来自于微信公众号 卫夕指北(ID:weixizhibei),作者:卫夕,授权转载发布。从0到100万用户,Netflix用了3.5年,Twitter用了24个月,Facebook用了10个月,Dropbox用了7个月,Spotify...
日期:12-22
英伟达、英特尔、AMD等芯片巨头集体萎靡,PC销售热潮已退_英伟达 CPU 问世
rog游戏手机5散热背夹htc照片   过去近两年,当疫情期间人们被隔离在家时,PC出货量出现爆发式增长。而现在,这样的增长终于消失。   当地时间8月8日,存储芯片公司美光警告称,P...
日期:08-16
华为搞定6G赫兹技术验证:可实现10Gbps下行速率「6g网络 华为」
快科技6月30日消息,华为高级副总裁、运营商BG总裁李鹏表示,其已联合运营商完成6G赫兹技术验证。iphone14pro灵动岛演示华微半导体科技有限公司当贝投影x3评测5G网络需要更加丰...
日期:06-30
hp p1008打印机驱动下载_hp laserjet p1008驱动下载
HP P1008 Printer Driver DownloadIf you're looking for a reliable and efficient printer, the HP P1008 is a great option. This monochrome laser printer ensures yo...
日期:05-28
网红大鲶鱼「“抖快红视”大战本地生活,谁是搅动市场的鲶鱼」
声明:本文来自于微信公众号 新榜(ID:newrankcn),作者:小八,授权转载发布。今年夏天,能够在热度方面跟AIGC一较高下的,无疑是内容平台争相布局的本地生活。为什么金立游戏账号登录...
日期:08-14
苹果笔记本支持脸部识别「新专利已经获批 苹果电脑也有望采用面部识别」
6月17日消息,根据美国商标和专利局(USPTO)公示的清单,苹果近期获得了编号为US 11676373 B2的新专利,暗示Face ID将会引入 Mac 平台。这项新专利名为“个人电脑设备控制检测和识别...
日期:09-24
联想电视售后电话「联想电视」
作为一个知名品牌,不断推出高质量、高性能的电视产品,深受消费者的青睐。本文将对的相关信息进行整理,让更多人了解的优势。1. 品质保证联想公司在生产电视时,秉持着精益求精的...
日期:05-30
京东618iphone12最低价「iphone京东618最低价","info":{"wordid":"6971691698565944616
来源:中关村在线初二语文游记作文600字京东618全面开启,百亿补贴日也如期而至。其中,iPhone 14 128GB午夜色享受了1300元的补贴,到手价仅需4699元。银行315打假案例...
日期:09-03
机遇与挑战并存 三方面着手保障人工智能安全发展「人工智能机遇和挑战」
通信世界网消息(CWW)随着全球人工智能产业的蓬勃发展,一场AI浪潮正在席卷而来,当前互联网已经进入万物皆可AI的时代。我国目前已建成全球规模最大、技术领先的网络基础设施,数据...
日期:07-22
熬夜有问题吗「熬夜真凶找到了 近七成晚睡是因为手机」
中关村在线消息:熬夜已经成为了当代年轻人的标配,长期熬夜会使身体处于亚健康状态,最终导致多种疾病发生。调查显示,近七成晚睡都与一个东西有关,那就是手机。玩手机、追剧、打游...
日期:10-25
增加富人税「200多名百万富翁呼吁对超富增税 帮助缓解普通家庭生活压力」
1月19日消息,200多名百万富翁敦促出席世界经济论坛的精英阶层“解决极端财富不平等问题”,并“对超级富豪征税”,以帮助缓解普通家庭的生活成本压力。这些富翁来自被称为The Pa...
日期:01-19
为什么微信头像褪色「微信回应头像褪色:正在优化该功能」
2月13日 消息:今天,有网友反映,微信头像使用一段时间后会变暗淡,清晰度和色彩也变得不够明亮。有人猜测这可能是由于压缩画质导致的。有人开玩笑地说头像“电子包浆”了。微信...
日期:02-14
奢侈品电商第一股寺库人去楼空_寺库奢侈品电商平台
来源:北京商报   寺库的危机正在不断浮出水面。8月16日,北京商报记者探访发现,曾经摆满了奢侈品的寺库大厦如今已空空如也,仅剩5层还有部分工作人员,大厦内还专门设立了消费者...
日期:08-19
拟用500万美元购买加密货币 「博雅互动预计上半年纯利同比增超130%」
【】8月11日消息,博雅互动昨日晚间发布公布,集团截至2023年6月30日止六个月的收益预期会较去年同期增长约1%至5%左右。截至2022年6月30日止六个月收益约人民币1.865亿元。广达...
日期:09-17
机器人日益融入实体经济 多部门出台措施支持拓展应用空间(机器人发展相关举措有哪些)
我国智能音箱出货量达860万台以上岳洋合 制图三星手机优惠活动200w快充手机最新消息华硕博文pro13怎么样oled显示技术发展趋势   ◎记者 李雁争   最近一段时间,小米、腾...
日期:08-16
智邦国际:相守,是为了更好的成就
  还有7天,就到2020年,我们即将跨入一个崭新的21世纪20年代。近日,中共中央政治局召开会议,分析研究2020年经济工作。会议指出,2020年是全面建成小康社会和“十三五”规划收官...
日期:05-18