您的位置:首页 > 互联网

《西部世界》真来了!斯坦福爆火「小镇」开源,25个AI智能体恋爱交友|附保姆级教程

发布时间:2023-08-10 17:12:11  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】斯坦福25个AI智能体「小镇」终于开源了,GitHub狂揽1.4k星,《西部世界》即将走进现实。

准备好,此前曾轰动整个AI社区的斯坦福智能体小镇,现在已经正式开源!

图片

项目地址:https://github.com/joonspk-research/generative_agents

在这个数字化的「西部世界」沙盒虚拟城镇中,有学校、医院、家庭。

控油去屑防脱发洗发水哪个好

25个AI智能体不仅能在这里上班、闲聊、social、交友,甚至还能谈恋爱,而且每个Agent都有自己的个性和背景故事。

不过,它们对于自己生活在模拟中,可是毫不知情。

图片

英伟达高级科学家Jim Fan评论道——

斯坦福智能体小镇是2023年最激动人心的AI Agent实验之一。我们常常讨论单个大语言模型的新兴能力,但是现在有了多个AI智能体,情况会更复杂、更引人入胜。

一群AI,可以演绎出整个文明的演化进程。

现在,首先受到影响的,或许就是游戏领域。

总之,前方有无限的新可能!

图片

网友:众游戏厂商们,你们懂我意思吧?

很多人相信,斯坦福的这篇论文,标志着AGI的开始。

图片

可以想象,各种RPG和模拟类游戏都会用上这种技术。

网友们也非常激动,脑洞大开。

有想看神奇宝贝的,有想看谋杀探案故事的,还有想看恋爱综艺的……

「我已经等不及看AI智能体之间的三角恋剧情了。」

图片

「《动物之森》中重复、沉闷的对话,所有村民共有的一维人格系统,都太令人失望了。任天堂赶快学学吧!」

图片

图片

「可以让《模拟人生》移植一下这个吗?」

图片

图片

如果能在《神界》这样的经典RPG游戏中,看到AI在NPC上运行,整个游戏体验都会被颠覆!」

图片

有人还畅想:这项技术在企业空间中也有很多应用场景,比如员工如何和不同的工作环境/流程变化互动。

图片

当然,也有人表示,你们激动个啥?其实我们一直都生活在这样的模拟中,只不过我们的世界有更多的算力罢了。

图片

是的,如果我们把这个虚拟世界放大到足够多倍,我们肯定能看到自己。

图片

Karpathy:AI智能体,就是下一个前沿

此前,前特斯拉总监、OpenAI大牛Karpathy就表示,如今AI智能体才是未来最前沿的方向。

OpenAI的团队最近5年把时间花在了别的地方,但现在Karpathy相信,「Agent代表着AI的一种未来。」

图片

如果某篇论文提出训练大语言模型的不同方法,OpenAI内部的Slack群组中就会有人说:「这个办法我两年半前尝试过,没什么用。」

然而每当有AI智能体从论文出现,所有同事都会很感兴趣。

图片

Karpathy曾将AutoGPT称为快速工程的下一个前沿

「西部世界」中的25个AI智能体

在美剧《西部世界》中,被预设了故事情节的机器人被投放到主题公园,像人类一样行事,然后被重置记忆,在新一天再被投放进自己所在的核心故事情节。

而在今年4月,斯坦福和谷歌的研究者竟然构建出了一个虚拟小镇,让25个AI智能体在其中生存、从事复杂行为,简直堪称是《西部世界》走进现实。

图片

论文地址:https://arxiv.org/pdf/2304.03442.pdf

架构

为了生成智能体,研究者提出了一种全新架构,它扩展了大语言模型,能够使用自然语言存储Agent的经历。

随着时间的推移,这些记忆会被合成为更高级别的反射,智能体可以动态检索它们,来规划自己的行为。

最终,用户可以使用自然语言和全镇的25个Agent都实现交互。

图片

如上,生成式智能体的架构实现了一个「检索」功能。

这一功能将智能体的当前情况作为输入,并返回记忆流的一个子集传递给语言模型。

而检索功能有多种可能的实现方式,具体取决于智能体在决定如何行动时考虑的重要因素。

生成式智能体架构面临一个核心挑战,就是如何管理大量必须保留的事件和记忆。

为了解决这个问题,架构的核心是记忆流(memory stream),即一个记录智能体全部经验的数据库。

智能体可以从记忆流中检索相关记忆,这有助于它规划行动,做出正确反应,并且每次行动都会反馈记录到记忆流中,以便递归地改进未来行动。

另外,研究还引入了第二种类型的记忆——反思(reflection)。反思是智能体根据最近经历生成的高级抽象思考。

图片

在这项研究中,反思是周期性触发的过程,只有当智能体判断最近一系列事件的重要性评分,累积超过设定阈值时,才会启动反思机制。

生成式智能体为了创建合理的规划,它们会自上而下递归生成更多的细节。

而这些规划最初只是粗略的描述了当日所要做的事情。

图片

在执行规划的过程中,生成智能体会持续感知周围环境,并将感知到的观察结果存储到记忆流中。

通过利用观察结果作为提示,让语言模型决定智能体下一步行动:继续执行当前规划,还是做出其他反应。

在实验评估中,研究人员对这一框架进行了控制评估,以及端到端的评估。

控制评估是为了了解智能体能否独立产生可信个体行为。而端到端评估,是为了了解智能体的涌现能力以及稳定性。

比如,Isabella策划一个情人节party邀请大家来。12个智能体中,7个人还在考虑中(3个人有了别的计划,还有4个人没有想法)。

这一环节与人类相处模式很相似。

图片

像真人一样交互

图片

在这个名为Smallville的沙盒世界小镇中,区域会被标记。根节点描述整个世界,子节点描述区域(房屋、咖啡馆、商店),叶节点描述对象(桌子、书架)。

智能体会记住一个子图,这个子图反映了他们所看到的世界的各个部分。

研究者编写了一段自然语言,来描述每个智能体的身份,包括它们的职业、与其他智能体的关系,作为种子记忆。

比如,智能体John Lin的种子记忆就是这样的——

John Lin是一名药店店主,十分乐于助人,一直在寻找使客户更容易获得药物的方法。

John Lin的妻子Mei Lin是大学教授,儿子Eddy Lin正在学习音乐理论,他们住在一起,John Lin非常爱他的家人。

John Lin认识隔壁的老夫妇Sam Moore和Jennifer Moore几年了,John Lin觉得Sam Moore是一个善良的人。

John Lin和他的邻居山本百合子很熟。John Lin知道他的邻居TamaraTaylor和Carmen Ortiz,但从未见过他们。

John Lin和Tom Moreno是药店同事,也是朋友,喜欢一起讨论地方政治等等。

以下就是John Lin度过的一天早晨:6点醒来,开始刷牙、洗澡、吃早餐,在出门工作前,他会见一见自己的妻子Mei和儿子Eddy。

图片

就这样,当模拟开始时,每个智能体都有属于自己的种子记忆。

这些智能体相互之间会发生社会行为。当他们注意到彼此时,可能会进行对话。

随着时间推移,这些智能体会形成新的关系,并且会记住自己与其他智能体的互动。

一个有趣的故事是,在模拟开始时,一个智能体的初始化设定是自己需要组织一个情人节派对。

随后发生的一系列事情,都可能存在失败点,智能体可能不会继续坚持这个意图,或者会忘记告诉他人,甚至可能忘了出现。

幸运的是,在模拟中,情人节派对真实地发生了,许多智能体聚在了一起发生了有趣的互动。

图片

保姆级教程

配置环境

在配置环境之前,首先需要生成一个包含OpenAI API密钥的utils.py文件,并下载必要的软件包。

步骤1. 生成 Utils 文件

在reverie/backend_server文件夹中(reverie.py所在的文件夹),新建一个utils.py文件,并将下面的内容复制粘贴到文件中:

#CopyandpasteyourOpenAIAPIKeyopenai_api_key="<YourOpenAIAPI>"#Putyournamekey_owner="<Name>"maze_assets_loc="../../environment/frontend_server/static_dirs/assets"env_matrix=f"{maze_assets_loc}/the_ville/matrix"env_visuals=f"{maze_assets_loc}/the_ville/visuals"fs_storage="../../environment/frontend_server/storage"fs_temp_storage="../../environment/frontend_server/temp_storage"collision_block_id="32125"#Verbosedebug=True

将 <Your OpenAI API> 替换为你的OpenAI API密钥,将 <name> 替换为你的姓名。

步骤2. 安装requirements.txt

安装requirements.txt文件中列出的所有内容(强烈建议先设置一个虚拟环境)。

目前,团队已在Python3.9.12上进行了测试。

运行模拟

要运行新的模拟,你需要同时启动两个服务器:环境服务器和智能体模拟服务器。

步骤1. 启动环境服务器

由于环境是作为Django项目实现的,因此需要启动Django服务器。

为此,首先在命令行中导航到environment/frontend_server(manage.py所在的位置)。然后运行以下命令:

pythonmanage.pyrunserver

然后,在你喜欢的浏览器中访问https://localhost:8000/。

如果看到「Your environment server is up and running」这个提示,意思就是服务器运行正常。确保环境服务器在运行模拟时持续运行,因此请保持这个命令行标签打开。

(注意:建议使用Chrome或Safari。Firefox可能会出现一些前端故障,但应该不会影响实际模拟。)

步骤2. 启动模拟服务器

打开另一个命令行窗口(你在步骤1中使用的仍在运行环境服务器,需要保持不动)。导航到reverie/backend_server并运行reverie.py来启动模拟服务器:

pythonreverie.py

此时,会出现一个命令行提示询问以下内容:「Enter the name of the forked simulation: 」。

举个例子,现在我们要启动一个包含Isabella Rodriguez、Maria Lopez和Klaus Mueller这3个智能体的模拟,那么就是输入以下内容:

base_the_ville_isabella_maria_klaus

然后,提示将会询问:「Enter the name of the new simulation: 」。

这时只需要随意输入一个名称来表示当前的模拟即可(例如「test-simulation」)。

test-simulation

保持模拟器服务器运行。此阶段,它会显示以下提示:「Enter option」

步骤3. 运行和保存模拟

在浏览器中访问https://localhost:8000/simulator_home,并保持标签打开。

现在你会看到小镇的地图,以及地图上活跃的智能体列表,并且可以使用键盘箭头在地图上移动。

要运行模拟,需要在提示「Enter option」的模拟服务器中输入以下命令:

run<step-count>

请注意,需要将上述的 <step-count> 替换为一个整数,表示要模拟的游戏步数。

例如,如果要模拟100步游戏,就输入run100。其中,一个游戏步骤表示游戏中的10秒。

现在,模拟就会开始运行,你可以在浏览器中看到智能体在地图上移动。

一旦运行完成,「Enter option」提示会再次出现。此时,你可以通过重新输入run命令并指定所需的游戏步数来继续模拟,或者输入exit退出但不保存,输入fin则是保存并退出。

下次运行模拟服务器时,只要提供模拟的名称就可以访问已保存的模拟。这样,你就可以从上次离开的位置重新启动模拟。

Step4. 重放模拟

只需运行环境服务器,并在浏览器中访问到以下地址,即可重放已运行的模拟:https://localhost:8000/replay/<simulation-name>/<starting-time-step>。

其中,需要将<simulation-name>替换为重放的模拟的名称,将<starting-time-step>替换开始重放的整数时间步。

Step5. 演示模拟

你可能会发现,重放中所有角色的Sprite看起来都是一样的。这是因为重放功能主要用于调试,并不优先考虑优化模拟文件夹的大小或视觉效果。

要正确演示带有角色Sprite的模拟,首先需要压缩模拟。为此,请使用文本编辑器打开位于reverie目录中的compress_sim_storage.py文件。然后,执行压缩函数,并将目标模拟的名称作为输入。这样,模拟文件就会被压缩,从而可以进行演示。

启动演示,请在浏览器中打开以下地址:https://localhost:8000/demo/<simulation-name>/<starting-time-step>/<simulation-speed>。

注意,<simulation-name>和<starting-time-step>与上述提到的含义相同。<simulation-speed>可用于控制演示速度,其中1表示最慢,5表示最快。

定制模拟

你有两种可选方式来自定义模拟。

方法1:编写并加载智能体历史

第一种是在模拟开始时初始化具有独特历史记录的智能体。

为此,你需要执行以下操作:1)使用其中一个基本模拟开始,2)编写和加载智能体历史记录。

步骤1. 启动基本模拟

存储库中包含两个基本模拟:base_the_ville_n25(25个智能体)和base_the_ville_isabella_maria_klaus(3个智能体)。可以按照上述步骤加载其中一个基本模拟。

步骤2. 加载历史文件

然后,在提示输入「Enter option」时,需要使用以下命令加载智能体历史记录:

call--loadhistorythe_ville/<history_file_name>.csv

其中,需要将<history_file_name>替换为现有历史文件的名称。

存储库中包含两个示例历史文件:agent_history_init_n25.csv(针对base_the_ville_n25)和agent_history_init_n3.csv(针对base_the_ville_isabella_maria_klaus)。这些文件包含了每个智能体的内存记录列表。

步骤3. 进一步的定制

要通过编写自己的历史文件来定制初始化,请将文件放在以下文件夹中:environment/frontend_server/static_dirs/assets/the_ville。

自定义的历史文件的列格式必须与附带的示例历史文件一致。因此,作者建议通过复制和粘贴存储库中已有的文件来开始该过程。

方法2:创建新的基本模拟

如果想要更深度地定制,就需要编写自己的基本模拟文件。

最直接的方法是复制和粘贴现有的基本模拟文件夹,然后根据自己的要求进行重命名和编辑。


返回网站首页

本文评论
AWE2019夏普看点:携多款小家电打造智趣新生活(夏普智能家居)
  一年一度的AWE再次如期在上海举行,来自国内外各大家电商上也都发纷纷展出了最新的家电产品,从黑电到各式各样的白电产品。作为在家电领域深耕多年的夏普也在AWE2019上带...
日期:12-26
FF:FF 91 Futurist准量产车正进行最后调试工作
1月25日 消息:今日,FaradayFuture宣布,FF91Futurist准量产车正进行最后的调试工作,重点聚焦中国市场的需求,尤其是充电系统适配工作和动力性能表现方面。此前,FF宣布,与中国黄冈市...
日期:01-25
14年前的网游大佬,如今忙着做区块链_深扒游戏圈
声明:本文来自于微信公众号游戏新知(ID:youxixinzhi),作者:安迪,授权转载发布。11月17日,暴雪娱乐官宣与合作长达14年的网易分手,欲另寻游戏运营商。消息一出,不少网友都在猜测国内...
日期:12-12
马斯克就推特案出庭作证的时间延迟至10月6日至7日「马斯克推特转发」
  讯 北京时间9月27日晚间消息,据报道,特斯拉CEO埃隆·马斯克就推特案出庭作证的时间延迟至10月6日至7日。Lenovo smart clock75英寸oled电视...
日期:09-28
《三体》动画定档12月3日,B站推出49部国创作品新内容「b站三体什么时候上映」
10月29日,哔哩哔哩(以下简称“B站”)举办了2022-2023国创动画作品发布会,重磅宣布《三体》动画定档12月3日,并将开启《三体》动画全球共创计划。同时,B站推出了49部国创作品新内容...
日期:11-05
部分省今日高考结束「多地高考今日结束!直击场外:家长手捧鲜花等待」
6月8日消息,今天是高考第二天,陕西、安徽等部分省份的考生,8日下午完成外语科目的考试后,结束全部高考科目的考试。在高考结束后,部分家长手捧鲜花在考场外等待,考生飞奔出考场与...
日期:06-09
月球号运载火箭「美国阿耳忒弥斯 1 号登月火箭再次改期发射」
IT之家 9 月 3 日消息,当地时间 9 月 3 日,美国国家航空航天局(NASA)五天来第二次暂停了正在进行的倒计时,并推迟了发射阿耳忒弥斯 1 号登月火箭的计划。快手上说车的可信吗苏宁...
日期:09-27
锐捷网络“五位一体”创新方案夯实数字政府底座「锐捷网络系统」
5 月 25 日, 2023 中国国际大数据产业博览会的数字政府论坛在贵阳成功举办,论坛聚焦政府数字化发展新变化、产品技术需求新特点、政府履职能力新要求,为政府数字化转型建设提供...
日期:07-07
丫丫开飞机「丫丫回国航线图上飞机图标变熊猫 网友纷纷翘首以盼」
据报道,旅居美国20年的中国大熊猫“丫丫”于4月26日上午从田纳西州孟菲斯动物园启程回国。iPhone13发布后12会降价多少她乘坐的国际货运公司专机已于当地时间26日11点59分从...
日期:04-27
谷歌推出商业版Google App Engine(谷歌市场版)
  据知名科技博客TechCrunch报道,谷歌今日在Google I/O大会上宣布,云网络应用平台Google App Engine将增加一个商业版本,以满足商业用户的需求。   据谷歌介绍,商业用户将...
日期:07-29
飞猪回应四川地震:因震情导致行程变化的酒店订单可申请免费退改
  记者 | 王小伟会议平板maxhub怎么样华为畅享电池5000毫安的是什么款  证券时报e公司讯,5日,飞猪内部人士回应,针对四川泸定地震所造成的出行订单影响,飞猪已联合当地酒店...
日期:09-07
光粒科技亮相AWE 2023展会,Holoswim2智能泳镜沉浸式领航_光粒教育怎么样
2023年4月27日,中国家电及消费电子博览会(简称AWE),在上海新国际博览中心如期开幕。本次AWE以“智科技、创未来”为主题,汇聚众多全球顶 尖科技企业,面向全球用户展示智慧生活家居...
日期:05-01
携程和腾讯出行达成合作 700个城市上线租车服务「携程网用车 合作」
凤凰网科技讯 9月28日消息,近日,携程租车和腾讯出行服务正式达成合作,携程租车正式入驻腾讯出行服务,为腾讯出行服务的用户提供一站式在线预订国内租车服务。“腾讯出行服务主打...
日期:09-30
新社交逻辑,COCO DAILY可可熟成红茶给门店加Tiffany Blue_coco和coco日记
  提起Tiffany,你第一反应会想到啥?   是满眼的Tiffany Blue?   还是闪瞎眼的求婚钻戒?   ......   我想Tiffany Blue主题的奶茶店,你应该也有想过?   但见过吗?...
日期:07-07
云集第二季度营收2.84亿元 净亏损1710万元「云集盈利了吗」
查看最新行情   讯 北京时间8月25日晚间消息,社交电商平台云集(Nasdaq:YJ)今日发布了截至6月30日的2022年第二季度财报。财报显示,云集第...
日期:09-07
蔚来发布2月限时优惠购车方案:部分长库龄展车最高降2.4万「蔚来车主推荐优惠」
2月3日 消息:蔚来官方社区发布2023年2月限时优惠购车方案,包括国家补贴兜底优惠、长库龄展车优惠、置换优惠等。方案显示,2023年2月内锁单购买2022款ES8、ES6、EC6的用户,蔚来...
日期:02-03
阿里体育正式更名橙狮体育
讯 8月8日午间消息,天眼查App显示,近日,阿里体育有限公司发生工商变更,企业名称正式变更为橙狮体育(上海)有限公司。该公司成立于2015年9月,法定代表人穆旸。公司经营范围含演出经...
日期:08-09
联发科2020年财报解读:5G芯片和多元业务助推营收创新高_联发科技2020营业额
  近日,全球知名IC芯片厂商联发科公布了2020年年度财报。数据显示,联发科全年营收达到了3221.46亿新台币(约740亿人民币),同比年增30.8%,创下史上最高纪录。 联发科2020年财...
日期:12-24
马克龙喊话欧洲觉醒 英国也不甘电动车落伍:将开发首个锂矿
以电动车为代表的新能源已经成为各国竞争的焦点,前不久的法国巴黎车展上,法国总统马克龙还喊话欧洲要觉醒,不能错过能源革命,现在英国也行动起来了,开建国内首个大型精炼锂矿工厂...
日期:11-11
请尽快升级,苹果 iPhone / iPad 被曝漏洞:可获取内核读写权限_内核id验证
IT之家 5 月 23 日消息,Jamf 威胁实验室近日发布博文,分享存在于 iPhone 上的 ColdInvite 漏洞,允许攻击者利用 iOS 系统中的已知 ColdIntro 漏洞。安全研究人员 08tc3wbb 在分...
日期:05-23