您的位置:首页 > 互联网

谷歌代理工具「谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏」

发布时间:2024-03-22 11:56:30  来源:互联网     背景:

声明:本文来自于微信公众号AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

谷歌DeepMind的研究人员推出了一种面向3D环境的通用AI代理——SIMA。

SIMA无需访问游戏的源代码,也不需要定制的API。只需要输入图像和用户提供的简单自然语言文本指令,SIMA就能像人类玩家一样执行走路、跑步、建造、打开地图等各种游戏中的操作。

为了测试、训练SIMA的性能,研究人员与8个游戏工作室合作,在《无人深空》、《模拟山羊3》、《Teardown》、《挖矿模拟器》等知名复杂3D游戏上进行了综合测试。

联想平板tab3-8plus测评

结果显示,用户只需要在游戏中提供简单的文本、图像提示,SIMA就能执行挖矿、开飞船、制作装备、打开外骨骼、搜集任务、爬楼梯等600多种基本操作,每个动作可以在大约10秒内完成。

技术报告:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.pdf

在游戏场景中测试AI代理是一个重要课题,与传统的沙盒2D方法不同的是,SIMA选择了操作、环境、视觉难度更高的3D游戏。

SIMA使用了大模型的训练方法,通过广泛的数据分布来识别那些复杂的动作,同时无需为每个新游戏设计特定的控制、观察模块,就能理解人类的文本指令,并将其转化为具体的行动。

多种大模型组成的“人体”

从SIMA的总体架构来看,由多种大模型组合而成像是在模仿人体。视觉感知模型充当“眼睛”、大语言模型充当“大脑”、建模规划模型充当“思维”、控制和执行模型充当“四肢”。

也就是说SIMA在接收到指令后,会用人的方式去思考、规划接收到的任务,然后再去执行。

视觉感知模型:视觉感知模块负责处理AI代理的图像观察,并提取关键信息以辅助语言指令的理解和环境的交互。该模块使用卷积神经网络(CNN)等深度学习技术对输入的图像数据进行处理和特征提取。

使得SIMA能够识别和分析图像中的物体、场景和空间位置等重要信息,以帮助AI代理更好地理解语言指令,并在虚拟世界中进行准确的交互和操作。

follows.

大语言模型:主要负责解析和理解输入的自然语言指令。使用了NLP、词嵌入、序列模型和注意力机制等技术,将语言指令转化为机器可理解的表示。

网络营销教育培训

使得AI代理能够准确地理解和解释指令中的动作和目标,为后续的建模和规划提供基础。

在线代理谷歌

建模规划模型:通过强化学习和规划算法,与环境的交互和反馈来学习最佳的行动策略。AI代理通过不断尝试和优化,逐渐掌握了在不同环境下执行任务的能力。

可根据语言指令、视觉感知信息和当前环境状态,生成有效的动作序列,以实现任务的完成。

控制和执行模型:主要负责将生成的动作序列转化为实际的动作控制指令,并映射到键盘、鼠标上,以驱动AI代理在3D游戏中执行任务,例如,移动、跳跃、奔跑、挖矿等,同时可根据环境的反馈进行自适应调整和优化。

数据收集和预处理

数据收集和预处理是SIMA的核心模块之一,主要获取、准备和处理用于训练和评估AI代理的数据。

研究人员从商业游戏等环境搜集了海量数据,搜集完成后对数据进行了清洗、转换和标准化数据操作,方便后续的训练和分析。

数据清洗:对原始数据进行去噪和异常值处理,可能会存在一些噪声或异常数据,例如,图像中的视觉干扰或语言指令中的错误字符。研究人员通过采用图像去噪和文本纠错的方式,来消除这些干扰因素。

数据转换:在进行训练之前,需要将原始数据转换为机器可处理的格式。图像数据,可以使用图像处理技术进行特征提取或缩放操作,以便于模型的训练和推理;

文本数据,可以进行词汇化、分词和编码等处理,将其转换为数值表示形式输入到深度学习模型中。

数据标准化:为了确保数据的一致性和可比性,需要对数据进行标准化处理。包括对图像进行归一化或标准化,以使其具有相似的亮度、对比度和颜色分布。对于文本数据,可以进行词干化、停用词移除和词向量化等操作。

经过一系列数据清洗、转换、标准化后,可以帮助SIMA更好地去学习游戏中的物体、动作、交互等,从而提升整体的动作指令准确率。

研究人员表示,未来,会持续迭代SIMA的通用代理能力,希望可以在实际生活中帮助用户做更多的事情。


返回网站首页

本文评论
宁德时代电池存在重大缺陷,被暂停向特斯拉供货?回应来了
凤凰网科技讯6月21日消息,市场传闻宁德时代电池存在重大缺陷,已被特斯拉暂停供货。从市场传出的消息来看,此事与特斯拉在美国享受的一则补贴有关。据了解,6月3日Tesla官网更新Mo...
日期:06-21
PS AI修图免费平替来了!Stability AI又放大招,核弹级更新一键扩图「ai修图软件教程视频」
新智元报道编辑:编辑部【新智元导读】Stability AI再放大招,Uncrop Clipdrop一键扩图+重构图片,Photoshop Generative Fill免费平替来了。此前,PS的重建图像功能就让人无比振奋,...
日期:06-11
100%自主指令集_国产龙芯CPU进驻国家重点工程_龙芯发布自主指令集
4月19日消息,据龙芯中科官方,在北京市国家科技传播中心的项目建设中,使用了基于完全自主指令集的国产龙芯CPU平台。据悉,本项目建设中,采用了基于龙芯3C5000服务器的运维BIM数字...
日期:10-02
福特与宁德时代合作在美建电池厂 投资35亿美元
2月14日消息,据外媒报道,当地时间周一,福特汽车公司官宣计划与宁德时代合作,投资35亿美元在密歇根州建立一家电动汽车电池厂。据了解,这将是福特此前曾宣布计划在北美和欧洲建造...
日期:02-15
2023院士增选官宣!15所985挂零,11所“双非”大学上榜_2021年院士增选第三轮
2023年11月22日,2023年中国科学院院士、中国工程院院士增选当选名单终于公布,爱科会易向新当选的院士致以崇高敬意。2023年中国科学院院士增选,共选举产生新的中国科学院院士59...
日期:11-24
还得是奢侈品!LV老板重夺全球首富 再次超越马斯克_lv老板再度登顶世界首富
快科技1月28日消息,据福布斯排行榜最新数据,世界最大的奢侈品公司LVMH董事长兼CEO阿尔诺再次超过特斯拉CEO埃隆马斯克,成为全球首富。奈飞做游戏截至目前,阿尔诺净资产为2076亿...
日期:01-28
荣耀新机入网:或许是X50 GT版本
每天分享科技热点!荣耀旗下最近一款型号为“CLK-AN00”的智能手机已经正式通过了国家质量认证,根据认证信息显示,这款手机是一款5G数字移动电话机,网友根据之前荣耀的产品线推测...
日期:08-01
同样都是4nm工艺,台积电为什么会比三星强那么多?
iphone 12 pro max 发布台积电和三星都是全球领先的芯片制造商,它们都采用了4nm工艺,但为什么台积电会比三星强那么多?让我们来深入了解一下!首先,我们需要了解什么是4nm工艺。4n...
日期:05-13
理想汽车AEB史诗级升级:135㎞/h也能用_理想汽车最新升级
快科技12月11日消息,最近理想汽车推送了OTA 5.0 beta4版本,被称为理想汽车史上最大的一次OTA升级。根据更新内容,OTA 5.0把AEB工作速度范围扩大到4-135㎞/h,同时提升了针对静止...
日期:12-12
让256G变264G后!用户晒小米澎湃OS体积:不到9GB 远超苹果和友商
快科技11月3日消息,小米澎湃OS已经推出,随着越来越多用户体验到,它的特性也开始慢慢显现,比如系统轻盈、流畅等等。现在,有网友了小米澎湃OS的系统体积,跟之前宣传的一样,确实非常...
日期:11-03
AI生成内容检测工具没啥用?容易存在误判「ai报告生成」
4月6日 消息:据《 华盛顿邮报》报道,美国有多达210万名教师正在使用 Turnitin 的一种新的人工智能检测工具,试图揪出哪些使用 ChatGPT 等工具在课堂上作弊的行为的学生。tiobe...
日期:04-06
iPhone 14再翻车!车祸检测屡次误报「苹果手机翻车怎么回事」
今年新发布的iPhone 14有一个亮眼功能是结合iOS 16系统增加的车祸监控的功能。此前的新闻中,有车主驾车撞树触发了车祸检测,iPhone 14也表现优秀,不过从新的消息来看,iPhone 14...
日期:10-11
华为在通信领域「遥遥领先!华为发布通信行业首个大模型:提供网络生产力」
快科技2月27日消息,2024世界移动通信大会(MWC 2024)日前在巴塞罗那举办。iphone 14pro取消卡槽大会期间,华为举行2024华为产品与解决方案发布会,面向全球重磅发布5G-A全系列产品...
日期:02-27
AI Photo Wizard官网体验入口 AI图像生成工具在线使用地址_ai platform
AI Photo Wizard是一款强大的图像处理工具,利用人工智能技术实现图像到图像的转换。它每日提供 3 张免费的AI图像,支持图像滤镜和背景移除功能。用户可以通过上传图片或输入提...
日期:01-31
为了应对西方利用互联网渗透 伊朗开发“内联网”操作系统_美国切断伊朗互联网
  中东北非借互联网掀起的反政府浪潮似乎对伊朗产生了触动,为了应对西方利用互联网对其进行渗透,伊朗已开发出新型的“内联网”(Internal network)系统,并准备在两年内将其推...
日期:07-28
海尔智家的产品怎么样「剧透!AWE海尔智家亮点满满,提前来看」
还有1天,全球瞩目的科技博览盛会——2024中国家电及消费电子博览会(AWE2024)就要开幕了。海尔智家早已做足准备,不仅有全球最 强高端品牌集中展示,还有最全面的场景方案、最领先...
日期:03-12
沃尔玛互联网转型_沃尔玛紧跟潮流:9月起向会员提供流媒体服务 试图挑战亚马逊
编辑/周子意   美国最大传统零售商沃尔玛公司周一(15日)与影视公司派拉蒙环球(Paramount Global)达成协议,向沃尔玛会员计划的订户提供Paramount+的流媒体服务。沃尔玛试图通过...
日期:08-17
做先行者,荣耀春季发布会含“AI”量超标_2021年5月荣耀新品发布会
通信世界网消息(CWW)3月18日,在荣耀春季旗舰新品发布会上,荣耀正式发布全新AI使能的全场景战略,推出平台级AI赋能、以人为中心的跨操作系统体验、基于意图识别的全新人机交互,以及...
日期:03-20
TWS Air2正式开售 价格仅199元性价比超高 iQOO
来源:中关村在线2023年9月25日,“超低游戏延迟 沉浸电竞声效”iQOO TWS Air2今日10:00点正式全渠道开售,新品价格仅为149元,9月25-27日首销期间更立减30元,到手价仅需119元,价格...
日期:09-25
两名前eBay高管因参与网络跟踪活动而被判入狱「ebay背景调查」
  讯 北京时间9月30日早间消息,两名前eBay高管在美国当地时间周四被判入狱,原因是两人参与了一项网络跟踪计划,该计划的跟踪对象是一对夫妇,这对夫妇运作的一个电子商务博客被...
日期:10-02