您的位置:首页 > 互联网

单张A100,50亿步训练,英伟达开源最强虚拟角色定制模型,超逼真动作零样本生成,游戏动画行业要变天

发布时间:2023-08-14 16:19:47  来源:互联网     背景:

声明:本文来自微信公众号“新智元”(ID:AI_era),作者:新智元,编辑:好困 润,授权转载发布。

近日,英伟达正式开源了超强虚拟角色定制模型CALM。基于此,开发者可以利用AI,零样本生成复杂逼真的动作,简单而自由地控制角色。

8月8日深夜,英伟达CEO黄仁勋,再次登上了世界顶级计算机图形学会议SIGGRAPH的舞台,用一系列重磅更新展示了在AI和元宇宙方向上的野心。

而就在最近,被SIGGRAPH2023收录的CALM模型的正式开源,也让游戏和动画开发直接飙上了AI加持的快车道。

CALM可以自学「人类的动作」,无需额外训练就能自由合成和控制虚拟角色的动作,效果逼真自然。

传祺影豹对比本田思域

也许很快整个游戏、动画工业的格局就要彻底改变,而VR场景中的人物和角色也将从此不再生硬,元宇宙可能真的要加速到来了!

AI控制角色蹲行靠近目标,当距离足够近时踢腿,最后举起双臂庆祝

具体来说,英伟达联合以色列理工学院、巴伊兰大学和西蒙菲莎大学,共同提出了一种全新的条件对抗潜模型(Conditional Adversarial Latent Models,CALM)。

通过模仿学习,CALM学习到了一种可以捕捉人类动作复杂性和多样性的动作表征,并能直接控制角色的动作。

该方法可以联合学习控制策略和动作编码器,对给定动作的关键特征进行重建,而不仅仅是复制。

结果表明,CALM可以通过学习语义动作表征,对生成的动作进行控制,并且为更高层的任务训练提供风格调整。

训练完成后,用户就可以利用像电脑游戏一样的界面,非常直观地对角色进行控制了。

论文地址:https://arxiv.org/abs/2305.02195

项目地址:https://github.com/NVlabs/CALM

实现方法

CALM以对抗性技能嵌入为基础,并借鉴了其代码。

苹果重新定义芯片

研究人员利用单张A100GPU,通过在4096个IsaacGym环境上进行并行训练,共计50亿步。

项目地址:https://xbpeng.github.io/projects/ASE/index.html

为了实现零样本任务解决方案,CALM由3个阶段组成:

(1)动作编码器和底层策略(解码器)联合训练,将动作捕捉序列映射为控制模拟角色的动作。

(二)使用潜空间调节训练高层策略,从而实现对执行动作方向的控制,同时保留所需的风格。

(三)将步骤1和2结合起来,使用简单的有限状态机来解决任务,无需进一步训练,也无需精心设计奖励/终止条件。

阶段1:底层训练

在底层训练阶段,CALM学习了一个编码器和一个解码器。

编码器接收来自动作参考数据集的动作,即关节位置的时间序列,并将其映射到低维潜表征(low-dimensional latent representation)。

解码器是一个底层策略,通过与模拟器进行交互,来生成类似于参考数据集的动作。

2019年1-7月份,全国规模以上工业企业实现利润总额

这个策略能够按需产生各种行为,但不受动作方向性的影响。例如,它可以被指示走路,但无法本能的地控制行走的方向。

为了评估学习到的动作表征能力,研究人员测试了在潜空间中在动作之间进行插值的能力。

在这里,初始的潜表征是「冲刺」,最终的潜表征是「蹲下不动」。

在整个过程中,潜表征会随着时间进行线性插值,而角色则会通过语义上有意义的转换来平稳过渡,逐渐减慢速度并倾斜上半身。

阶段2:方向控制

为了控制动作方向,研究人员训练了一个高层任务驱动策略来选择潜变量。

其中,这些潜变量被提供给底层策略,并让后者生成所需的动作。

为了实现这一点,研究人员首先通过动作编码器来获取动作潜表征。

然后,根据高层策略所选的潜变量与代表所需风格的潜变量之间的余弦距离成比例,给它一个额外的奖励,从而引导高层策略采用所期望的行为风格。

而训练好的方向控制器,就可以控制角色所执行的动作形式和方向了。

比如下面的「蹲下行走」、「举盾行走」和「奔跑」。

蹲行

举盾

奔跑

阶段3:推理

最后,把之前训练过的模型结合起来(底层策略和方向控制器),以在没有额外训练的情况下组合出复杂的动作。

为此,用户创建一个包含标准规则和指令的有限状态机(finite-state machine,FSM)。

这些规则和指令确定要执行哪种动作,类似于用户控制游戏角色的方式。

例如,它们决定角色是否应该执行简单的动作,直接使用底层策略进行执行,或者是否需要高层控制来进行定向动作。

比如,FSM可以构建如下的动作流程:

(1)转身,

(二)向着目标蹲行,直到距离<1m,

(三)庆祝。

以下是更多的效果展示:

测试结果

可控动作生成

研究人员首先分析了CALM的三个方面:(1)编码器质量,(2)底层控制器的多样性,以及(3)组合系统的可控性。

编码器质量

使用之前研究中的类别分离性(separability)测试,研究人员在编码器学习的表示上衡量了潜空间内动作类别之间的分离性,将动作类别定义为单个动作文件(motion file)中的子动作。

如上表所示,CALM将动作编码为具有更好分离性的表征。

多样性

华为小米ov产品

研究人员使用参考数据集训练了一个分类器,将动作序列映射到原始动作索引(originating motion index)。

当从随机采样的潜变量


返回网站首页

本文评论
小米civi值得买「小米Civi 3顶配首销 2000多买1TB」
明天小米Civi 3 16GB 1TB版本将正式上市,价格为2999元。这款手机是第一款不到3000元的1TB存储手机。元宇宙虚拟主播红米note10pro支持33w快充吗Civi 3主打自拍功能,采用了前...
日期:06-13
分析师预计Verizon版iPhone价格达250美元(iphone verizon)
  1月11日消息,据国外媒体报道,美国投资银行Gleacher分析师布赖恩·马歇尔(Brian Marshall)表示,Verizon Wireless对CDMA版iPhone的定价可能达250美元,高于AT&T和苹果GSM版iP...
日期:07-25
茄子互联网有限公司_茄子科技(SHAREit Group):以科技实力锚定商业价值高地
  在移动互联网产品中,拥有超10亿用户量级代表了其“爆款”的身份,同样在技术支持上也是一个门槛,对数据处理与稳定性上有更加复杂的考验。作为出海领军企业,茄子科技(海外SH...
日期:10-03
魅族18pro安兔兔「安兔兔6月安卓手机好评榜:魅族20 Pro蝉联冠军」
快科技7月7日消息,安兔兔公布了6月安卓手机好评榜:魅族20 Pro蝉联冠军,小米12S Ultra、三星Galaxy S23 Ultra分列二三名。该数据来源安兔兔评测,收集时间2023年6月1日至6月30日,...
日期:07-07
十年果粉首次换安卓手机是什么体验?网友们吵翻了_用了很久苹果换安卓
十年果粉首次换安卓手机是什么体验?网友们吵翻了  【手机中国新闻】苹果手机和安卓手机哪个好的话题在互联网上一直是网友争论的焦点。据手机中国了解,近日一则#十年果粉首...
日期:07-19
云天励飞与电信等企业成立“5G+8K+AI+云”联合实验室,推动“5G+千行百业”应用
  5月8日,由市政府指导,市工信局和深圳电信共同建立的深圳5G产业创新生态运营中心正式揭牌成立。   去年11月,深圳市委常全会提出,深入实施“5G+8K+AI+云”新引擎战略。运...
日期:02-28
网红点心店虎头局回应倒闭 线上所有店铺均正常运营「虎头局糕点」
近日,有网友在社交平台上散布关于虎头局的一些不真实言论,对品牌的粉丝和运营造成了严重的负面影响和误解。为了澄清事实,虎头局渣打饼行通过网络旗舰店发布声明,表示虎头局线上...
日期:04-03
AI带货,卷不死真人主播
声明:本文来自微信公众号“刺猬公社”(ID:ciweigongshe),作者:陈首丞,编辑:园长‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍,,授权转载发布。“这个...
日期:07-05
开发者提Rust 2020 年发展愿景:支持 GUI 编程和关注社区建设_rust开发环境
  Rust 核心开发团队上个月在博客面向 Rust 社区发布了一则征文公告,希望收集大家对 Rust 在 2020 年如何发展的想法或建议,并表示团队成员会阅读所有文章,然后据此输出一份...
日期:05-27
全球发布稳了!小米13 Ultra通过新加坡IMDA认证_小米新加坡私人有限公司 是真的吗
小米公司最新合作的徕卡超大杯旗舰——小米13 Ultra,已正式通过新加坡IMDA认证,这也是小米的首款全球上市的徕卡超大杯旗舰。目前,小米13 Ultra型号已经被列入新加坡IMDA认证网...
日期:04-11
人工智能实验解码大脑扫描,揭示出人们在想什么「扫描大脑 机器」
科学家于本周一表示,他们已经找到了一种方法,利用大脑扫描和人工智能建模来记录人们思考的“要点”,这被称为是向读心术迈出的一步。上图:研究人员准备在功能磁共振扫描仪中收集...
日期:05-02
熊猫墅别墅「堪比别墅!中东地区第一家大熊猫馆建立:两只大熊猫即将入住」
作为国宝,大熊猫的地位可以说羡煞一众动物,当然,也让不少人羡慕不已。红米6A百度百科俄罗斯智能手机市场份额钉钉在线课堂怎么看回放学生据央视财经报道,10月18日,大熊猫四海”京...
日期:10-21
苹果代工中毒员工诉求基本被拒绝 称将集体辞职(苹果为什么要代工)
  前天晚间,苹果代工厂联建科技投资方胜华科技正式回应正己烷中毒员工所提诉求,但回复内容激怒了受害员工。昨天,受害员工代表向记者表示,员工对企业态度仍然不满,因为看不到...
日期:07-26
努比亚Z50S Pro正式发布:35mm高定光学 真旗舰1TB普及风暴「努比亚505j参数」
通信世界网消息(CWW)7月20日,努比亚Z50S Pro正式发布。新机采用全新一代35mm定制镜头模组,重磅升级带来更大光圈和全新传感器,影像体验革命性跃升;搭载全球首批骁龙8 Gen2领先版,1....
日期:07-20
支付宝创新力持续上升,入列浙江创造力百强第二_支付宝创新案例
5月29日 消息:近日,浙江省知识产权协会公布2022年浙江省创造力百强企业榜单,支付宝(杭州)信息技术有限公司上榜,且随着创新力持续上升,排名较上一年前进2个位置升至第二。魅族18陶...
日期:05-29
最高20618元!京东618早10点速抢5元 大红包_京东618红包活动时间
京东618无门槛红现已正式开抢,5月29日19:00~今日抢到的红包,将在今晚24点失效,别忘了领取和使用。活动期间用户每日通过页面可随机抽取(每日可中奖3次,加码期间可获得额外的抽奖...
日期:06-05
腾讯认证主播计划新突破:助力主播“量”与“质”全方位提升(腾讯认证主播什么意思)
  近日,腾讯联合各直播平台,启动了认证主播计划第二期的相关合作。随着认证主播计划第一期合作的圆满完成,认证主播们也获得了与腾讯四大资源(曝光资源、产品资源、活动资源...
日期:01-09
一首我是云南小姑娘原唱「唱我是云南的走红小伙账号被封禁 因其醉酒后发布不雅视频」
云南小伙蔡金发因为他的土味魔性说唱视频《我是云南的》而走红,但他最近的行为让他的知名度大受影响。据报道,他在某平台上发布了一段涉黄不雅视频,导致他的账号被封禁。知情人...
日期:07-26
员工因漏打卡11次被辞 法院判公司赔偿3.8万元「公司以漏打卡为由扣工资」
12月22日 消息:上班打卡问题,每个职工都会遇到。如果一个人实际出勤,却因为忘记打卡而被公司以此为由解雇,你觉得这是否公平?ipad受欢迎的原因据报道,2019年6月18日,王先生被一家...
日期:12-22
2021飞猪618「飞猪:618订单量同比增160%,近8成商家成交额增速达50%以上」
6月21日消息,6月20日24时,飞猪618正式结束。飞猪数据显示,今年618大促订单量同比去年增长160%,交易用户同比去年翻倍增长。同时,大促已售商品的预约核销也大幅提前和提升。“今年...
日期:06-21