您的位置:首页 > 互联网

细粒度图像生成「细粒度文字转动画技术MoMask 文本驱动的3D人体运动生成模型」

发布时间:2023-12-06 17:52:31  来源:互联网     背景:

要点:

  • MoMask是一个文本驱动的3D人体动作生成模型,采用层级量化方案表示动作,包括基础层的运动标记和逐层存储的残差标记。

  • 模型包括Masked Transformer和Residual Transformer,用于在训练阶段通过文本输入预测基础层的随机掩码动作标记,并在生成阶段填充缺失标记,并逐渐预测更高层次的标记。

  • MoMask在文本到运动生成任务中表现优越,例如在HumanML3D数据集上,其FID为0.045,明显优于T2M-GPT的0.141。此外,MoMask还能无缝应用于相关任务,如文本引导的时间修复。

佳明领跑者手表

美团推广预算

12月6日 消息:MoMask是一个创新的3D人体运动生成模型,其核心思想是通过层级量化方案表示人体动作,包括基础层和逐层的残差标记。在模型结构上,引入了Masked Transformer和Residual Transformer,分别用于预测基础层的掩码动作标记和逐渐预测更高层次的标记。这一框架使得MoMask在文本到运动生成任务中表现卓越。

细粒度图像生成

MoMask的应用不仅局限于文本到运动生成,还展示了在文本引导的时间修复任务中的出色表现。通过展示中,模型成功地完成了对动作片段中特定区域的修复,根据文本描述 inpaint 了中间、后缀和前缀区域,呈现出令人满意的合成效果。

项目地址:https://github.com/EricGuo5513/momask-codes

在实验结果分析中,MoMask通过对残差量化层的变化进行研究,展示了其对运动标记的高保真重建能力。生成方面的比较进一步证明了残差标记的重要性,MoMask在不同组合的标记下能够更准确地执行微妙的动作,相较于其他基线模型表现更为出色。

论文通过对比MoMask与其他三种强基线方法,包括扩散模型和自回归模型,证明了MoMask在捕捉语言概念和生成更真实动作方面的优越性。这使得MoMask成为文本驱动的3D人体运动生成领域的先进模型。

MoMask通过引入层级量化和Transformer结构,在文本驱动的3D人体运动生成任务中取得了显著的性能提升,同时在相关任务上也展现了出色的通用性。其在重建、生成和比较方面的实验证明了其在3D人体动作建模领域的卓越性能。

尺有所短的意思和造句

郑州什么时候能穿裙子


返回网站首页

本文评论
孩子中英文启蒙工具首选阿尔法蛋词典笔
  随着科技进步以及人们对生活品质的追求,越来越多的人意识到高科技对人们生活的重要性。教育也是如此,家长忙没时间辅导孩子,怎么办呢?许多家长便会为孩子选择一款学习...
日期:07-16
压力给到x86处理器!苹果高通后 联发科入场:造自研ARM PC芯片
在移动芯片市场,联发科已经保持了8个季度的第一,他们的满足感并不止于此。在日前举办的一场峰会上,联发科副总表示,PC是规模400亿美元的巨大市场,联发科计划涉足高功耗市场,将不少...
日期:11-16
苹果宣布推出iPhone 15系列手机_苹果iphone15什么时候上市
财联社9月13日电,苹果宣布推出iPhone 15系列手机。富途证券 esop系统互联网加线上线下...
日期:09-13
中华网母公司申请破产保护的“对赌协议”曝光
     CDC集团结构图   据媒体10月6日报道,因之前法院裁定该公司在针对一对冲基金投资者的诉讼案中败诉并负担巨额赔偿,号称“中国互联网第一股”的中华网母公司CDC集团...
日期:07-23
科大讯飞刘庆峰两会提案:设立非营利性民办高水平特色高校和专业
  5月22日,第十三届全国人民代表大会第三次会议开幕。作为来自人工智能产业一线的人大代表,科大讯飞刘庆峰建议加快推进人工智能在多领域的基础设施建设。其中,刘庆峰提出建...
日期:07-14
元宇宙招聘「元宇宙相关岗位平均月薪1.85万元 最高能拿4万」
  来源:快科技  元宇宙作为第三代互联网形态,其时空拓展、高度沉浸、感官延伸、人机融生等特点,让人心生向往。目前各大企业也纷纷布局元宇宙。  9月26日,智联招聘发布《2...
日期:09-29
天虹4700万会员的元宇宙生日派对,给新零售带来什么?
零售的本质正在从做生意变成做“社交关系”。通过私域数字化能力,让企业在面对顾客时有了从 1 对多升级为1v1 的精细化运营能力。但这种“工具”性的能力,并不能和最终的目标(...
日期:10-27
近300亿美元税款补缴!美国财政部税务大棒砸向微软_美国2500亿征税何时实施
周三美股盘后消息显示,微软收到美国国税局(IRS)通知,被要求支付额外289亿美元税金,另加罚款和利息。IRS表示,微软需要补缴在2004-2013年间产生的上述税费,相关税费与微软在全球子公...
日期:10-13
大年初一上映,国产动画《新神榜:哪吒重生》重磅预告(新神榜:哪吒重生上映时间)
  2021年春节多部大片提前定档,各大影片陆续拉开了“路演”帷幕,国潮动画《新神榜:哪吒重生》率先打了头阵......   在此前的预告活动中,极具冲击力的影片片段已赢得观众...
日期:07-16
open twitter「传OpenAI每年花200万美元就能访问推特数据 马斯克嫌贱卖」
4月29日消息,自去年年底以来,埃隆·马斯克(Elon Musk)一方面在警告人工智能的危险性,另一方面却大力推进人工智能技术的研发,计划与自己曾帮助创建的OpenAI展开竞争。去年12月,马斯...
日期:04-29
苹果iPhone成日本手机绝对主流:工作10天就能买iPhone 14 Pro「在日本苹果手机多少钱一台」
市场研究公司IDC最近发布的数据报告显示,苹果iPhone在日本手机市场占据主导地位,市场份额高达53.8%。这一份额在智能手机市场中也达到了55%。报告指出,2023年第一季度,日本手机...
日期:06-25
OPPO Reno9 Pro+发布:骁龙8+配双芯人像摄影系统 售3999元起_OPPOr9相机
凤凰网科技讯(作者/莫环顺)11月24日消息,OPPO于今日举行发布会,发布手机OPPO Reno9系列,Reno9 Pro+搭载第一代骁龙8+移动平台的同时,支持双芯人像摄影系统,售价3999元起。双十一极...
日期:11-25
华为碎屏险60天内购买「被“碎屏险”捆绑的华为Mate 60」
“这家华为授权体验店跟我说要绑两年‘碎屏险’,不绑不给买。”“不加‘碎屏险’的钱,买不到或不让买,授权店6999元还不够赚吗?”……近日,华为Mate 60系列一经发售便引发抢购热...
日期:09-11
人脸识别解锁车辆?国产新专利公布_人脸解锁汽车
凤凰网科技讯11月4日消息,天眼查App显示,百度在线网络技术(北京)有限公司申请的“用于控制车辆的方法和装置”专利获授权。该实施方式可以通过人脸识别技术来解锁车辆,不需要用户...
日期:11-10
动视收购暴雪多少股份「微软计划下周完成与动视暴雪的687亿美元收购交易」
据The Verge报道,微软计划下周完成以687亿美元收购动视暴雪的提议。一位熟悉微软计划的消息人士告诉The Verge,该公司预计10月13日星期五为截止日期,届时微软将向全世界宣布,为...
日期:10-09
金蝶友商网:在百度开放平台上寻找客户_金蝶友商软件
  如果你经常使用快递邮寄物品的话,对快件位置的跟踪和物品何时到达,可能是一个令人头疼的问题。去年10月份,在百度搜索平台上,只要输入”快递查询”的关键词,就能在结果页里...
日期:07-27
AI哨所|研究成果被ChatGPT利用 谷歌将限制AI论文发表「ai前哨站」
凤凰网科技讯 《AI哨所》北京时间5月4日消息,长期以来,谷歌公司一直被视为顶尖人工智能(AI)研究中心,但是这一声誉正在发生变化。知情人士称,谷歌已告诉员工,它将减少可发表的研究...
日期:05-04
首播破亿,口碑两极,《三体》能否帮B站走出“暗黑森林”?_三体黑暗森林 豆瓣
声明:本文来自于微信公众号雪豹财经社(ID:xxxxx),作者:青 城,授权转载发布。《三体》动画版遭遇最严格质检改编《三体》是一次艰难跋涉,但漫长的等待和巨大的期望,让这些作品不得...
日期:12-13
苹果计划将至少20%的iPhone生产转移到印度_苹果加工转移到印度
谷歌WaymoCEO离职华为mate 50 pro 最新消息(全球企业动态)苹果公司看好印度销售和生产市场,计划将至少20%的iPhone生产转移到印度,并且正大力投资在印度生产新款iPhone15。苹果...
日期:08-07
淘宝买能微信支付吗「世纪大和解:淘宝能从微信买流量了」
声明:本文来自微信公众号“锌财经”(ID:xincaijing),作者:陈妍,编辑:大风,,授权转载发布。今年双十一到来前,阿里和腾讯先给了外界一个惊喜。近日,阿里妈妈和腾讯广告官宣合作,将实现...
日期:09-27