您的位置:首页 > 互联网

EMAGE:上传音频就能生成全身动作 包括头部、嘴型、身体运动

发布时间:2024-04-03 16:13:06  来源:互联网     背景:

划重点:

拼多多的裂变玩法

⭐️ 提出了 EMAGE 框架,用于从音频和掩码手势生成全身人类手势。

⭐️ 引入了新的全面共话数据集 BEATX,结合 MoShed SMPLX 身体与 FLAME 头部参数,提高了建模质量。

⭐️ EMAGE 利用掩码手势先验信息进行训练,采用 Masked Audio Gesture Transformer 实现音频到手势生成,取得了最先进的性能。

4月3日 消息:最近,多所知名大学和研究机构的研究人员共同提出了 EMAGE 框架,旨在从音频和掩码手势生成全身人类手势。

iphone 14 pro max运存参数

EMAGE技术能实现输入音频生成全身动作,包括头部、嘴型、身体、手部和整体运动,跟之前Meta的audio2photoreal很像。用户只要上传音频(小于60秒),然后点击提交,输出结果将在输出中呈现3分钟。

他们引入了新的全面共话数据集 BEATX,该数据集结合了 MoShed SMPLX 身体和 FLAME 头部参数,进一步提高了建模质量,特别是对头部、颈部和手指动作的建模。EMAGE 在训练过程中利用了掩码手势的先验信息,以提高推断性能。该框架包括一个 Masked Audio Gesture Transformer,有助于联合训练音频到手势生成和掩码手势重建,有效地编码音频和身体手势提示。从掩码手势中编码的身体提示随后分别用于生成面部和身体动作。

此外,EMAGE 自适应地合并了音频的节奏和内容的语音特征,并利用了四个组合 VQ-VAE 来增强结果的保真度和多样性。实验证明,EMAGE 具有最先进的性能,能够生成具有完整的、音频同步的整体手势。

EMAGE 技术的问世将在各个领域产生深远影响,其中包括但不限于教育、医疗、娱乐等领域。研究团队表示,他们的代码和数据集已经公开提供,供学术和工业界使用。

在线体验:https://huggingface.co/spaces/H-Liu1997/EMAGE

视频展示:https://www.youtube.com/watch?v=T0OYPvViFGE

iPhone12发布会ppt

十字绣装表多少钱


返回网站首页

本文评论
拼多多今日正式启动双11大促 部分商品满300减50、满200减30_拼多多双十一大促
10月20日 消息:拼多多于10月20日正式启动了今年的11.11大促活动。在这次活动中,拼多多为消费者提供了 “每满300减50、每满200减30” 的双档消费福利。荣耀flypods3有骨声纹...
日期:10-22
索尼被曝遭到攻击前曾解雇多名网络安全员工(2011年索尼黑客攻击)
(小贝)北京时间6月24日消息,据国外媒体报道,本周曝光的一份法庭文件显示,在遭受黑客攻击前两周,索尼曾解雇了多名负责网络安全的员工。这起集体诉讼的文件还指出,索尼在保护自己的...
日期:07-30
萝卜快跑自动驾驶「萝卜快跑订单量超200万-百度Apollo无人驾驶出行报告」
今日,百度Apollo发布了《2022百度自动驾驶出行服务年度报告》。数据显示,2013年启动自动驾驶领域布局至今,百度Apollo已积累超4600项自动驾驶专利族,高级别自动驾驶专利族数全球...
日期:10-02
金山云在港交所主板完成双重主要上市「金山云上市市值」
12月30日 消息:金山云宣布以介绍形式于香港交易所主板完成双重主要上市,不涉及新股融资。双重主要上市完成后,金山云成为同时在纳斯达克交易所、香港联合交易所上市的公司。香...
日期:12-30
网上车市冲刺港交所今起招股,老虎证券打新通道即将开启(老虎证券港股打新)
  12月31日,网上车市启动公开招股。知名美港股券商老虎证券即将开启网上车市的线上申购通道,支持散户打新。   公开资料显示,网上车市拟发行2.04亿股股份,其中公开发售2040...
日期:07-16
拼多多组织架构调整:增加联席CEO赵佳臻与陈磊搭档_拼多多主要领导层
凤凰网科技讯4月4日消息,拼多多集团发布公告,经董事会批准,联合创始人赵佳臻将出任执行董事和联席CEO,与陈磊搭档,共同管理公司业务。特斯拉订车后涨价对于这一任命,赵佳臻表示,“...
日期:04-04
苹果专卖店首度促销 iPhone 4缺席令果粉失望(为什么苹果官方旗舰店没有卖iphone 4的)
  苹果产品居然也打折。昨天,苹果线上线下同时推出限时一天的打折促销,有“果粉”一大早便到零售店门口等候。不过,部分“果粉”失望地表示,热门商品iPhone4并不在优惠行列中...
日期:07-25
本地LLM运行工具Ollama Windows 预览版推出_local本地
2月20日 消息:最近,本地LLM运行工具 Ollama 推出了 windows 版本。Ollama是一款开源的大型语言模型工具,专注于为用户提供本地化的运行环境,满足个性化的需求。该工具允许用户...
日期:02-20
第一个向机器人宣战的人类?「第一个向机器人宣战的人类是谁」
声明:本文来自微信公众号“三言财经”(ID:sycaijing),作者:DorAemon,授权转载发布。4月23日,徐州医科大学附属医院一女子怒砸智能导诊机器人引发关注。视频中,一身穿淡黄色羽绒服...
日期:04-25
VR游戏分岔点宣布完两轮共数千万元投资
讯 8月15日上午消息,上海分岔点网络科技有限公司宣布完成数千万元Pre-A轮融资。   本轮融资由红杉中国种子基金投资,资金将主要用于产品研发以及技术团队扩充。在此前半年,分...
日期:08-15
彭博:传苹果定于9月7日发布iPhone 14,或16日上架(苹果发布会9月16号)
ipad mini1停止销售8月18日消息,据知情人士透露,苹果公司计划在9月7日举行秋季新品发布会,推出最新款旗舰智能手机iPhone 14系列,这款产品销售额占苹果总营收的一半以上。新款iP...
日期:08-19
抖音电商最新处罚二手数码行业违规诱导站外交易商家141家「抖音违规售卖申诉」
2月9日 消息:抖音电商发布了关于“违规发布第三方信息及诱导站外交易”专项二手数码行业治理的处罚公示。自2022年12月以来共计处罚商家141家,其中扣除违规积分106家,停业整顿...
日期:02-10
国美零售涉足元宇宙:称之为为最重要战略(国美零售的产品战略)
近日,记者获悉,国美零售已将元宇宙定为最重要的战略方向,元宇宙项目总负责人已于 6 月入职,正积极招揽人才。一位知情人士对界面新闻记者表示,该元宇宙项目或将于 7 月初部分上线...
日期:08-11
WICC 2021倒计时 AI+网络音视频尖端技术成开发者关注焦点
  走进7月,由全球互联网通信云领先厂商融云主办的第三届全球互联网通信云大会(WICC 2021)也进入了倒计时。WICC一向以预见通信云领域的前沿科技,引领行业发展为己任。本届...
日期:03-25
网络动态(网络动态静态是什么意思)
  12月17日消息 据重庆日报报道,昨日,达瓦未来(重庆)影像科技有限公司发布了实时数字人场景。在真人说话、做动作时,数字人可同时具有一模一样的动作和面部表情。这也是我国...
日期:04-19
天玑900单核多核「LPDDR5T内存亮相 联发科天玑9300旗舰芯完成性能验证」
  新浪数码讯 8月10日晚间消息,据芯片制造商SK海力士官方消息,该公司已经与联发科技(MediaTek,以下简称“联发科”)下一代天玑旗舰移动平台完成LPDDR5T内存的性能验证,速度达到9...
日期:08-11
windows defender内存占用高_Microsoft Defender 在 Win10 中导致系统高内存占用率、黑屏等问题
  5 月 1 日消息,Microsoft Defender for Endpoint 似乎又惹祸了。Borncity 称其给 Windows 10 20H2 造成了一些问题。  以下是外媒发现的由 Defender for Endpoint 引...
日期:07-18
一场 AI 引发的开源革命迫在眉睫?Hugging Face 更改文本推理软件许可证,不再“开源”
声明:本文来自于微信公众号 InfoQ(ID:infoqchina),作者:褚杏娟、核子可乐,授权转载发布。Text-Generation-Inference(又称 TGI)是 Hugging Face 今年早些时候启动的一个项目,作为支...
日期:08-01
去年缴税2个亿!第一网红小杨哥:拒绝太多合理避税 傻子才会犯这错误
快科技12月18日消息,据国内媒体报道称,有着国内第一网红的小杨哥表示,自己应该交税的必须要交,拒绝太多合理避税。小杨哥谈到去年缴税2个亿时表示,我只知道这是我应该交的钱。太...
日期:12-20
刘伟光:用阿里云的客户越多,价格就会越便宜_刘伟光 阿里云
通信世界网消息(CWW)明确"AI驱动,公共云优先”战略3个月之后,阿里云吹响了进攻号角。2月29日,阿里云宣布史上最大力度降价,100多款产品、500多个产品规格的官网价格平均降低20%,最...
日期:02-29