您的位置:首页 > 互联网

EMO同款?谷歌推对口型视频工具VLOGGER 还具备视频编辑功能

发布时间:2024-03-14 23:11:42  来源:互联网     背景:

3月14日 消息:科技巨头们正在竞相开发能够从单张照片生成会说话的人类视频的技术。继阿里巴巴推出其EMO项目后,Google也推出了类似的项目VLOGGER。这项技术基于文本和驱动音频,能够从单张照片生成会说话的人类视频。

打败三体的科幻作品

项目地址:https://top.aibase.com/tool/vlogger

论文地址:https://arxiv.org/pdf/2403.08764.pdf

VLOGGER的独特之处在于:

  • 不需要针对每个人进行训练。这意味着无需为每个个体创建专门的模型,大大降低了数据需求。

  • 不依赖于面部检测和修剪。这使得VLOGGER能够在没有清晰的面部轮廓或面部特征的情况下工作。

  • 生成完整的图像(而不仅仅是面部或嘴唇)。这为生成更自然、更真实的视频提供了可能。

  • 考虑了一系列广泛的场景(例如,可见的躯干或多样化的身份特征),这对于正确合成交流的人类至关重要。

  • 然而,尽管VLOGGER在技术上有其独特之处,但根据演示视频来看,其效果似乎不如阿里巴巴的EMO好。这可能是由于EMO在面部表情和动作的合成上更为精细。

俄罗斯天然气取暖政策

除了生成新的视频,VLOGGER还具有编辑现有视频的能力。例如,它可以改变主题的表情,或者调整嘴巴和眼睛的闭合状态,从而改变视频的情绪和信息传递。

在视频翻译方面,VLOGGER也可以取一个特定语言的现有视频,并编辑唇部和面部区域以适应新的音频。例如,可以将一段英语视频的唇部和面部区域编辑,使其看起来像是在说西班牙语。

总的来说,VLOGGER是Google在人工智能领域的又一重要突破,它展示了从单张照片生成会说话的人类视频的可能性,同时也提供了视频编辑和翻译的新工具。然而,与阿里巴巴的EMO相比,VLOGGER在视频生成的效果上还有待提升。


返回网站首页

本文评论
谷歌关闭十项边缘业务 雇员将内部转岗
  创始人拉里·佩奇(Larry Page)正卖力地帮谷歌瘦身。上周五,谷歌宣布关闭旗下10项边缘业务,覆盖社交搜索、桌面软件和网页安全等多个领域。   这被谷歌高级副总裁阿兰·...
日期:07-22
英特尔至强5672「英特尔第五代至强可扩展处理器发布,在CPU上跑AI更香了」
声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:金磊 丰色 ,授权转载发布。千呼万唤始出来,第五代英特尔®至强®可扩展处理器,它来了!若是用一句话来概括它的特点,那就是——...
日期:12-20
Q2 拉丁美洲个人电脑出货量同比下降 6%:联想、惠普、戴尔、宏碁、华硕前五
  IT之家 9 月 26 日消息,今日,Canalys 发布报告称,2022 年第二季度,拉丁美洲台式机、笔记本和工作站的出货量同比下降 6% 至 500 万台。淘宝给残疾人提供的赚钱方法  报告...
日期:09-26
专家:沙尘天气里最好别戴隐形眼镜
3月22日消息,据气象台报道,受冷空气影响,中国北方大部地区遭遇较强沙尘暴天气侵袭。从21日开始,大范围的沙尘天气覆盖中国西北、华北等地,22日,沙尘随着冷空气进一步推进,22日6时,中...
日期:03-24
百度浏览器启动公司级内测 不久将对外发布
  昨天,百度客户端领域的重要产品百度浏览器Beta1.0内测版的界面截图在网上流传,记者向百度内部人士证实,百度浏览器确实已经进入公司级内测阶段,不久将正式对外发布。   ...
日期:07-26
6千块买到就是赚?华为P50新版曝光:搭载778G、月底杀到_真的要来了!华为P50售价疑似曝光,网友:我能买的起吗?
P50的新版大家有多期待呢,如果华为经过调整,售价在万元以下,是不是会热卖?有博主在网络上爆料称:华为P50Pocket new就要来了(不出意外本月底)。你们觉得这个低配版的宝盒,去掉副屏换...
日期:10-26
三六零宣布 360 GPT「360 智脑」率先落地搜索场景 面向企业用户开放内测
4月10日消息:三六零日前宣布,基于 360GPT 大模型开发的人工智能产品矩阵「360 智脑」率先落地搜索场景,将面向企业用户开放内测。据了解,企业用户在 PC 端 360 搜索首页申请并...
日期:04-10
新款问界M7预售价25.8万起」- 9月12日上市 「余承东「问界m5内饰」
8月26日消息,今日是成都车展第二天,昨天余承东曾预告即将现身AITO问界汽车展台,今天上午如期出现,并公布了新款问界M7的预售价。该车预售价25.8万元起,即刻下订可享2000元抵8000...
日期:09-16
斗鱼发布2020游戏直播用户报告:技术+颜值,难怪这么香(斗鱼主播人气排名2020)
  2月19日,国内领先的游戏直播平台斗鱼发布了《2020游戏直播95后人群洞察报告》。报告以活跃在斗鱼平台上的95后年轻用户为研究对象,从用户属性和行为习惯两个维度出发,深度...
日期:07-16
Insanely Fast Whisper: 基于OpenAI模型的快速音频转录工具_音频转化app
10月18日 消息:Insanely Fast Whisper 是一个使用OpenAI的Whisper Large v2模型的音频转录工具,旨在以惊人的速度将音频内容转录为文本。该工具采用了一系列优化措施,使您能够...
日期:10-19
为博眼球太奇葩 四川男子用扳手代替方向盘开车拍视频:结果被扣4分
短视频平台兴起后,不少人依靠自己创作的正能量内容、才艺等成为网红博主,与此同时,为了成为网红,一些人想到通过拍摄奇葩视频博眼球,吸引观众注意。免费下载咕咚运动据报道,近日,四...
日期:02-03
天猫88vlp会员「淘宝天猫88VIP升级:芒果TV加入 免费领一年会员」
快科技8月3日消息,2018年8月8日淘宝正式推出了88VIP会员,可以享受折上折等优惠,还能赠送优酷、饿了么、虾米、淘票票、网易云音乐等年度会员,非常划算。近日恰逢88VIP五周年活动...
日期:08-03
小米14 Ultra正式发布:价格6499元起 支持双向卫星通讯
2月23日 消息:小米在发布会上正式推出了全新的小米14Ultra 手机。这款手机将于2月27日开售,起价为6499元,配置包括12GB+256GB 版本、16GB+512GB 版本、16GB+1TB 版本,以及钛金...
日期:02-23
双十一rog有什么活动_双12超值特惠购,ROG游戏手机2限时优惠100元
  双12在即,活动层出不穷,各大品牌纷纷推出重磅产品及福利,12月12日,ROG游戏手机2(腾讯游戏定制版)开启特惠抢购,可享100元优惠。   ROG游戏手机2购买链接:https://item.jd....
日期:06-13
米哈游《原神》IP营销动作频频,上线两周年后“钱”景几何「米哈游原神投资」
  蓝鲸TMT 印婧 图片来源:东方IC   近日,米哈游《原神》官宣与动画制作公司ufotable(飞碟社)进行长期合作,与该公司共同制作的《原神》动画项目正式开启。  同时,这一游戏近...
日期:10-04
8 月抖音及海外版 TikTok 全球吸金超 3.06 亿美元_为去年同期 1.8 倍 ,Sensor Tower
来源:中关村在线IT技术信息 9 月 13 日消息,Sensor Tower 商店情报数据显示,2022 年 8 月抖音及海外版 TikTok 在全球 App Store 和 Google Play 吸金超过 3.06 亿美元,是去年同...
日期:09-13
小米一亿像素参数「小米2亿像素即将量产!或命名12T Pro」
中关村在线消息:9月29日,据相关爆料,小米即将发布2亿像素主摄方案的手机,预计为小米12T系列,该机或将采用三星HP1传感器,该传感器尺寸为1/1.22英寸,单位像素面积为0.64μm,支持Chame...
日期:09-30
万顺叫车活动_在便捷出行中彰显万顺叫车品质服务
  万顺叫车作为网约车行业的佼佼者,多年来,始终秉承“司机的快乐之家,万顺叫车乘客的服务驿站”的理念,精诚所至、勠力同心,坚持“赢在品质服务进市场”,坚持“赢在品牌价值入...
日期:09-09
现在是晚上八点怎么说「当代人的晚八点去哪儿了引热议:你有多久没8点前到家了」
快科技11月6日消息,今日,一段以 #当代人的晚八点去哪儿了#为话题的视频在社交平台上引发热议,直击网友心底你有多久没八点前到家了?晚八点,是上个时代回忆里最令人向往的片段,也...
日期:11-06
注销800万粉丝抖音号!又暴涨350万粉,辛吉飞还是很火?_抖音八十多万粉丝
声明:本文来自于微信公众号 运营公举小磊磊(ID:gongjulei),作者:运营学习平台,授权转载发布。还记得9月份“辛吉飞注销抖音账号”事件吗?《20天暴涨600万粉丝后!他竟然注销账号,...
日期:11-10