您的位置:首页 > 互联网

突破性文本生成视频方法LVD,利用LLM创建动态场景布局

发布时间:2023-10-11 00:36:15  来源:互联网     背景:

文章概要:

Facebook数据中心

1. 困扰文本提示生成视频的挑战:研究团队引入LLM-Grounded Video Diffusion(LVD)方法,以解决生成复杂时空动态视频的问题。

2. LVD采用大型语言模型(LLMs)来创建动态场景布局(DSLs),作为视频生成的蓝图,同时发现LLMs具有惊人的能力来捕捉时空关系和复杂动态。

3. LVD结果显著优于基本视频扩散模型,为纯文本提示生成与所需属性和运动模式相符的视频,为内容创作和视频生成等应用开辟了新的可能性。

10月10日 消息:针对从文本提示生成视频所面临的挑战,一支研究团队引入了一种新方法,名为LLM-Grounded Video Diffusion(LVD)。核心问题在于,现有模型难以准确表示文本提示中描述的复杂时空动态。

为了提供背景,文本到视频生成是一项复杂的任务,因为它要求仅基于文本描述生成视频。尽管以前曾尝试解决这个问题,但它们在生成的视频在空间布局和时间动态方面与给定提示的匹配方面通常表现不佳。

然而,LVD采用了一种不同的方法。它不是直接从文本输入生成视频,而是利用大型语言模型(LLMs)首先根据文本描述创建动态场景布局(DSLs)。这些DSLs本质上充当了随后的视频生成过程的蓝图或指南。

尤为引人注目的是,研究人员发现LLMs具有出人意料的能力,可以生成这些DSLs,不仅捕捉了空间关系,还捕捉了复杂的时空动态。这对于仅基于文本提示准确反映现实世界场景的视频生成至关重要。

为了使这个过程更具体,LVD引入了一种算法,利用DSLs来控制视频扩散模型中生成物体级空间关系和时空动态的方式。重要的是,这种方法不需要大量的训练;它是一种无需训练的方法,可以集成到各种具有分类器指导能力的视频扩散模型中。

iphone14pro最大支持多少瓦快充

LVD的结果非常显著。它在生成视频方面明显优于基本视频扩散模型和其他强基线方法,能够忠实地遵循文本提示中所需的属性和运动模式。LVD生成的文本和视频之间的相似性为0.52。不仅如此,文本和视频之间的相似性,以及视频的质量都超越了其他模型。

可见,LVD是一种开创性的文本到视频生成方法,利用LLMs的能力来生成动态场景布局,最终提高了从复杂文本提示生成的视频的质量和保真度。这种方法有潜力在内容创作和视频生成等各种应用中开辟新的可能性。

论文网址:https://arxiv.org/abs/2309.17444


返回网站首页

本文评论
美国社交账号_美国92%成年社交网络用户使用Facebook
  北京时间6月16日早间消息,皮尤研究中心周三发布研究报告称,全美成年社交网络用户有92%使用Facebook,而Twitter的使用比例仅为13%。   这份长达85页的报告共对2255名18岁...
日期:07-30
三星2013手机报价多少钱「三星2013手机报价」
三星作为全球领先的智能手机制造商,自推出第一款Galaxy手机以来,一直走在手机科技的前沿。2013年,三星推出了一系列备受瞩目的手机产品,让人们体验到前所未有的智能化生活。三星...
日期:05-30
印度列车相撞事故已致120死超800伤 车头被撞扁:现场惨烈「印度两列火车相撞」
据印度媒体当地时间6月3日报道,印度奥里萨邦2日发生的列车相撞事故已致120人死亡,超过800人受伤。黑鲨是腾讯旗下的吗从印度媒体模拟的现场事故画面看,是其中一辆火车脱轨造成...
日期:06-03
殡葬专业的学生「00后女孩学殡葬专业 正式入职陵园做守墓人 对工作很满意」
11月16日,重庆一名00后女孩正式入职陵园做守墓人,引发网友围观。据了解,该女孩在大学所学专业是现代殡葬技术与管理,之前她晒出和好友在公墓实习的经历,如今已经毕业成为正式员工...
日期:11-18
华为手机去年出货量_华为手机今年出货量预计将达2.3亿部
  12月20日消息 据腾讯科技报道,在近期举行的华为内部会议上,华为消费者业务CEO余承东透露,华为手机今年全球出货量将在2.3亿部左右。值得一提的是,一个多月前,华为官宣其手机...
日期:10-03
微软CEO鲍尔默:Windows Phone 7是移动式Xbox LIVE(微软的鲍尔默)
  1月12日消息,微软CEO鲍尔默在谈及WindowsPhone7时表示,WindowsPhone 7是唯一一款提供所有这些服务的手机操作系统。它是移动式Xbox LIVE。人们正通过Windows Phone 7享受...
日期:07-25
航天科技“飞鸿”系列无人机将亮相珠海航展,高速隐身多用途无人机系统首发
  9 月 24 日消息 2021 珠海航展(第十三届中国国际航空航天博览会)将于 9 月 28 日正式召开,中国航天科技集团等单位将参展,带来大量新型装备,包括火箭、无人机、武器等。根...
日期:08-27
三星m12基材「15全系标配三星M12材质 Pro版独享ProMotion动态高刷 「iPhone」」
按照惯例,苹果将继续在今年9月举办一年一度的秋季新品发布会,届时全新的iPhone 15系列将正式与大家见面,不出意外的话该系列将继续推出包含iPhone 15、iPhone 15 Plus、iPhone...
日期:09-16
谷歌反垄断案进入为期 10 周庭审阶段
9 月 12 日消息,美国司法部于 2020 年 10 月对谷歌发起民事反垄断诉讼,指控该科技巨头垄断搜索和搜索广告。这起诉讼案件在美国 35 个州、哥伦比亚特区、波多黎各和关岛进行单...
日期:09-12
中国国漫巅峰之作「《中国奇谭》,不该是国漫的巅峰」
声明:本文来自于微信公众号新熵(微信号ID:baoliaohui),作者丨石榴 编辑丨月见,授权转载发布。2023年的第一个月,一只默默无闻,甚至有些丑陋的小猪妖,就这么猝不及防地火了。它来自...
日期:01-16
牵手失败,诺基亚终止向新东方新材料出售鼎桥 51% 股权「诺基亚出售总部大楼」
近日新东方新材料股份有限公司发布关于收到NOKIA终止出售 TD TECH 51%股权通知的公告。新东方新材料股份有限公司于2023年4月7日召开了第五届董事会第十次会议及第五届监事...
日期:09-05
苹果设备不断要求输入Apple ID密码!客服回应:可尝试修改密码_ios一直要求输入apple id密码
快科技4月17日消息,日前有大量用户反映,自己的iPhone等苹果设备不断弹出密码窗口,要求用户输入Apple ID密码。即使输入了正确的密码,系统同样会提示登录失败,并在不久后继续要求...
日期:04-17
网易严选获2019杭商品牌案例20强 马云宗庆后等企业家都曾入榜
  近日,第三届“杭商品牌案例20强”榜单发布,网易严选、大搜车、明视康眼科医院等20家企业入围,第三届“杭商品牌案例”由杭州市发展研究中心、杭州市工商业联合会、浙江大...
日期:01-28
马斯克删推特账号 新闻「推特管理层大洗牌 马斯克需向三名被解雇高管支付逾2亿美元」
10月28日消息,据国外媒体报道,在马斯克27日晚间完成对推特的收购后,一上任就将管理层大洗牌,解雇多名推特原高管。据知情人士透露,推特原首席执行官帕拉格•阿格拉瓦尔(Parag Agra...
日期:11-03
华云数据安超os_华云·云场景应用详解|安超DCM给数据中心“做主”
  近年来,随着云计算、大数据、容器等新技术的成熟应用,金融行业IT系统环境复杂程度不断提高,IT架构由传统架构转变成云、Docker、微服务等混合架构。与此同时带来的是数据...
日期:07-16
95.2%的主播月收入5000元以下 仅0.4%主播月收入10万元以上_报告称大多数主播月收入3000至5000元
互联网技术的快速发展催生了直播、短视频等新兴行业,成为年轻人职业选择的热门方向。微博近期发布的一项调查显示,超过六成的受访应届毕业生对新兴职业如网红直播等表示关注,只...
日期:10-09
抖音最短那块板,外人补得上吗?
声明:本文来自于微信公众号字母榜(ID:wujicaijing),作者:彦飞,授权转载发布。面对不断膨胀的平台商业生态,抖音正在寻找更多外援,填补愈发凸显的物流配送短板。12月5日,抖音生活服务...
日期:12-12
团购精选的加油卡活动是真的吗_200余人团购加油卡后网站“蒸发” 组团维权
网络团购,正凭着方便快捷、经济实惠的优势,逐渐成为不少消费者,尤其是年轻消费者流行的购物方式。然而,团购过程中消费者利益受损的案例,也是层出不穷。昨天上午,市民袁女士致电...
日期:07-23
比特币暴涨引发挖矿木马成倍增长,企业如何冲破“木马围城”?
  受比特币暴涨影响,各类数字虚拟币市值均有大幅增长。而虚拟货币繁荣背后,黑色数字产业链却早已将方向转向“挖矿”领域,挖矿木马仍是企业服务器被攻陷后植入的主要木马类...
日期:04-25
阿里巴巴淘宝教育澳门直播培训基地正式揭牌?
“阿里巴巴淘宝教育澳门直播培训基地”揭牌仪式日前在澳门直播服务中心举行,该基地由澳门经济及科技发展局支持,淘宝教育和澳门直播协会共同推动。阿里巴巴淘宝教育副总经理刘...
日期:12-20