您的位置:首页 > 互联网

阿里团队推新AI模型I2VGen-XL:单张静止图像就能生成高质量视频_阿里ai智能实拍

发布时间:2023-12-25 21:22:15  来源:互联网     背景:

12月25日 消息:视频合成最近取得了显著的进步,这得益于扩散模型的快速发展。然而,它在语义准确性、清晰度和时空连续性方面仍然存在挑战。它们主要源于文本-视频数据的稀缺性和视频的复杂固有结构,使得模型难以同时确保语义和定性的卓越性。

阿里巴巴、浙江大学和华中科技大学的研究人员提出了一种级联的 I2VGen-XL 方法,该方法通过解耦这两个因素来增强模型性能,并通过利用静态图像作为关键指导形式来确保输入数据的对齐。

阿里ai建模

项目体验网址:https://top.aibase.com/tool/i2vgen-xl

I2VGen-XL 由两个阶段组成:

如何远程控制公司的电脑

i) 基础阶段通过使用两个分层编码器来保证连贯的语义并保留输入图像中的内容。

ii) 细化阶段通过合并额外的简短文本来增强视频的细节,并将分辨率提高到1280x720。

网络工作组名称

目前文本到视频合成的主要挑战之一是高质量视频文本对的收集。为了丰富 I2VGen-XL 的多样性和鲁棒性,研究人员收集了一个庞大的数据集,其中收集了大约3500万个单镜头文本-视频对和60亿个文本-图像对来优化模型。通过这种方式,I2VGen-XL可以同时提高语义的准确性、细节的连续性和生成视频的清晰度。

所提出的模型利用潜在扩散模型(LDM),这是一种生成模型类,可以学习扩散过程来生成目标概率分布。在视频合成的情况下,LDM逐渐从高斯噪声中恢复潜在目标,保留视觉流形并重建高保真视频。I2VGen-XL采用LDM(简称VLDM)的3D UNet架构,以实现有效且高效的视频合成。

2021英雄联盟新版本最强辅助

细化阶段对于增强空间细节、细化面部和身体特征以及减少局部细节中的噪声至关重要。研究人员分析了频域细化模型的工作机制,强调了其在保留低频数据和提高高清视频连续性方面的有效性。

在与 Gen-2和 Pika 等顶级方法的实验比较中,I2VGen-XL 展示了更丰富、更多样化的运动,强调了其在视频生成方面的有效性。研究人员还对人脸、3D卡通、动漫、中国画、小动物等多种图像进行了定性分析,展示了该模型的泛化能力。

项目:https://i2vgen-xl.github.io/

论文网址:https://arxiv.org/abs/2311.04145


返回网站首页

本文评论
红杉中国又放了一个大招_红杉上市了吗
Google 智能家居林肯国产航海家氛围灯努比亚play 5g手机处理器   文/张楠   红杉中国,又放大招了。   今日,红杉中国下场做起了培训,宣布推出“YUÈ——红杉中国创业加速...
日期:08-16
微软宣布 Chrome OS 系统 Office 应用将在下个月起停止支持
  8 月 26 日消息 根据外媒 Neowin 消息,微微软今日正式宣布,将于 9 月 18 起停止支持 Chrome OS 系统上的安卓版 Office 套件 App,包括 Outlook。这些应用停止支持后,微软希...
日期:07-17
对话荣耀赵明:要让市场告别苹果一家独大「赵明荣耀ceo」
崔玉贤/文2023MWC上海期间,荣耀CEO赵明做了智能手机未来演进的相关主题演讲。在演讲中,赵明提到荣耀要将AI大模型引入到终端,首次提出了终端侧大模型。对此,赵明在接受网易科技...
日期:06-29
百度百家号多元变现产品全新升级 推出“变现任务”页面_百家号领域专注
9月22日 消息:9月19日,百度百家号多元变现产品全新升级,推出“变现任务”页面,聚合度星选商单、付费内容、电商带货、百享计划(私域广告)、问一问、赞赏等六大变现模式,一站式帮助...
日期:09-22
完美视频大全下架了?当贝市场分享更实用的影视app(当贝市场找不到完美视频大全)
  众所周知,完美视频大全被用户称为最好用的视频软件,这得益于其完全免费的影视资源。但是最近有不少用户反馈,在当贝市场中已经搜不到完美视频大全了。如何找到一款能够...
日期:11-28
rtx4080显卡「大量RTX 4090非公版显卡上架:有的价格贵了25%」
NVIDIA已经发布的三张RTX 40系显卡中,最先上市的会是RTX 4090,日子定在10月12号。尽管NVIDIA给出的FE公版建议零售价是1599美元(国行12999元),但三方的非公版则并不一定严格按照...
日期:09-30
智慧海洋建设方案「信通院联合发布《5G智慧海洋发展研究报告(2023年)》」
通信世界网消息(CWW)我国一直以来高度重视海洋强国建设。党的二十大报告明确提出“发展海洋经济,保护海洋生态环境,加快建设海洋强国”等要求,我国智慧海洋迎来前所未有的发展契...
日期:07-20
有人曾被封店、有人亏完300多万,这些草根卖家靠它成功“翻盘”
声明:本文来自于微信公众号 天下网商(ID:txws_txws),作者:叶晨,授权转载发布。14年前,宋婷婷揣着10万元的创业启动金,从东北出发、南下义乌。从单枪匹马,到拉起一支成熟的运营团队...
日期:12-20
苹果iPad新款-400 入手仅2099_ipad air4 3999值得买吗
新款的iPad刚发布不久就开始了促销,近期有立减400元的活动,此前京东原价为2499元,参加满2000-400优惠券,到手价2099元,而且还能分期。oled电视北美和菲律宾的外教这款iPad为2021...
日期:11-17
AMSKY爱司凯参加2019年德国国际铸造展(GIFA)
  四年一届的德国国际铸造展(GIFA)将于今年6月25日在德国杜塞尔多夫展览中心开展。德国国际铸造展(GIFA)是当前世界上无论是从规模还是影响力都是首屈一指的国际性冶金铸...
日期:06-14
两款iPhone 14 Pro卖爆:苹果季度收入将创新纪录_iphone12pro max中国销量
尽管iPhone 14/14 Plus破发,销售情况不理想,但价格更贵的iPhone 14 Pro/Pro Max却异常火爆,至今还是供不应求。富士康员工爆料苹果14promax真机日前,投行摩根大通在一份研报中预...
日期:10-28
明星 淘宝直播「淘宝明星直播没有“活水”」
声明:本文来自于微信公众号 卡思数据(ID:caasdata6),作者:卡思数据,授权转载发布。今年双十一,是淘宝十四年来第一个没有公开销售额的双十一,但也是淘宝直播最热闹的一个双十一。罗永...
日期:11-26
诺基亚性价比高的手机_诺基亚性价比高的手机有哪些
近年来,诺基亚手机在性价比方面表现突出,备受消费者追捧。这篇文章将从品牌历史、产品特点和市场反响三个方面探讨诺基亚性价比高的手机。品牌历史魅族16x拆解教程诺基亚是芬...
日期:05-31
限时特惠2599元起!荣耀90GT发布:搭载第二代骁龙8芯片_荣耀第九代
荣耀今晚发布了旗下最新款手机荣耀 90GT。这款手机采用独特的直角边框设计,具有1.25mm超窄边框和背面“引擎”灵感的设计,给人留下深刻印象。荣耀 90GT 厚度为7.9mm,重量为185g...
日期:12-22
手机上就能“逛”公园?浪潮助力郑东新区打造智慧园林
  偌大的公园,不知道怎么游览?儿童设施在哪儿,半天找不到?逛公园时,如果能掌握公园的一手实时数据,那么相信这趟旅程将会更加惬意舒心。近日,浪潮打造的郑州首个智慧园林在郑...
日期:07-16
传谷歌推迟发布Gemini大模型,或要到明年初上线_谷歌 2020
11月17日消息,两位知情人士透露,近日谷歌已通知其云客户和业务合作伙伴,将推迟发布OpenAI的竞品Gemini AI。今年年初,谷歌代表曾表示该公司计划在11月份之前推出大语言模型Gemin...
日期:11-17
50 多位人工智能专家呼吁欧洲扩大通用人工智能监管范围「各国政府将人工智能列为国家发展战略」
4月15日消息:日前超过 50 位专家和机构发表政策简报,呼吁欧洲官员在「欧盟 AI 法案」中扩大人工智能监管范围。他们认为,通用人工智能(GPAI)也应该纳入法规监管范围,而非局限于更...
日期:04-15
云视频_就地过年?8小时“云过年”直播,带你尝鲜全国年味
  2月6日,一场“云过年”将全网公益直播: 从甘肃黄土高坡 到云南滇缅边境 从养老院的一餐爱心饭 到贵州丹寨的民俗表演 再到澳门新年蹦极……   央视网携手腾讯公益...
日期:07-16
独家:中国移动国际公司总经理王华已到任 从海外调回来_中国移动国际公司王猛
运营商财经网 吴碧慧/文近日,在2023中国移动全球合作伙伴大会上,中国移动国际公司总经理王华等人纷纷出席,其中王华也是在前不久集团大规模中高层干部调整中的一员,如今看来已正...
日期:10-26
董宇辉“与辉同行”个人工作室成立
12月23日 消息:企查查APP显示,近日,与辉同行(北京)科技有限公司成立,法定代表人董宇辉。注册资本1000万元,经营范围包含鲜肉零售、网络文化经营、演出经纪等。杜卡迪Multistrada V...
日期:12-23