您的位置:首页 > 互联网

AI脑补画面太强了!李飞飞团队新作ZeroNVS,单个视图360度全场景生成

发布时间:2023-11-06 10:34:38  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:桃子,授权转载发布。

近来,利用3D感知扩散模型训练模型,然后对单个物体进行SDS蒸馏的研究数不胜数。

但是,能够真正做到场景级的画面生成,从未实现。

现如今,斯坦福李飞飞和谷歌团队打破了这个记录!

比如,输入一张从某个角度拍摄的客厅图片,整个客厅的样貌就出来了。

再来一张角度很偏的屋子拐角图,也能生成一个意想不到的空间。

还有各种物体室内、户外的全场景图。

看到这儿,不得不不让人惊呼AI脑补简直强的一批!

那么,这究竟是如何实现的呢?

3D感知扩散模型——ZeroNVS

最新论文中,斯坦福和谷歌研究人员引入了一种3D感知扩散模型——ZeroNVS。

论文地址:https://arxiv.org/pdf/2310.17994.pdf

单图像、360度新视图合成 (NVS) 的模型,在生成图像时应该逼真且多样化。

合成图像对于我们来说,应该看起来自然且3D一致,并且它们还应该捕获不可观察区域的许多可能的解释。

以往,这个具有挑战性的问题,通常是在单个物体,甚至没有背景下研究的,也就是说,对真实性和多样性的要求都被简化了。

最近的研究依赖于高质量大规模数据集,比如Objaverse-XL,使得条件散射模型能够从新视角产生逼真图像,然后通过SDS蒸馏采样,以提高3D一致性。

同时,由于图像多样性主要体现在背景中,而不是物体中,因此对背景的无知显着降低了合成多样化图像的效果。

事实上,大多数以物体对象为中心的方法,不再将多样性视为衡量标准。

然而,在复杂真实场景生成新视角合成是一个更难的问题,目前还没有包含完整场景真值信息的大规模数据集。

研究人员在研究中对背景进行了建模,以产生多样的结果。

在ZeroNVS中,作者开发了新技术来预测单个真实图像的场景,并且建立在之前在3D感知扩散模型训练(Zero-1-to-3)和SDS蒸馏(DreamFusion)方面的工作基础上。

具体方法

研究人员着手从单个真实图像合成场景级新颖视图的问题。

与之前的工作类似,我们首先训练扩散模型

来执行新颖的视图合成,然后利用它来执行3D SDS蒸馏。

与之前的工作不同地方在于,作者关注的是场景而不是物体。

场景提出了一些独特的挑战。首先,先前的研究使用摄像机和比例的表示,这些表示对于场景来说要么含糊不清,要么表达力不足。

其次,先前研究的推理过程是基于 SDS 的,它具有已知的模式崩溃问题,并且通过大大减少预测视图中的背景多样性在场景中体现出来。

与之前的工作相比,研究人员尝试了通过改进场景的表示和推理程序来应对这些挑战。

在这个公式中,M的输出,和单个图像的输入

是模型可用于视图合成的唯一信息。

表示视图综合的对象

如下图,3DoF相机姿势捕获指向原点的相机的相机仰角、方位角和半径,但无法表示相机的滚动(如图)或空间中任意方向的相机。

具有这种参数化的模型无法在现实世界数据上进行训练,其中许多相机姿势不能用3DoF姿势充分表示。

表示视图合成的通用场景

对于场景,研究人员应该使用具有6个自由度的相机表示,可以捕获所有可能的位置和方向。

捕获六个自由度的相机参数化的一种直接选择是相对位姿参数化。研究人员建议还将视野作为额外的自由度,并将这种组合表示称为6DoF+1。

M6DoF+1的一个吸引人的特性是它对于场景的刚性变换具有不变性,因此可以得到:

对于每个归一化方案,ZeroNVS中多个样本的Sobel边缘图方差的热图。研究者提出的方案M6DoF+1,观察者减少了由于尺度模糊而导致的随机性。

通过SDS anchoring提高多样性

基于SDS的NeRF蒸馏(左)对所有360度新视图使用相同的引导图像。

作者的SDS anchoring(右)首先通过DDIM对新视图进行采样,然后使用最近的图像(无论是输入还是采样的新视图)作为指导。

实验结果

再具体评估中,研究人员使用了一组标准的新视图合成指标来评估所有方法:PSNR、SSIM和LPIPS。

由于PSNR和SSIM有已知缺点,研究人员更看重LPIPS,并确认PSNR和SSIM与问题设置中的性能没有很好的相关性,如图7所示。

结果如表1所示。

首先与基线方法 DS-NeRF、PixelNeRF、SinNeRF、DietNeRF进行比较。

尽管所有这些方法都是在DTU上进行训练的,但研究人员从未在DTU上进行过训练,但实现了最先进的LPIPS零样本。

图8中显示了一些定性比较。

云计算取代芯片

DTU场景仅限于相对简单的前向场景。

小米充电宝口红版

因此,研究人员还引入了一个更具挑战性的基准数据集,即Mip-NeRF360数据集,来对单张图像的360度视图合成任务进行基准测试。

研究人员使用这个基准作为零样本基准,并在混合数据集上训练3个基线模型来比较零样本性能。

限制这些零样本模型,其方法在该数据集的LPIPS上遥遥领先。在DTU上,新方法在所有指标上都超过了Zero-1-to-3和零样本PixelNeRF模型,而不仅仅是LPIPS,如表2所示。

作者介绍

Kyle Sargent

斯坦福大学的一名博士生,从2022年秋季开始,在斯坦福人工智能实验室工作,导师是Jiajun Wu和李飞飞。

他还曾在谷歌研究院担任学生研究员。


返回网站首页

本文评论
洛基第二集知乎「《洛基》第二季宣传海报遭争议 涉嫌使用生成式AI」
文章概要:- Disney的《洛基》第二季宣传海报因涉嫌部分使用生成AI而引发专业设计师的争议。理想汽车家用充电桩1.0- 设计师指出,海报背景中的螺旋时钟图案显示出生成AI的迹象...
日期:10-10
iPhone6成淘汰产品!官方徒手拔了最大钉子户「iphone6splus钉子户」
中关村在线消息:10月8日,据相关爆料,苹果在近日更新了古董和淘汰产品清单,停售5年之久的iPhone6正式被官方列列入淘汰产品清单。据悉,苹果会将已停售五年、未满7年的产品列入“古...
日期:10-09
优酷iPad2客户端升级打体验牌 便捷与高清合璧_ipad2优酷看不了
  作为国内最早全站支持苹果iPad的视频网站,优酷的HD客户端也同期于去年上线,并在今年5月iPad2上市前进行客户端升级,推出了对应支持苹果iPad2的优酷客户端。   最新推出...
日期:07-30
豆瓣2022年度电影榜单出炉:《阿凡达2》入榜_阿凡达2票房全球
继12月20日公布2022年度读书榜单之后,现在豆瓣电影榜单也出炉了。其中在评分最高华语电影”中,《爱情神话》《狙击手》《一场很(没)有必要的春晚》《瀑布》《还是觉得你最好》《...
日期:12-27
张利东卸任今日头条公司法定代表人「张利东卸任今日头条公司法定代表人了吗」
7月13日 消息:企查查APP显示,近日,今日头条有限公司发生工商变更,张利东卸任法定代表人职务,由涂晴接任。目前,张利东已卸任大部分今日头条相关公司法定代表人职务,仍担任抖音有限...
日期:07-13
男子中暑后突发狂躁神智不清:脑子已被高温烧坏了「中暑脑子烧坏了能留下什么后遗症」
7月6日消息,近期全国多地出现高温天气,有些地方甚至超过了40度,给很多人带去了困扰甚至是生命威胁。据媒体报道,日前福州一名面点师傅在自己的烘焙房内突发昏倒,很快便出现了意识...
日期:07-06
微信搜索市场份额「微信搜一搜月活用户达8亿 2022年搜索量同比增长54%」
1月10日消息,今日,2023微信公开课PRO开讲。据微信搜一搜团队披露,2022年微信搜一搜月活跃用户已达8亿,搜索量较上一年同比增长54%。据微信搜一搜公开课讲师梁泽锋介绍,微信搜一搜...
日期:01-10
孤注一掷出自哪里「《孤注一掷》故事原型有多恐怖 网友:远比电影更残酷」
电影《孤注一掷》根据真实事件改编而成,反映了近年来国内大量诈骗案例。影片讲述了一群被骗人、受害人在经济和心理上遭受创伤的故事。主要角色由张艺兴、王传君和金晨等人主...
日期:08-09
罗列原因吵翻_曾称买苹果国人人傻钱多 任泽平建议5年内禁燃油车
5月18日消息,曾吐槽苹果割国人韭菜,人傻钱多的任泽平再次发声,这次是给出为何说要快点淘汰燃油车。在这之前,任泽平曾公开表示,建议五年内禁售燃油车,随后这个言论引起了网友的围...
日期:09-28
比亚迪七月销量明细「比亚迪7月各车型销量出炉:10款车破万 宋家族再破5万!」
快科技8月2日消息,比亚迪公布了7月份销量,共交付262161辆,同比增加61.3%;比亚迪今年销量已累计达1517798辆,同比增长 87.63%。当月EV车型134783辆,DM车型126322辆。7月比亚迪新能...
日期:08-02
“地图可显示台湾省每个街道”?网友热情高致搜索卡顿,百度地图道歉
讯 8月5日下午消息,百度地图发布公告,就今日“崩了”致歉。百度地图表示,由于大家今日对台湾省“山西刀削面”搜索量较多,导致搜索该词条时卡顿。   以下为原文内容:   公告...
日期:08-06
抖音新增《抖音电商规则总则》创作者不得发布限制推广的商品_抖音该商品为平台禁止发布商品
11月24日 消息:今日,抖音电商发布了关于新增《抖音电商规则总则》的意见征集通知,意见征集期内2022年11月24日—2022年12月1日,拟于2022年12月15日首次生效。买thinkpad还是mac...
日期:11-27
2021年小米8跑分「骁龙8 Gen 2将11月14日发布:小米13首发?跑分将突破120万」
目前已有消息称,高通骁龙峰会将在11月14日至11月17日期间举行,而会中将会正式发布骁龙8 Gen2旗舰芯片,而小米很有可能在年底首发,首发的机型可能是小米13.骁龙8 Gen2基于台积电4...
日期:10-04
分期付款手机会先给你吗「分期付款手机」
随着科技的不断发展和普及,智能手机已经成为人们生活中必不可少的一部分。而在购买手机方面,分期付款已经成为了许多人的首选。本文将介绍的相关信息。一、什么是?是指消费者可...
日期:05-29
Redmi K60 Ultra曝光:天玑9200 加持,预计7月发布_红米k60什么时候发布
日前有数码博主爆料称,Redmi K60 Ultra 即将发布。据悉,该机型将于下月(7 月)与一加 Ace2 Pro、iQOO 11S、真我GT Neo5 Pro 同时发布。三星note20屏占比有消息称,三款机型搭载的...
日期:06-04
三星2020年新款平板电脑「三星发布高端安卓平板电脑 下月开售」
三星推出高端安卓平板电脑Tab S9系列,包括Tab S9、S9 Plus和S9 Ultra。其中Tab S9 FE和Tab A9是中端定位的平板电脑,据传已经出现在Google Play列表上。三星Tab S9 FE搭载Andr...
日期:09-23
jupyter debug「Jupyter大升级:各种大模型都能连,聊天就能生成代码、错误修改」
机器之心报道编辑:陈萍Jupyter 在其环境中添加了基于 LLM 的聊天机器人。现在,大语言模型(LLM)与 Jupyter 连接起来了!这主要归功于一个名叫 Jupyter AI 的项目,它是官方支持的 Pr...
日期:08-04
主打视效增强降低发力功耗 「iQOO」-Neo8将全系标配自研V1+芯片_iqooneo8+128参数配置
经过了一段时间的密集爆料,不久前iQOO官方正式对外宣布:将于5月23日推出全新的iQOO Neo8系列新品,官方称这是一款拥有旗舰级性能调校的作品。随着发布时间的日益临近,外界和官方...
日期:09-16
亚马逊当当网对比分析_当当二季度净亏440万美元 形似神不似亚马逊
“我不认为当当是‘中国的亚马逊’,去年年底成功IPO是投资银行吹捧所致,事实上,当当网相去甚远。”最近,对冲基金Ironfire Capital创始人Eric Jackson毫不客气地说,并且抛售了手...
日期:07-22
李晓洋担任百度资本CEO 曾任百度集团副总裁「百度新人李晓洋」
  每经记者 可杨;;每经编辑 杨夏;;  8月25日,《每日经济新闻》记者从百度资本方面获悉,曾任百度集团副总裁、主管投资并购部的高管李晓洋出任百度资本CEO并加入董事会,负责...
日期:09-08