您的位置:首页 > 互联网

只需2分钟,单视图3D生成又快又好!北大等提出全新Repaint123方法_由三视图生成立体图软件

发布时间:2024-01-08 22:35:59  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

将一幅图像转换为3D的方法通常采用Score Distillation Sampling(SDS)的方法,尽管结果令人印象深刻,但仍然存在多个不足之处,包括多视角不一致、过度饱和、过度平滑的纹理,以及生成速度缓慢等问题。

三视图生成立体图手机app

为了解决这些问题,北京大学、新加坡国立大学、武汉大学等机构的研究人员提出了Repaint123,以减轻多视角偏差、纹理退化,并加速生成过程。

论文地址:https://arxiv.org/pdf/2312.13271.pdf

GitHub:https://github.com/PKU-YuanGroup/repaint123

项目地址:https://pku-yuangroup.github.io/repaint123/

核心思想是将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力结合起来,以生成具有一致性的高质量多视角图像。

如何根据三视图生成三维模型

作者进一步提出了针对重叠区域的可见性感知自适应再绘强度,以提高再绘过程中生成图像的质量。

生成的高质量、多视角一致的图像使得可以使用简单的均方误差(MSE)损失进行快速的3D内容生成。

作者进行了大量实验证明,Repaint123能够在2分钟内从零开始生成具有多视角一致性和精细纹理的高质量3D内容。

文章的主要贡献点如下:

1. Repaint123全面考虑了图像到3D生成的可控重绘过程,能够生成多视角一致的高质量图片序列。

2. Repaint123提出了一个简单的单视图3D生成的baseline,粗模阶段采用Zero123作为3D prior与SDS损失快速优化Gaussian Splatting几何(1分钟),细模阶段采用Stable Diffusion作为2D prior与MSE损失快速细化Mesh纹理(1分钟)。

3. 大量的实验验证了Repaint123方法的有效性,可以在短短2分钟内从单一图像中生成匹配2D生成的质量的3D内容。

图1:论文动机:快速、一致、高质量的单视角3D生成

具体方法:

Repaint123主要改进集中于mesh细化阶段,包含两个部分:多视角一致的高质量图像序列生成,快速高质量的3D重建。

在粗模阶段,作者采用3D Gaussian Splatting作为3D表征,通过SDS损失优化的粗模几何和纹理。

在细化阶段,作者将粗模模型转换为网格表示,并提出一种渐进的、可控的纹理细化重绘方案。

首先,作者通过几何控制和参考图像的指导逐步重新绘制相对于先前优化视图的不可见区域,从而获得新颖视图的视图一致性图像。

然后,作者采用图像提示进行无分类器指导,并设计自适应重绘策略,以进一步提高重叠区域的生成质量。

最后,通过生成视图一致的高质量图像,作者利用简单的MSE损失来快速生成3D内容。

多视角一致的高质量图像序列生成:

如图2所示,多视角一致的高质量图像序列生成分为以下四个部分:

图2:多视角一致的图像生成流程

DDIM Inversion

为了保存粗模阶段生成的3D一致的低频纹理信息,作者使用DDIM Inversion将图像反演到确定的latent, 为后续去噪生成忠实一致的图片做基础。

Controllable Denoising

为了控制几何一致与长程纹理一致,在去噪阶段作者使用ControlNet引入粗模渲染的深度图作为几何先验, 注入参考图的Attention特征进行纹理迁移。

马斯克 美国政府

同时,为了执行Classifier-free guidance提升图像质量,论文使用CLIP将参考图编码为image prompt提示去噪网络。

Obtain Occlusion Mask

为了从渲染出来的图像In和深度图­­Dn的新颖视图中获得遮挡掩码Mn,在给定Ir和Dr的重绘参考视图Vr条件下,作者首先通过使用深度Dr缩放来自Vr的2D像素点至3D点云,然后从新视角Vn渲染3D点云Pr,得到深度图Dn'。

作者认为两个新颖视图深度图(Dn和Dn')之间具有不同深度值的区域是遮挡掩码中的遮挡区域。

Progressively Repainting both Occlusions and Overlaps

为了保证图像序列重相邻图像的重叠区域像素级别对齐,作者使用了渐进式局部重绘的策略,在保持重叠区域不变的情况下生成和谐一致的临近区域,从参考视角依次类推到360°。

但是如图3所示,作者发现重叠区域同样需要进行细化,因为一个之前斜视的区域在正视时其可视分辨率变大,需要补充更多的高频信息。

为了选择合适的细化强度使得在提升质量的同时保证忠实度,作者借鉴投影定理与图像超分的思想,提出了一种简单直接的能见度可感知的重绘策略来细化重叠区域,另细化强度等于1-cosθ*(其中θ*为之前所有相机视角与所视表面法向量夹角的最大值),从而自适应地重绘重叠区域。

图3:相机视角与细化强度的关系

快速高质量的3D重建:

如图4所示,作者采用了两阶段方法,先使用Gaussian Splatting表示来快速生成合理的几何和粗糙的纹理,同时借助上述生成的多视角一致的高质量图像序列, 作者得以使用简单的MSE loss进行快速的3D纹理重建。

图4:Repaint123两阶段单视角3D生成框架

实验结果

作者比较了多个单视图生成任务方法,在RealFusion15和Test-alpha数据集上取得了一致性、质量、速度三方面最先进的效果。

单视图3D生成可视化比较

单视图3D生成定量比较

消融实验

由三视图生成立体图软件

同时,作者也对论文使用的每个模块的有效性以及视角转动增量进行了消融实验:

参考资料:

https://github.com/PKU-YuanGroup/repaint123


返回网站首页

本文评论
redmi k30中关村在线_Redmi K30红色版真机照曝光
  12月4日消息 数码闲聊站放出了一张Redmi K30红色版真机图。从曝光的真机图来看,Redmi K30红色版的相机部分的圆环设计并没有官方渲染图那般显眼,圆环两侧则有文字标记;从...
日期:05-25
中国信通院林美玉:加强工业互联网安全体系建设,守护新型工业化高质量发展
作为新一代信息技术与实体经济融合的重要领域,工业互联网驱动工业数字化、网络化、智能化变革,成为第四次工业革命的重要基石。为深化工业互联网创新发展,推进新型工业化,加快制...
日期:06-02
广州小熊电器「喜报!小熊电器获广东省省级企业技术中心认定」
   7 月 18 日,广东省工业和信息化厅发布《广东省工业和信息化厅关于组织开展 2022 年省级企业技术中心(第 21 批)认定工作的通知》,其中小熊电器企业技术中心被认定为“广东...
日期:07-22
蒂芙尼正式入驻京东_蒂芙尼中国实体店
2 月 10 日讯:京东宣布,蒂芙尼正式入驻京东,开启品牌在中国与第三方线上零售平台的首次合作。即日起,消费者可通过京东APP搜索“蒂芙尼”或“Tiffany”,直达品牌官方旗舰店选购...
日期:02-14
韩国SK电讯战略投资人工智能联络开发商Persona AI「韩国sk telecom」
8月22日 消息:韩国最大的电信运营商 SK Telecom 宣布,已成为首尔人工智能联络公司 Persona.AI 的第三大股东。Persona.AI 通过自己的自然语言处理引擎提供24小时客户咨询服务...
日期:08-22
小黑蛛归来!索尼Mini LED电视X95EL纵横潮酷视听体验_索尼2021年电视x95j
由美国哥伦比亚影片公司出品,索尼动画制作,曾登顶《帝国》杂志“影史最 佳动画第 一名”、获得奥斯卡最 佳动画长片的《蜘蛛侠:平行宇宙》的全新续作《蜘蛛侠:纵横宇宙》,将于 6...
日期:05-22
Zegna Triple Stitch新款奢华系列休闲鞋,重塑当代男士穿搭风格
年龄不被定义,穿搭不被束缚。享誉全球的奢侈男装品牌杰尼亚Zegna全新推出的夏季款Triple Stitch奢华系列休闲鞋,采用亚麻材质,透气凉爽,其设计突破经典新意,匠心材质和细腻工艺兼...
日期:07-12
QM半年报告:百度系用户超10亿持续高位增长,信息流、视频领域表现不俗
  7月28日,第三方机构QuestMobile发布《中国移动互联网2020半年大报告》。报告显示,移动互联网超级平台持续发挥马太效应,强者恒强。作为移动互联网行业三家拥有10亿用户规...
日期:07-14
内屏没有摄像头?这样的折叠屏体验还不及平板电脑_折叠屏不实用
  近日,华为发布了新一代折叠屏手机 Mate X2,区别于前两代产品,新品最显著的变化在于屏幕由外折改为了内折。尽管早在华为发布第一代折叠屏产品时,余承东曾表示“内折是华为...
日期:07-16
再次来到十字路口:传腾讯正进行组织架构调整_腾讯新闻组织架构
  江湖传言,腾讯将进行新一轮组织架构调整,重点突出TO B业务。中国互联网,传言大部分均非空穴来风,即使从腾讯最近的一些动作来看,此次进行组织架构调整也八九不离十,腾讯云全面...
日期:02-11
iphone 12 pro有现货吗「iPhone 14 Pro系列国内日均卖出10万台」
10月29日 行业销售数据显示,10 月 24 日 “双十一” 预售首日,仅 iPhone 14 Pro 和 Pro Max 销量就超过 13 万台。据《晚点财经》报道,一家行业调研机构给出的数据显示,10 月第...
日期:11-02
一顿平均40元:网友直呼月薪两万 吃不起中式快餐「中式快餐一个月收入怎么样」
俗话说民以食为天,你的工作餐平时是如何解决呢?据侯晓楠介绍,目前腾讯AI开放平台已开放的AI技术来自网易数读的调查显示,统计了包括老乡鸡、大米先生在内的五家头部”中式连锁...
日期:05-23
被「Wordle」拿捏心态的美国玩家,又爱上了“复刻”新品?
声明:本文来自微信公众号“白鲸出海”(ID:baijingapp),作者:B21993,授权转载发布。单词类游戏,在2022年春天突然因为一款页游「Wordle」火了起来。这款游戏表面上看和其他单词类游...
日期:11-16
区块链技术开拓全新市场 天九共享助易保全领跑电子证据市场
  在国家政策扶持下,中国的区块链发展迅猛。数据显示,2020年全球区块链专利累计达到5.14万件,其中中国累计申请了3.01万件,占全球总数的58%。同时,近期发布的《北京城市副中心...
日期:07-16
黄仁勋有英伟达多少股份「NVIDIA创办30年当了30年CEO 黄仁勋:希望再工作40年」
在黄仁勋的带领下,NVIDIA已经成长为全球市值第一高的图形计算公司。从1993年与Chris Malachowsky和Curtis Priem共同创办NVIDIA算起,黄仁勋已经担任公司CEO 30年了,他也从30岁...
日期:03-23
Q3中国手机市场降幅收窄,华为大涨37%_q3中国手机出货量
通信世界网消息(CWW)10月16日,Counterpoint最新报告显示,2023年第三季度,中国智能手机销量同比下降3%,同比降幅收窄,表明市场可能已经见底,复苏在即。报告指出,得益于新推出的Mate 60...
日期:10-26
小程序DAU_微信小程序日活3亿 强劲DAU拉动商业变现新蓝海
  11月13日,腾讯发布2019年第三季度财报,收入972.36亿元同比增长21%,非通用会计准则下净利244.12亿元,同比增长24%。其中微信及WeChat的合并月活账户数达11.51亿,同比增长6.3%...
日期:03-28
电子商务新现象_中国电子商务产业预警:泡沫魔鬼正在逼近
  潘多拉的盒子已悄然打开,泡沫这个魔鬼正逼近雀跃欢腾的中国电子商务产业。   继“开心团购”裁掉百余名员工,“高朋网”裁员25%之后,有标杆地位的凡客诚品近日也做出裁...
日期:07-22
英伟达、英特尔、AMD等芯片巨头集体萎靡,PC销售热潮已退(英伟达的竞争对手)
pixel3xl相机苹果13发布其他机型会降价吗   过去近两年,当疫情期间人们被隔离在家时,PC出货量出现爆发式增长。而现在,这样的增长终于消失。   当地时间8月8日,存储芯片公司...
日期:08-16
《文心》txt「仅开放2个多月 百度:文心一言用户规模已达7000万」
快科技11月9日消息,在2023年世界互联网大会乌镇峰会上,百度CTO王海峰披露,文心一言用户规模现已达到7000万。vivo手机x80pro+百度官方发文称,文心一言自8月31日面向全社会开放至...
日期:11-10