您的位置:首页 > 互联网

超逼真3D生成模型!华南理工贾奎团队ICCV'23新作:支持重新照明、编辑和物理仿真

发布时间:2023-07-25 20:17:27  来源:互联网     背景:


新智元报道

编辑:LRS

【新智元导读】来自华南理工大学的研究团队提出了一种基于文本驱动的三维模型及材质生成方法Fantasia3D,是第一个被接收的能够产生逼真效果的AIGC3D工作。

受益于预训练的大型语言模型和图像扩散模型(Satble Diffusion等)的可用性,自动化三维内容生成近期取得了快速进展。

现有的文本到三维模型的生成方法通常使用NeRF等隐式表达,通过体积渲染将几何和外观耦合在一起,但在恢复更精细的几何结构和实现逼真渲染方面存在不足,所以在生成高质量三维资产方面效果较差。

在这项研究中,华南理工大学提出了一种用于高质量文本到三维内容创建的新方法Fantasia3D,关键之处在于对几何和外观进行解耦的建模和学习。


项目地址:https://fantasia3d.github.io/

对于几何学习,Fantasia3D依赖于显隐式结合的表达,并提出将渲染的表面法线图编码为Satble Diffusion的输入;对于外观建模,Fantasia3D引入了空间变化的双向反射率分布函数(BRDF)到文本生成三维模型的任务中,并学习生成表面的逼真渲染所需的表面材质。

解耦框架兼容目前的图形引擎,支持生成的三维资源的重新照明、编辑和物理仿真。

研究人员也进行了全面的实验,展示了该方法在不同的文本到三维生成任务设置下相对于现有方法的优势。

模型效果

对于给定的文本,Fantasia3D能够生成具有不同拓扑形状的三维模型以及具有照片级真实感的渲染表面。

同时,如下图1中右上角的狮子所示,由于使用了BRDF建模表面,Fantasia3D能产生较强的金属反射效果。


图1:三维模型生成效果

同时,Fantasia3D支持根据用户给定的粗糙三维物体和文本进行生成。

如下图2所示,给定一个粗糙的三维模型,Fantasia3D可将输入的粗糙模型作为初始化生成三维模型,这种优化方式可让生成过程更加快速和稳定,缓解文本到三维模型生成中的多面问题(Janus Problem)。


图2:根据用户给定的粗糙三维模型和文本进行生成。

另外,不同于现有的基于隐式表达(NeRF等)的方法,Fantasia3D采用了显隐式相结合的表达,生成的3D资产可以很好地与现有的图形渲染和仿真引擎相结合。

如下图3 (a) (b) 所示,生成的三维模型可以导入Blender中进行布料和软体的物理仿真,图3 (c) 则展示了用Blender替换生成材质的实验结果。


图3: 在Blender中进行编辑。

如下图4 (a) 所示,Fantasia3D生成的模型还可在Blender中替换不同的光照,从而产生不同的渲染效果。

(b) 中展示了将Fantasia3D生成的物体插入其他场景中的能力,插入的物体能与原环境中的光照环境进行交互,从而产生自然的反射效果。


图4: 给生成物体进行重新打光。

互动小说是什么

原理方法

Fantasia3D的方法概览如下图5所示。我们的方法可以根据文本提示生成解耦的几何和外观(见图 (a) ),二者分别通过 (b) 几何建模和 (c) 外观建模生成。

在 (b) 中,我们采用DMTet作为我们的三维几何表示,这里初始化为一个三维椭球体。

为了优化DMTet的参数,我们将从DMTet提取的网格的法线贴图(在早期训练阶段还会同时使用物体掩码)渲染为Stable Diffusion的形状编码。

在 (c) 中,对于外观建模,我们引入了空间变化的双向反射率分布函数(BRDF)建模,并学习预测外观的三个分量(即kd、krm和kn)。几何和外观建模都由分数蒸馏采样损失函数(SDS loss)进行监督。


图5: Fantasia3D流程图。

总结

本文介绍了一种名为Fantasia3D的自动化文本到三维生成的新方法,基于DMTet的混合表达,采用几何和外观的解耦建模和学习,能够生成精细的表面和丰富的材质/纹理。

对于几何学习,研究人员提出将渲染的法线贴图编码,并将法线的形状编码作为预训练的Stable Diffusion的输入。

对于外观建模,引入了空间变化的BRDF到文本生成三维对任务中,从而实现对学习表面的逼真渲染所需的材质的学习。

除了文本提示外,该方法还可以根据自定义的三维形状来生成,这对用户来说更加灵活,可以更好地控制生成的内容。

另外,该方法还方便支持生成的三维资产的重新照明、编辑和物理仿真。

作者介绍


陈锐是一名华南理工大学的在读研一学生,导师是贾奎教授。他的研究兴趣在于计算机视觉和计算机图形学的结合,特别是使用生成模型和基于物理的渲染技术创建高质量的3D资产领域。


个人主页:https://cyw-3d.github.io/

陈永炜,华南理工大学GorillaLab研究生三年级。师从贾奎教授,研究方向为三维视觉,多模态学习,可微渲染,扩散模型等,相关研究工作曾在CVPR、ECCV、NeurIPS、ICCV等计算机视觉和人工智能顶级会议上发表。近期研究方向侧重探索能够自动生成3D资产的AI模型,包括材质、形状、动作和其他相关参数。

推特的ceo是谁


个人主页:http://kuijia.site/

贾奎,华南理工大学教授,几何感知与智能实验室主任,广东省「珠江人才计划」创新创业团队带头人。曾先后于中科院深圳先进技术研究院、香港中文大学、伊利诺伊大学香槟分校先进数字科学研究中心、及澳门大学从事教学和科研工作。

研究领域包括计算机视觉、机器学习、人工智能等,近年来主要侧重于深度学习理论与泛化、几何深度学习、以及3D AIGC等研究;成果发表于TPAMI/CVPR/ICML/NeurIPS等顶级期刊和会议。担任TMLR/TIP等期刊副主编及ICML/ICCV/NeurIPS等会议领域主席。

几何感知与智能实验室(Gorilla Lab)聚焦机器学习、计算机视觉、三维感知等人工智能核心方向,侧重从语义感知和内容生成等角度,以学习数据内在的几何规律性和外在的几何表征为核心方法指导,对图像、视频、点云等高维数据进行智能处理,以推进相关领域发展和产业化落地。自成立以来,实验室先后获得来自国家自然科学基金委、广东省科技厅、华为技术有限公司等数千万的经费支持。

贾奎教授实验室提供多个博士后、博士、研究型硕士及研究助理岗位,有兴趣从事人工智能、计算机视觉、三维感知与生成研究的同学,请发信至 kuijia@gmail.com 。

参考资料:

https://fantasia3d.github.io/


返回网站首页

本文评论
2021年q2中国手机市场份额「报告:2022年Q2智能手机处理器市场收益达89亿美元」
11月10日 消息:今日,StrategyAnalytics发布《2022年Q2智能手机应用处理器市场份额追踪》报告称,全球智能手机应用处理器市场收益在2022年Q2增长26%,达到89亿美元。高通、联发科...
日期:11-11
大调整!iPhone 15 Pro Max或改名为iPhone 15 Ultra_iphone12pro max怎么改名字
【手机中国新闻】前不久,苹果发布了最新一代iPhone 14系列,目前新机已经开售,其Pro系列凭借“灵动岛”的设计俘获了一众果粉的心而大卖。从iPhone 11到14系列,苹果手机的Pro Max...
日期:09-20
千亿电竞将于“Z世代”爆发?「中国电竞圈」
声明:本文来自于微信公众号 壁虎看KOL(ID:bihukankol),作者:江渔,授权转载发布。年轻热血的电竞行业展望2021:区块链十大趋势21年秋,一则西湖边某少年手舞足蹈的视频成为抖音热门...
日期:10-06
imac 新款2021发布时间「苹果新一代iMac有望下半年推出 消息称研发已进入最后阶段」
3月6日消息,据外媒报道,此前曾有消息称,苹果有望在今年年底或明年年初,对24英寸款的iMac进行更新,时隔两年多再次推出新款iMac,芯片等配置预计将会升级。但从最新的消息来看,新款iM...
日期:03-07
字节跳动推出 “剪映”PC 版:最高支持 4K 视频分辨率与 60fps 帧率_剪映1080p多少帧
  2月4日消息 字节跳动旗下视频剪辑工具 “剪映” 2 月 1 日正式推出了 PC 版应用,适用于 Windows 7 及以上 64 位系统。   剪映官网显示,剪映 PC 版支持多视频轨 / 音...
日期:07-16
带你了解华为应用市场AppGallery Connect应用分发服务
  华为应用市场AppGallery Connect自2019年4月全新改版上线以来,已陆续为160多万开发者开放了67项服务,覆盖全球170多个国家和地区。本文中,让我们来探讨AppGallery Connect...
日期:07-14
张璐soul公司_Soul创始人张璐携团队深挖元宇宙内涵 与Z世代共同探索社交新时代
2021 年是元宇宙元年,一时之间“元宇宙”三个字席卷了互联网的各个角落。而国内对于元宇宙的比较初探索也可以追溯到 2016 年上线的社交应用:Soul,其创始人张璐与团队在与年轻...
日期:08-17
Redmi Note 11发布会「小米Redmi Note 12新机上架预约 或将27日发布」
10月20日消息,今天小米的新机Redmi Note 12已经上架预约了,预约截止时间是10月27日,所以很有可能是10月27日发布。此前官方预热称,Redmi Note 12将全球首发2个“帅炸天”的新科...
日期:10-27
复旦大学与阿里巴巴达成战略合作 将共享大模型底层能力「复旦团队」
6月28日 消息:昨日,复旦大学与阿里巴巴集团宣布双方达成全面战略合作,未来将在科研融合创新、科研合作、人才培养等领域展开深入合作。小米civi白色魅族16评价基于复旦大学在...
日期:06-29
男子花两千元套圈 套中两台汽车 网友认出其是套圈网红「男子花500元套圈套中一辆20万轿车 结果万万没想到」
近日,山西运城的一家商业街举办的套圈赢大奖活动中,一位男子花费3000元买了1000个套圈,最终套中了两辆汽车,据悉其中一辆是宏光MINIEV微型电动汽车,市场售价为3.28万元起。此事上...
日期:02-07
Android视频聊天_谷歌推Android智能手机视频聊天服务 挑战苹果
  北京时间4月30日消息,据国外媒体报道,为了挑战苹果iPhone上的Facetime面部识别应用程序,谷歌专门为Android智能手机推出了自己的视频聊天服务。   与苹果Facetime软件不...
日期:07-27
00后裸辞旅游被批 家里有矿吗:本人回应:享受当下 拒绝加班「00后去哪玩」
近日,一则#辞职后去旅游发朋友圈被说了 的话题登上热搜。在相关热搜新闻中,网友鲁先生(微博@明天星期四I )自今年3月辞职后,已经在国内玩了20几个城市,并常在朋友圈分享旅途照片与...
日期:05-18
智伴优学机器人_智伴教育机器人1X荣获2019红棉设计奖,智伴小Y也榜上有名
  「红棉奖 2019 产品设计奖」获奖名单,于日前陆续揭晓。智伴教育机器人1X、智伴小Y便携机器人,双双获奖。广州智伴人工智能科技有限公司(下称「智伴科技」),成为本届红棉奖...
日期:12-23
“小扎”成全球最惨富豪!年内身家蒸发4300亿,背后公司业绩频暴雷
全球最“惨”富豪榜最近发生了变化,“华人首富”、“虚拟首富”的币安创始人赵长鹏逃出生天。   8月7日消息,《财经天下》从彭博亿万指数发现,2022年以来,Meta公司CEO扎克伯格...
日期:08-09
办伴科技 — 筝际智慧办公助力企业提前进入未来办公模式
成都 2018第八届GCUC 全球联合办公峰会成都分会于9月初召开,峰会以“Work Better,W......
日期:09-29
红米骁龙855旗舰揭秘:2340×1080无刘海全面屏加持(骁龙855旗舰机)
  虽然官方尚未宣布红米旗舰发布时间,但是有关该机的细节正在陆续揭秘。   5月6日晚间,小米集团副总裁、红米Redmi品牌总经理卢伟冰晒出了红米旗舰桌面。截图属性显示,红...
日期:04-14
小米通报汽车设计文件泄密处理结果 涉事合作方被罚100万元
2月2日 消息:据新浪科技报道,今年1月,有汽车博主发布了关于小米汽车首款车型小米MS11车型的设计图片,引发网络关注。小米集团公关部总经理王化随即回应称,泄密的文件是早期的招...
日期:02-02
杀毒软件推荐这一款:360安全卫士极速版精准查杀电脑病毒「下载360杀毒极速版」
就像人不小心感染了流感病毒,需要靠打针吃药来治疗一样,电脑中了病毒,也得采取一些解决措施才行。只不过电脑作为一台机器,没法通过打针吃药来解决,它需要寻求杀毒软件的帮助。今...
日期:05-11
2022年第三季度印度智能手机出货量4460万部 小米位居首位_2019印度智能手机出货量
10月24日 消息:今日,科技市场独立分析机构Canalys发布报告称,2022年第三季度的印度智能手机出货量为4460万部,同比下降6%。2022年第三季度中国厂商在印度整体智能手机的市场份...
日期:10-27
从公开举报到对薄公堂,格力和奥克斯在“互撕”中艰难前行「格力告奥克斯事件始末」
最近几天汽车界最热门的话题,无疑是长城实名举报比亚迪事件。“举报门”的来龙去脉各大媒体已经说了太多,在此不再赘述,该事件对两家车企的后续影响更值得关注。尴尬的是,在长城...
日期:05-30