您的位置:首页 > 互联网

清华、斯坦福、加大开源,图片生成高精准3D模型

发布时间:2023-12-27 15:41:17  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

随着ChatGPT的出现以及广泛应用,通过文本生成文本、视频、音频等内容,成为实现技术民主化的关键手段。

在3D模型领域通过文本生成并不成熟,多数方法是通过图片。而该方法存在生成时间长、缺乏细节、难以匹配图像等缺点。

加州大学、清华大学、斯坦福大学共同开发了全新模型“One-2-3-45++”并将其开源。该模型仅通过图片,就能在1分钟内将一张RGB图像转换为高精准3D模型,这对于游戏开发、3D建模等领域,可以节省大量开发时间。

研究人员在包含1030个3D对象的GSO数据集上与多个基准方法进行了比较。测试数据显示,One-2-3-45++在几何相似度、CLIP相似度指标上均优于基准方法。

在包含50多名真实用户的评估数据显示,87.6%表示One-2-3-45++生成的结果,优于其他方法,质量更高、更符合输入图像。

开源地址:https://github.com/SUDO-AI-3D/One2345plus

论文地址:https://arxiv.org/abs/2311.07885

在线demo:https://www.sudo.ai/3dgen

One-2-3-45++的核心技术原理主要包括三大块:一致的多视角图像生成、基于多视角的3D重建以及纹理优化。

一致的多视角图像生成

这一模块的作用是从单个输入图像中生成多个视角一致的图像。One-2-3-45++一共可生成6个视角的图像,布局是一个3x2的矩形网格,分别对应不同的相机位置。

为了避免生成的3D形状存在方向歧义,这6个相机位姿使用绝对高度角以及相对方位角来定义,同时使用了预训练文生图模型Stable Diffusion作为生成器。

此外,使用了Objaverse数据集中的3D形状进行微调。对每个3D形状,生成3个训练样本,分别对应不同的输入图像视角。同时使用统一的HDR环境光进行渲染,以提升细节、光影效果。

基于多视角的3D重建

上一个模块我们已经有了6个对象的多视角图片,这个模块就是要把二维的图片转换成3D模型。

具体做法是先用6张图片生成一个低分辨率的三维体积元素,近似表示整体形状。然后在体积元素里面生成更高分辨率的“体积元素”,捕捉表面细节。

魅族懂事

体积元素就是用小立方体组成的三维矩阵。这里有两种体积元素,一种SDF体积元素,记录了一个位置到物体表面的距离;另一种是颜色体积元素,记录一个位置到物体表面最近点的颜色。

同时这6张图片是生成体积元素的条件,先从图片里提取二维特征,然后反投影到三维空间构建一个三维特征体,这个体包含了多视角的先验信息,可以指导三维模型体积元素的生成。

纹理优化

经过前面两个步骤生成的3D模型,在颜色、质量、纹理方面还比较粗糙,所以需要进行优化达到最终效果。同样可以利用前面6个视角的图像,来增强最终网格模型的纹理质量。

小米12镜头

方法是固定住网格的三维结构不变,仅优化表示颜色的网络。每次迭代中,用当前的颜色网络渲染网格,生成二维图片。然后与之前生成的多视角图片计算损失,更新颜色网络。

这样通过不断地优化,网格表面的颜色信息会逐渐跟多视角图片越来越接近,从而实现纹理的提升。


返回网站首页

本文评论
AgileSecu 案例分享 | 为区块链金融行业网络安全保驾护航
行业背景:区块链技术作为互联网金融行业的前沿技术,在国际汇兑、信用证、股权登记和证券交易所等金融领域有着巨大的应用价值。今后,区块链技术亦进一步加速数字经济发展的新型...
日期:12-13
Chrome新功能标签组下周上线:效率大增 网页强迫症舒服了(chrome新标签页设置)
  5月13日,谷歌在官方专门介绍了即将于下周上线的Chrome浏览器新功能——标签组。   标签组是谷歌在Chrome 81中增加的新功能,已于Chrome Beta中上线,并且将于下周开始陆...
日期:06-04
余承东华为开发者大会_余承东:今年华为中高端机支持5G 明年产业全面转向5G
  8月9日下午消息,在华为开发者大会上的采访中,华为消费者业务CEO余承东表示,今年华为的中高端手机会全面支持5G,而明年整个智能手机产业会全面转向5G。   他表示,5G的到来...
日期:01-22
中国电信粤港澳大湾区一体化数据中心(一期)土建项目正式封顶
9月16日,中国电信粤港澳大湾区一体化数据中心(一期)土建项目10-1地块正式封顶,标志着韶关国家级数据中心集群建设迎来重要的里程碑。恰饭b站是什么意思苹果手机国产柔性屏据悉,中...
日期:09-19
30余名ChatGPT训练派遣工遭解雇 因训练效果未及预期
4月24日 消息:3月份,30余名帮助培训爆火聊天机器人ChatGPT背后语言模型的派遣工被解雇,Slack内部聊天截图显示,总部位于旧金山的外包公司Invisible Technologies解雇了31名派遣...
日期:04-24
齐心抗“疫” | 希沃携手长春汽开区开设公益空中课堂
  为有效应对新型冠状病毒疫情, 2月11日,吉林省教育厅下发吉林省延期开学的通知,要求2月24日起,吉林省中小学全面实施网上教学,保证学校在延期开学期间“离校不离教,停课不停学...
日期:11-11
吃火锅晒照误露点餐码被人点43万菜 网友:人心险恶啊_北京男子吃火锅点菜一千多被服务员提醒别浪费
近日,一则关于女生在吃火锅时晒出点餐二维码的新闻引起了社交媒体的广泛关注。据报道,这位女生与同学在云南昆明的一家火锅店聚餐,无意中将照片分享在朋友圈,结果露出了桌上的点...
日期:11-25
小米civi的cpu「小米Civi 2用上骁龙7芯片:号称36个月不卡」
小米Civi 2手机在今天正式发布,新机搭载了骁龙7芯片,这也是该芯片在市面中的首批机型,而且小米Civi 2手机还配备了前置双摄及后置5000万像素大底三摄,同时性能也很强大。这款处...
日期:09-28
鲁大师 sli「鲁大师5月新机性能/流畅/久用榜:蓝绿厂霸榜、天玑骁龙交锋」
  性能榜  6. 18 年中购物节前夕,一众厂商开始扎堆发布新机冲销量,也导致本月的新发机型数量达到了 19 款。  从品牌来看,ov两家和其子品牌、独立品牌就占据了十二台。从...
日期:06-06
马斯克在个人微博直播玩《暗黑破坏神4》 有91.5万观众_马斯克直播说了啥
2023-10-08 06:41:02 作者:姚立伟 m1 macbookpro和m1 macbook air读孟晚舟演讲有感近日,特斯拉创始人埃隆·马斯克在其个人微博账户“IWillNvrDie”上直播了热门游戏《暗黑破...
日期:10-08
特斯拉model 3改色膜案例两种色「特斯拉在美国市场为Model 3/Y推出改色服务:售价 7500-8000 美元」
IT之家 10 月 11 日消息,特斯拉在美国市场为新款 Model 3 和 Model Y 推出了改色服务,提供 7 款工厂原装彩色车衣,售价 7500-8000 美元,将由特斯拉线下服务中心完成施工。这七款...
日期:10-11
Twitter 将从 2 月 9 日起向开发者收取 API 访问费以谋求更多利润
2月3日消息:从2月9日起,Twitter将不再提供对Twitter API的免费访问。日前Twitter官方开发者账户宣布将停止支持对Twitter API的免费访问,而是提供一个付费的基础层面来访问其A...
日期:02-03
优信2022财年第四季度营收5.1亿元 同比增长158%_优信2020财报
查看最新行情   讯 北京时间7月28日晚间消息,优信(Nasdaq:UXIN)今日发布了截至2022年3月31日的2022财年第四季度及全年财报。第四财季,该公司总营收为5.05...
日期:07-31
曝网易起诉亚马逊AWS违约,因其不履行合同规范
  讯 4月6日上午消息,获悉,近日网易已就亚马逊云科技(AWS)违约向北京朝阳区人民法院提起诉讼。起诉内容涉及AWS在网易多次明确通知后仍不履行合同义务,违反协议约定。据悉,相关...
日期:04-06
你手机装了多少个APP?中国活跃APP数量达261万款「中国app总量」
快科技7月1日消息,根据全国APP技术检测平台统计,截至5月底,我国国内市场上监测到活跃的APP数量为261万款。这261款包括安卓和苹果商店之和,两者数量几乎对半分,因为开发者往往会...
日期:07-02
京东运费理赔强制开启小金库「京东物流:“全额保”24小时理赔打款及时率达到99%」
10月28日 消息:近日,京东物流官方表示,“全额保”上线一月以来,24小时理赔打款及时率达到99%,最快一单打款时长仅为13分钟。京东电脑数码大促9月29日,京东快递全新保价服务“全额...
日期:10-31
一日两单 中国公司赴美上市热度不减(完成日订单200万后赴美上市)
中国公司赴美上市的热络势头仍在继续。12日,凤凰新媒体和正兴车轮集团两家中国公司同时登陆纽交所。其中,凤凰新媒体首日大涨34%。来自汤森路透的统计显示,今年迄今的短短四个...
日期:07-27
Q2全球前五大手机品牌排名出炉:小米市占率第三、国产第一  环比领涨
快科技7月27日消息, Canalys发布的数据报告显示,2023年第二季度,全球智能手机市场同比下降10%,达2.58亿部,市场衰退有所放缓。从品牌来看,三星以5300万部的出货量稳居榜首。苹果以...
日期:07-27
字节跳动推出 “剪映”PC 版:最高支持 4K 视频分辨率与 60fps 帧率_剪映支持最大分辨率
  2月4日消息 字节跳动旗下视频剪辑工具 “剪映” 2 月 1 日正式推出了 PC 版应用,适用于 Windows 7 及以上 64 位系统。   剪映官网显示,剪映 PC 版支持多视频轨 / 音...
日期:07-10
4799元没人买账!RTX 4070价格“一泻千里” 一周跌去9%
从产品线布局和更新换代的角度来看,RTX 4070 4799元起的价格并不算离谱,而且不少超频版也直接来到起步价,似乎挺良心了。但是,市场和用户对于RTX 4070并不买账,上市一天之内国内...
日期:04-21