您的位置:首页 > 互联网

AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law_ai生成3d模型

发布时间:2024-09-20 16:25:54  来源:互联网     背景:

声明:本文来自于微信公众号量子位,作者:衡宇 西风,授权转载发布。

《黑神话·悟空》的火爆,带火的不仅是3D游戏本身,还有背后暗潮汹涌的AI3D生成技术。

一直以来,外界对3D大模型赛道的关注度都稍逊于语言模型和视频模型。然而,全球3D大模型选手们则都在暗中较量、默默发力,从a16z押注的Yellow,到李飞飞的World Labs,3D大模型的迭代速度是没落下一点。

就在刚刚,国内3D大模型头部玩家VAST更新了旗下的大模型Tripo,是基于千万级高质量原生自有数据库训出来的那种超强版本。

而3D生成新工具的玩法也更进一步,文字、单图、多图都能作为输入

至于几何精细度和图片还原度等方面的效果嘛,先小放一段用新工具生成3D模型的视频,大家直观感受一下

在官宣新品之余,VAST又带来另一则重磅消息,即公司连续完成了数亿元融资,这也是3D大模型赛道的最大融资金额。

当然,融资方面的引领,也只是技术实力的展现。因为VAST的技术和应用场景,确实够顶。

快速生成无瑕疵,效果惊艳

再次拉升AI3D天花板的模型叫做Tripo2.0

Tripo2.0先在几秒内生成形状几何预览,再接着几秒内为其“贴上皮肤”,⽣成纹理及PBR

目前Tripo2.0已正式上线,大批网友已经开启了实测。

量子位也在第一时间凑上了热闹。

Tripo2.0支持文生3D、单图生3D;Tripo1.4版本也支持多图生3D。

输入一个prompt,一次能生成4个3D模型。

根据输入的不同,量子位的上手实测结果在下面分为两个部分,即:

  • 生3D模型

  • 图生3D模

Tripo2.0文生3D模型实测

话不多说,直接先来看一波文生3D效果。

第一步,生成几何形状动漫少女的半身形象。

就复杂结构生成效果来看,细节还是很足的:

ai3d画效果图

接下来给它贴好皮肤。

在不超过20秒的生成时间里获得精细的纹理和层次;普通水平的人工建模要达到这种细节,耗时可能要上千倍。

ai 3d设计

换一道题!用Tripo2.0生成卡通形象的全身形象试试看。

先生成个卡通小矮人试试~

出来的效果,那是相当可爱(发出宋丹丹的声音),belike:

用ai做3d图形

我们又生成了一个小怪物,并且把单个生成的模型放大来看。

360度旋转,肉眼没有发现bug和瑕疵。要知道,怪物后背密密麻麻的尖刺细节,是人工建模师的噩梦,一般都会规避这种繁复的设计,但是对tripo来说毫无压力。

ai生成3d模型

加大难度,再复杂一些3D模型生成任务也同样能驾驭。

透视结构理解过去一直是生成式AI的卡点,以生图模型的手指问题为代表。3D模型空间结构极为重要,我们可以看到Tripo强大的透视结构理解能力,完美生成了复杂结构的模型任务。

ai实现3d建模

最后再放个厉害的,下面这个购物车什么难度都不用多说了:

ai3d怎么做

Tripo2.0图生3D模型实测

再来看一波图生3D的效果。

单图生3D模型的算法最考察对图片的空间信息理解和还原度,这次我们横向对比一些市场的其他玩家效果。

友情提示,下面每张展示图中的最后一个3D模型,都由Tripo2.0生成

来,上一支玫瑰花的图生模型对比展示!

对比可以清晰看到,只有它生成的几何形状360度无死角,花朵和枝叶完整度最高:

ai3d画效果图

贴图之后,在还原原图的颜色、质感这一块,也是效果最好的:

ai 3d模型

测完植物生成效果,我们又测试了无生命物体的图生模型。

丢给模型一个俄罗斯复活节彩蛋图片作为输入,Tripo2.0的输出效果最有“浮雕感”,对比来看,纹理细节都是最精致的:

ai做3d模型

进行多次测试后,不难发现Tripo2.0在全方位的生成表现上都有显著差异。

比如生成的PBR材质具有⾼保真度,保留了原图表⾯属性和视觉效果:

ai做3d模型

再比如,不管侧面、背面,每个面都能捕捉复杂的原图特征:

ai3d画效果图

Tripo2.0不仅生成质量让人眼前一亮,更高的可控性也是一大特点。

输入不仅支持多模态,当选择文生3D模型模式时,还支持输入负向prompt(就是不让生成模型中带有什么元素)。

用ai做3d图形

对输出模型姿态的控制性也很绝。

既能自定义所生成3D模型头、腿、手臂等比例。

还能“A-pose”“T-pose”两个姿势随便选,秒秒钟设定大长腿:

用ai做3d图形

生成好的3D模型还可以一键绑定骨骼、风格化。

3D模型人拥有自己的乐高!

ai3d功能

更多玩法大家可以慢慢探索,欢迎大家评论区共创~

Tripo2.0效果如此哇塞,所以——

Tripo2.0如何炼成?

从技术上层层解剖,Tripo2.0在实现过程中打满了一个词:3D Scaling Law

首先,Tripo2.0基于海量千万级3D⾼质量数据库,采⽤概率性的⽣成式建模⽅法,通过学习捕捉⼤规模数据中的⼏何和材质分布。

由此,Tripo2.0更好地保证了输出的质量、增强了模型的鲁棒性和泛化能⼒。

其次,它采用了DiT和U-Net模型的复杂混合架构

DiT擅⻓捕捉3D结构中的全局上下⽂和⻓距离依赖关系,而U-Net精于保留精细的细节和局部特征,Tripo2.0正是融合了这两种架构的优势。

再者,采⽤最先进的训练算法,Tripo2.0⼏何和材质⽣成模型均基于最先进的⼤规模流模型,拥有数⼗亿参数

同时采⽤了guidance distillation和step distillation,通过蒸馏提⾼效率,在不牺牲质量的前提下⼤幅优化了性能。

种种技术加持下,在3D生成形状、纹理质量、细节表现、输⼊条件的遵循性以及输出多样性⽅⾯,Tripo2.0拿下新SOTA,成为新晋“五边形”战士:

ai3d画效果图

之前,Tripo2.0背后团队还与其他团队合作,推出了一箩筐学术成果,被Siggraph、CVPR、ICLR、ECCV等顶会接收。

比如Wonder3D,通过一个跨域扩散模型生成一致性的多视图法线贴图和相应的彩色图像,然后利用一种新颖的法线融合算法快速、高质量地重建3D几何体。

与现有的基于分数蒸馏采样(SDS)的方法相比,Wonder3D在效率、一致性和细节上都有显著提升,能够在2-3分钟内完成重建。

再比如TGS:Triplane Meets Gaussian Splatting,同样被CVPR2024收录。

这项技术利用Transformer网络和一种新颖的Triplane-Gaussian混合表示,使得从单张图片中重建3D模型变得更加高效和精确。

更多细节,感兴趣的童鞋可以自行查阅。

总之,Tripo2.0并非一蹴而就,背后有众多技术积累。

南纺股份600250

3D世界的Scaling Law

最后,我们来正式认识一下Tripo2.0背后的公司。

VAST,去年3月成立,是一家专注于在3D大模型研发的AI公司。

公司目标是“通过打造⼤众级别的3D内容创作⼯具,建⽴3D的UGC内容平台,让基于3D的空间成为用户体验、内容表达、提升新质⽣产⼒的关键要素。”

公开资料显示,该公司的CEO、CTO都是商汤出身:

创始人兼CEO宋亚宸,曾在商汤落地过多个从零到一的AI项目,曾参与大模型六小强之一MiniMax的创立;CTO梁鼎,清华本硕博,师从戴琼海院士,曾任商汤通用模型负责人。

ai3d功能

成立一年半以来,这家公司动作频频。

首先在今年年初,亮相了自家首个3D大模型Tripo1.0

Tripo1.0参数量数十亿,用上它,从单图/文字生成3D网格模型仅需要8秒。

ai 3d建模

3D建模经典之牛油果扶手椅,Tripo1.0生成

上线半年内,Tripo1.0全球用户生成的3D模型超过了500万个。

500万个是什么概念呢?约为全球前三大3D模型数据库总和。

ai做3d模型

到了今年3月初,VAST又联合Stable Diffusion背后的Stability AI,共同推出了开源的3D基础模型TripoSR

因其能够达成“0.5秒完成单图生成3D模型”的成就,在3D生成领域的开源届广受欢迎,至今GitHub上揽星4.3k。

ai做3d模型

现在,Tripo2.0又问世了,已经在线可玩。

得益于3D Scaling Law带来的效果提升,Tripo的这三次更新时间跨度仅仅有9个月。

而且有速度也有质量,效果在业内外颇受认可。

拿一则新消息来佐证一下:不久前,世界最大在线游戏开发平台Roblox官宣入局AI3D生成,但截至目前,Tripo都是Roblox玩家最风靡的3D建模的趁手工具。

ai生成3d模型

接下来的VAST会带着Tripo去向什么方向?

量子位寻回的答案是,至少在技术方面,VAST会持续追寻3D生成式AI的Scaling Law研究模型规模、数据量和生成质量之间关系的基本原理,同时寻找数据、表征和模型架构的可扩展范式。

既致力于推动3D生成式AI的边界,也会不断探索更整体的(Holistic)3D生成。

就还挺令人期待的。

在语言模型和视频模型带给这个世界一点小小震撼过后,人们也希望3D生成赛道能滋养出属于自己的ChatGPT时刻。

毕竟3D的AI生成与其它AI生成赛道相比,情况比较特殊,不仅AI生成后人工二改技术难度大,如果模型效果表现不好,想要仅凭增加抽卡次数来达到满意度,不如趁早自己画(不是)。

好在3D生成行业深孚众望,一路前行着——

回顾过去的两年时间,尤其在2023年末到2024年间,3D生成技术得到了快速发展。

不仅在效果、速度方面均有提升,还实现了“效率高、成本低、创新性强和可定制性强”的特点。

技术飞快进步的同时,整个行业的人才密度都在不断增大。

国内,以VAST为代表,初创公司多来自全球知名高校和科研机构;放眼国外,AI教母李飞飞首次创业成立的空间智能公司World Labs,也着眼于3D生成世界,宣布长期目标是构建大世界模型(LWM)来感知、生成3D世界并与之交互。

众人拾柴火焰高嘛。

可以说,因为人才与技术、效果与场景的清晰和进步,现在AI3D生成这个赛道,渐渐走进了更多人的视野之中。

而3D Scaling Law或将带来的突破性进展,似乎已经预示了人工智能领域下一个焦点的方向。


返回网站首页

本文评论
永劫无间最低什么配置可以玩「网易《永劫无间》手游最低配置需求出炉:骁龙845、苹果A12就能玩」
快科技7月25日消息,网易《永劫无间》手游已于今天上午10:00公测开服,游戏支持安卓、iOS和PC模拟器设备三端。《永劫无间》手游最低配置和推荐配置如下:美国27家大公司裁员超10...
日期:07-25
gp版什么意思「ChatGPT王炸升级!更强版GPT-4上线,API定价打骨折,发布现场掌声没停过」
声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:梦晨 明敏,授权转载发布。ChatGPT,今天裂变成无数个GPT。OpenAI在首届开发者日上,正式公布自定义GPT。还将上线“GPT商店”,与...
日期:11-07
全球第三富豪贝索斯订婚!他要与“新欢”把大部分净资产捐出去
每日经济新闻消息,据美国有线电视新闻网5月22日报道,一位知情人士表示,亚马逊创始人杰夫·贝索斯和女友劳伦·桑切斯已订婚,但目前还未透露有关求婚或婚礼计划安排的更多细节。...
日期:05-26
上海:推动元宇宙重大应用 构建通用大模型「包含了元宇宙概念头部企业,首次覆盖vr」
6月15日 消息:6月15日,上海市人民政府办公厅印发《上海市推动制造业高质量发展三年行动计划(2023-2025年)》的通知。通知表示,布局新赛道和未来产业。落实“四个新赛道”“五大...
日期:06-15
轻启动怎么屏蔽广告「被律师函警告!轻启动App宣布将移除广告自动跳过功能」
快科技8月25日消息,近日,多款支持跳过开屏广告的安卓App都收到了中国最大互联网综合服务提供商之一的律师函警告”,包括李跳跳”叮小跳”大圣净化”等App相继宣布无限期停更或...
日期:08-25
传谷歌欲帮助第三方私募基金收购雅虎_谷歌经过几轮融资
10月23日消息,据国外媒体报道,据一位知情人士称,谷歌至少与两家私募基金谈判有关帮助他们融资以收购雅虎核心业务的事情。 这位知情人士称,谷歌和潜在的合作伙伴的谈判还处...
日期:07-24
手机内存1tb的手机哪款比较实惠存储空间大有优势_揭秘四款1TB内存手机的超强性能与使用体验
来源:中关村在线在这个信息爆炸的时代,人们对智能手机的要求日益提高,不仅要求基础功能完善,还需要能满足他们多元化的生活需求。为此,本文将向大家介绍四款内存达到1TB的大容量...
日期:12-07
新春好礼“鼠”不尽 坚果Pro 3携抖音新年礼盒钜惠来袭
  2020新春佳节即将到来之际,坚果手机为广大消费者精心准备了年货节惊喜。除了坚果手机限时直降500元的钜惠之外,此次坚果手机还联动抖音推出了亮眼的“抖音新年礼盒”,为广...
日期:05-15
端午假期火车票今起开抢!民众出行热度或堪比“五一”「端午放假3天不调休 首日火车票即将开售 附购票日历」
快科技5月23日消息,根据官方公布的假期安排,6月8日-10日将迎来端午节假期,共三天假,无需调休。假期首日(6月8日)的火车车票将于5月25日正式开售,放假前一天(6月7日)的车票将于5月24日...
日期:05-23
蓝信首次披露:超3000家大型政企使用,用户已超过700万(蓝信是国企吗)
  “面向大型政企远程办公平台的蓝信,用户已超过700万,已有超过3000家大型政企客户开通并使用。”在2月10日蓝信远程办公解决方案暨电子签约活动线上发布会上,蓝信移动CEO路...
日期:07-10
代码显示谷歌正研发同时使用Wi-Fi和数据线传输数据的技术-手机换机更轻松
来源:中关村在线土耳其发生6.8级地震 新闻谷歌正在开发一种新的手机数据传输方法,旨在加快设置新设备的速度。目前,转移数据到安卓设备有几种方式:使用兼容数据线连接两台设备、...
日期:05-06
瓴羊重磅发布数据服务枢纽“瓴羊港”,推动企业数据流通及价值增长
通信世界网消息(CWW)11月1日,在2023云栖大会“数据流通和企业价值增长”专场,瓴羊正式发布数据服务枢纽——“瓴羊港”,破解企业长期面临的数据缺失、数据资产难以管理、外部数据...
日期:11-02
曹远征:低碳经济将成为对抗世界经济脱钩的重要力量「低碳经济是为了应对」
  讯 12月16日上午消息,由新浪财经客户端、联合主办的“2022科技风云榜”线上年度盛典今日开幕。中银国际研究公司董事长、中国宏观经济学会副会长曹远征在演讲中指出,低碳...
日期:12-16
年货与钱包不能两全?拿到百度红包的我笑了
欲过大年,先要通关! 除了烫头美甲搓大澡、上街购衣接睫毛, 买年货也是一项雷打不动的通关项目! 回忆里的花生瓜子冰糖葫芦各色糖果, 都是屁颠屁颠跟妈妈逛百货大楼的战果。...
日期:10-28
iPhone 15新配色曝光 包括绯红色、青绿色等_iphone15什么样子
7月11日 消息:据网友爆料,苹果公司计划在即将推出的iPhone15Pro上推出一种全新的颜色:绯红色。除了这个新的颜色选择,还有青绿色。这样的颜色组合为苹果iPhone15系列增添了更...
日期:07-11
随时奉陪-马斯克再提跟扎克伯格单挑,任何规则_马斯克zip
7 月 25 日消息,特斯拉 CEO 埃隆・马斯克再次挑衅马克・扎克伯格,他在周三出席美国国会听证会时表示,愿意随时与扎克伯格进行“任何规则”的格斗。特斯拉fsd2.0 中国马斯克的最...
日期:07-26
余承东的简历是真“简单”:30年 只为华为!「余承东离开华为了吗」
如果说任正非是华为的主心骨,余承东毫无疑问就是华为冲锋在最前线的猛将,而且30年来始终如一!快科技9月14日消息,今天网上传出一份余承东的简历”,其中在工作经历部分是相当的简...
日期:09-14
马斯克将在 Twitter上与两位国会议员讨论人工智能立法问题「马斯克谈人工智能」
7月12日 消息:特斯拉首席执行官埃隆马斯克将在 Twitter 上与两位国会议员进行关于人工智能的讨论。这两位议员分别是民主党的罗卡纳和共和党的迈克加拉格尔。这次讨论的目的...
日期:07-12
比4680更强 宁德重申麒麟电池一季度量产:10分钟快充 1000公里续航_4680电池缺点
作为全球动力电池一哥,宁德时代在电池技术上准备了多条技术路线,去年发布了麒麟电池,比4680圆形电池性能更优秀,可轻松实现电动车1000公里续航,解决续航焦虑。麒麟电池的进展也是...
日期:02-08
华为10月发布会曝光,继续押注折叠屏_华为10月发布会曝光,继续押注折叠屏的手机
据爆料,华为在10月份将有一场发布会,这也是在9月份的秋季发布会之后,又一波新品即将面世。来自数码博主提供的信息,华为10月份发布会定在本月底25号左右,新品包括华为P50Pocket n...
日期:10-21