您的位置:首页 > 互联网

魔改Stable Diffusion,开源创新“单目深度估计”模型

发布时间:2024-01-02 20:15:23  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

单目深度估计一直是计算机视觉领域的难点。仅凭一张 RGB 图像,想要还原出场景的三维结构,在几何结构上非常不确定,必须依赖复杂的场景理解能力。

即便使用更强大的深度学习模型来实现,也面临算力需求高、图像数据注释量大、泛化能力弱等缺点。

为了解决这些难题,苏黎世联邦理工学院的研究人员开发了Marigold模型。Marigold不需要从零开始训练,而是在Stable Diffusion(著名开源文生图模型)的基础上进行微调,只需要使用合成数据微调了中间的去噪网络,其他模块例如,编码/解码结构均保持原样,极大降低了训练成本。

实验数据显示,尽管Marigold从未直接学习过真实的深度信息,但在真实场景的测试中,其性能却超越了其他专门训练过的模型,并且迁移、兼容性非常强。

开源地址:https://github.com/prs-eth/Marigold

论文地址:https://arxiv.org/abs/2312.02145

Marigold的核心技术思路是,利用Stable Diffusion模型所捕获的丰富先验知识,来提升深度估计的泛化能力和性能。

简单来说,就是把Stable Diffusion当成一个图片查询数据库,只修改其去噪模块,就变成了可实现单目深度估计的全新模型。

以太坊矿业

Marigold的关键点在于保持预训练扩散模型的潜在空间,只对去噪U-Net进行修改和微调。

这种方法非常高效,无需实际深度图像的训练数据,就能在多个真实数据集上取得出色的性能表现。

Marigold提供了一个简单而资源高效的微调协议,将预训练的扩散生成模型转化为图像条件的深度估计器,成为了一种功能强大的单目深度估计模块。

Marigold通过使用合成的RGB-D数据以及在一块消费级显卡上只训练了几天,将Stable Diffusion转化为Marigold模型。主要流程如下:

去噪U-Net

研究人员主要通过修改和微调Stable Diffusion模型的去噪U-Net模块,来实现深度估计。去噪U-Net是一个编码器-解码器结构的神经网络,用于从输入图像中学习去除噪声的表示。

在Marigold模型中,研究人员保持了扩散模型的潜空间不变,只对去噪U-Net模块进行微调,以适应深度估计任务。

合成数据训练

为了微调Marigold模型,研究人员使用了合成的RGB-D训练数据,对模型进行训练。合成数据是通过在虚拟环境中,渲染图像并生成对应的深度图来创建的。

通过使用合成数据进行训练,Marigold可以学习到广泛的场景和物体形状,从而提高其在未见过数据集上的泛化能力。

仿射不变深度估计

Marigold使用了一种仿射不变的深度估计方法,能够估计图像中每个像素的深度值,而不受全局偏移和尺度的影响。

这种仿射不变性对于在不同场景和尺度下进行深度估计非常重要。通过估计仿射不变的深度,Marigold可以消除由于相机内参的不确定性,而引入的深度估计误差。

tcl王牌彩电怎么样


返回网站首页

本文评论
消息人士:台积电获更多中国大陆AI芯片供应商订单「台积电芯片代工份额」
据电子时报报道,尽管中美之间的紧张关系加剧,可能会导致针对中国大陆的人工智能(AI)GPU受到更多限制,但自今年第一季度以来,中国大陆的AI芯片设计公司正在扩大台积电7纳米工艺的芯...
日期:07-11
在天猫获超1000万名会员数品牌已超40家「天猫销售过亿的品牌」
10 月 8 日消息,距离今年天猫双 11 还有一个月。数据显示,在天猫获得超过 1000 万名会员的品牌已超过 40 家。据介绍,会员可以让品牌直接服务消费者,是品牌在天猫双 11 实现确定...
日期:10-10
华为2022年净利润356亿  官方回应重新设计1.3万颗元器件:这项工作已经结束了
3月31日,在华为2022年年度报告发布会上,对于任正非此前过去3年华为重新设计了13000多个各种元器件”的表述,轮值董事长徐直军表示,可能任总记错了,他认为应该是10年,华为从2012年...
日期:04-01
业绩下滑股价大涨?新东方2022财年亏逾11亿美元,营收展望仍大幅下降
万物新生和爱回收 查看最新行情   记者/胡振明   7月27日美股收盘,新东方(EDU.N)上涨7.03%。7月28日,港股新东方在线(01797.HK)和港股新东方-S(09901.HK)开盘...
日期:07-31
建筑面积不低于3000平方米 网传小米汽车开始筛选交付中心_小米汽车建在哪里
【】7月7日消息,近日有微博网友@长三角行健者爆料称,据经销商集团反馈,小米汽车目前已经开始了交付中心的筛选工作,要求候选场地至少有120个车位,建筑不能低于3000平。云之家oa登...
日期:09-21
小鹏汽车旗下公司增资至18.8亿「小鹏汽车投资全部股东」
1月5日 消息:企查查APP显示,近日,广州鹏跃汽车发展有限公司发生工商变更,公司注册资本由15亿元人民币增至18.8亿元人民币。企查查信息显示,该公司成立于2021年,法定代表人为夏珩,...
日期:01-05
湖北移动进村入户服务春耕生产  助力精准扶贫
  目前,全国已进入春耕时节。近日,中国移动湖北公司精准扶贫队员走进农村,与春耕备耕困难户结成帮扶对子,帮助农民想办法、找路子,为群众提供物资和信息服务支持,解决农民在...
日期:07-16
好莱坞科幻巨制续作来了!《沙丘2》确认引进中国内地_沙丘2 上映
快科技12月14日消息,据电影沙丘2”官微消息,好莱坞科幻巨制续作《沙丘2》发布中字版新预告,宣布确认引进中国内地院线。影片将于2024年3月1日北美上映,中国内地上映时间暂未定档...
日期:12-15
微信视频号:预计投入50亿流量帮助新主播开播 完善变现工具和激励政策
1 月 10 日讯:在今日的 2023 微信公开课PRO上,内容主要从短视频、直播以及直播带货三个维度展开。在会上,微信视频号团队宣布, 新一年预计投入 50 亿流量,持续帮助新主播开播。...
日期:01-10
box 马斯克「马斯克:Cybertruck具有“野兽模式”,已测试防弹性能」
11月1日消息,美国时间周二,特斯拉首席执行官埃隆·马斯克(Elon Musk)参加了一档播客节目,重点介绍了电动皮卡Cybertruck的情况,例如整车重量、百公里加速和防护能力等。他还表示特...
日期:11-01
抖音带货杀出黑马,开播两天GMV破亿「抖音带货GMV」
声明:本文来自于微信公众号 电商头条(ID:ecxinwen),作者:李松月,授权转载发布。MCN机构下场带货,开播次日GMV破亿近日,一个名为“遥望未来站”的新秀直播间引起了业内关注。9月19...
日期:10-03
马斯克为"反犹"帖子道歉,但炮轰广告商:拿这事敲诈我?去你的吧
11月30日消息,周三,埃隆·马斯克(Elon Musk)在美国纽约举行的2023 DealBook峰会上发表讲话,炮轰广告商因为他发表的不当内容抵制社交媒体平台X。马斯克说:“有人想用广告敲诈我?...
日期:11-30
小学生受到校园欺凌怎么办「小小年纪“染上”网络欺凌怎么办?」
  来源:法治日报  □ 本报记者  韩丹东  □ 本报实习生 关楚瑜三星S7拆机  近日,一名来自广东的高一学生林芝(化名)向《法治日报》记者打来电话求助,称自己只是在网上...
日期:09-09
华为Mate 50确定9月6日14:30亮相,旗下新机通过认证「华为mate 50上市时间」
此前,华为官方确认将于9月6日带来Mate50系列及全场景新品秋季发布会。届时,备受关注的华为Mate50系列旗舰将会正式亮相。今天,华为官方再次对发布活动进行了预热,并公布了确切的...
日期:09-15
小米12S减600元:跌价24期免息 到手3399_小米10s大降价
马上双十一,很多手机厂商已经提前一个月就开始了促销活动,小米作为每年双十一促销力度最大的手机厂商之一,今年也不例外,小米12S手机立减600元,现在到手只要3399元了,而且还能跌价...
日期:10-25
“玻璃大王”曹德旺100亿建的大学明年招生 有需要还会再捐100亿「曹德旺出资100亿建大学图片」
去年5月,75岁的曹德旺宣布100亿筹建福耀科技大学(暂名)”。首栋楼明德堂及行政楼现已封顶,预计明年10月底竣工,2024年秋季全面招生。学校规划的办学层次为本科和研究生学历,办学规...
日期:11-27
超清再现-当经典老港片遇上视觉大模型「香港视觉」
【】8月18日消息,30年前的老电影,如果修复成4K画质,你会去看吗?近日,4K修复版《武状元苏乞儿》《蜀山:新蜀山剑侠》等多部经典老港片在抖音上线,引发了一波怀旧热潮。香港电影曾是...
日期:09-17
优秀贯标企业!腾讯云数据库TDSQL、操作系统TencentOS首批通过强制性国标GB18030-2022认证
(原标题:优秀贯标企业!腾讯云数据库TDSQL、操作系统TencentOS首批通过强制性国标GB18030-2022认证) 8月21日,在中国电子技术标准...
日期:08-21
iPhone 15 Pro Max已经确定,很漂亮,还有你期待许久的新功能_苹果15款pro值得买吗
在 iPhone 14 系列这代,销量最好的是 Pro Max,而销量最差的则是 Plus。两者的共同点是「大」,但后者的升级幅度远不如前者。那么到了今年的 iPhone 15 系列,这两款大机型又会带...
日期:07-17
卡巴斯基:浏览器成恶意程序突破口
  近日,国家计算机病毒应急处理中心通过对互联网的监测发现“木马下载器”新变种(Trojan_Downloader.VNK)再次现身于互联网,目前已严重威胁到互联网用户的上网安全。与此同...
日期:07-24