您的位置:首页 > 互联网

小扎亲自官宣Meta视觉大模型,自监督学习无需微调,多任务效果超OpenCLIP

发布时间:2023-04-18 17:42:50  来源:互联网     背景:

声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:萧箫,,授权转载发布。

无需文字标签,完全自监督的Meta视觉大模型来了!

小扎亲自官宣,发布即收获大量关注度——

在语义分割、实例分割、深度估计和图像检索等任务中,这个名叫DINOv2的视觉大模型均取得了非常不错的效果。

甚至有超过当前最好的开源视觉模型OpenCLIP之势。

虽然此前Meta就发布过自监督学习视觉大模型DINO,不过这次AI识别图像特征的能力显然更进一步,准确分割出了视频中的主体:

可别以为DINOv2通过自监督学会的只有图片分割。事实上,它已经能根据不同类别、不同场景下的照片,准确识别出同种物体(狗)的头部、身体和四肢长在哪:

换而言之,DINOv2自己学会了找图像特征。

目前Meta官方不仅已经放出了开源代码,而且还给了网页版Demo试玩。有网友内涵:

什么叫开源,LLaMA,SAM,DINOv2这才叫开源!

一起来看看,DINOv2的效果究竟如何。

准确识别不同画风的同种物体

事实上,DINOv2是基于上一代DINOv1打造的视觉大模型。

这个模型参数量是10亿级,也仍然是视觉Transformer架构(ViT),但与DINO不太一样的是,这次DINOv2在数据集上经过了精心挑选。

一张图看懂谷歌pixelbook

具体来说,DINOv2构建了一个数据筛选pipeline,将内容相似的图片精心筛选出来,同时排除掉相同的图片:

最终呈现给DINOv2的训练数据图片虽然没有文字标签,但这些图片的特征确实是相似的。

采用这类数据训练出来的视觉模型,效果如何?

这是DINOv2在8个视觉任务上的表现,包括语义分割、分类、深度估计等,其中橙色是自监督方法的效果,深粉色是弱监督方法的效果。

可以看见,经过自监督学习的视觉模型,表现上已经与经过弱监督学习的模型性能相当。

实际效果也不错,即便在一系列照片中,相同物体的画风并不相似,DINOv2也能准确识别它们的特征,并分到相似的列表中。

如(a)组中都具有翅膀的鸟和飞机、(b)组中的大象和大象雕塑、(c)组中的汽车和汽车玩具模型、(d)组中的马和涂鸦版马:

而且从PCA(主成分分析)图像效果来看,DINOv2不仅能准确分类,还能用不同颜色标出它们“相同”的部分,例如象鼻都是绿色、车轮都是红色、马的尾巴是黄色等。

换而言之,DINOv2能理解这些图像中的相似之处,就像人会形容飞机“看起来像一只鸟”一样。

目前DINOv2已经放出Demo,我们也试了试它的实际效果。

Demo直接可玩

官网已经开放语义分割、图像检索和深度估计三大功能的试玩。

据Meta介绍,这几个任务中,DINOv2在大多数基准上超过了目前开源视觉模型中表现最好的OpenCLIP。

我们先来看看深度估计的效果。

值得一提的是,在效果更好的情况下,DINOv2运行的速度也比iBOT更快,相同硬件下只需三分之一的内存,运行速度就能比DINOv2快上2倍多。

这是Meta论文中与OpenCLIP在实际例子上的比较效果:

小米迷你电饭煲

我们用这张猛男版新宝岛试一下,看起来还不错,即使是高糊图片也能比较好地估计出深度:

接下来是语义分割的效果,这里也先给出Meta论文中的数据对比情况:

这里也给出OpenCLIP和DINOv2的对比,中间的图片是OpenCLIP的效果,右边是DINOv2分割的效果:

我们也用一张办公室的图片试了一下,看起来DINOv2还是能比较准确地分割人体、物体的,但在细节上会有一些噪点:

最后是图片检索。

官网上给出的图片效果还是挺不错的,输入铁塔照片,可以生成不少含铁塔的相似艺术图片:

这里我们也试了试,输入一张华强买瓜,给出来的艺术图片大多数与西瓜有关:

那么,这样的自监督视觉大模型可以用在哪里?

从Meta给出的视频来看,目前有一些比较环保的用途,例如用于估计全球各地的树木高度:

除此之外,如同扎克伯格所说,DINOv2还能被用于改善医学成像、粮食作物生长等。当然这里小扎还进一步强调:

可以被用于制作更具沉浸感的元宇宙。

嗯,看来Meta的元宇宙路线还将继续……

试玩Demo地址:https://dinov2.metademolab.com/demos

项目地址:https://github.com/facebookresearch/dinov2


返回网站首页

本文评论
美团 股权「美团:获贝莱德增持975万股公司股份」
  据港交所9月23日披露文件,贝莱德9月20日增持975万股美团股份,其持股比例从4.94%上升到5.11%。腾讯收购美团股份chromebook为什么便宜苹果2022 apple watch发售时间惠普将...
日期:09-27
宏碁欧洲公司裁员300名 补偿费用达1.5亿美元
6月4日消息,据国外媒体报道,宏碁在欧洲的公司正进行裁员300名,估计将支付1亿5千万美元的遣散费。这是自该公司前总裁兰奇在三月与公司管理冲突后离职,宏碁试图朝向精简营运模式...
日期:07-28
Telegram创始人称WhatsApp是被植入了后门的“监视工具”
WhatsApp在全球拥有20多亿月度活跃用户,是世界上最受欢迎的移动信息应用。但竞争对手Telegram的创始人认为人们应该远离Meta的产品,他称其是一个不断存在安全问题的监视工具。...
日期:10-09
同程收购美豪商业旗下轻资产加盟部分,美豪酒店还将负“重”前行
谷歌ceo皮查伊三大能力图片来源:视觉中国谷歌广告数据分析国网e充电app   记者 |谢亦欣   8月15日,界面新闻从天眼查处获悉,上海美豪商业管理有限公司(下称“美豪商业”)发生...
日期:08-16
9月新能源车销量出炉:比亚迪20万辆一枝独秀 碾压特斯拉「比亚迪销量超越特斯拉」
10月9日,乘联会公布2022年9月新能源乘用车厂商批发销量,预估9月销量66.4万辆,环比8月约增长5%,同比去年9月增长约90%。具体厂商方面,比亚迪以超过200973辆的销量一枝独秀,不仅是唯...
日期:10-13
一搜即达:微信小程序“功能直达”开放_直通车小程序
  昨天,微信“功能直达”正式开放,用户微信搜一搜功能词,搜索页面将呈现相关服务的小程序,点击搜索结果,可直达小程序相关服务页面。  目前,已有部分小程序用上了“功能直达”...
日期:02-11
有CEO用ChatGPT写电邮,称工作效率提高了很多
1月20日消息,自2022年年末推出以来,人工智能(AI)聊天机器人ChatGPT在教育、写作、编程等领域火爆全球。现在,这款聊天机器人也在参加达沃斯论坛的公司老板中流行起来,他们利用其写...
日期:01-20
腾讯发布第二代四足机器人“Max”_腾讯两足机器人
8月8日消息,腾讯正式发布Max二代机器人(以下简称“Max”),该机器人由腾讯Robotics X实验室自研,是腿轮一体的多模态四足机器人。   依托于机器人视觉定位、地形识别、全向六自...
日期:08-09
网络水军覆灭在即 四部委启动“整顿非法网络公关行为专项行动”
  "百姓网最近有点悬",在门户网站做编辑工作的王琛最近负责关注分类信息网站的"邮件门"事件。他一边翻看关于百姓网雇佣网络水军,大肆发布虚假信息的网页,一边这样感叹。  ...
日期:07-27
Win10新版19631推送:修复睡死、改善红外人脸识体验
  今晨,微软带来两个Insider预览版,分别是面向快速通道会员的Build 19631和面向ARM PC(如Surface Pro X)的Build 19624。   关于Build 19631,微软在官方日志中甚至没有对...
日期:07-14
小米Redmi K60参数曝光 骁龙8 Gen1旗舰 2000多元「redmig60hz」
小米Redmi K60的一些参数现身数据库,并且也证实了小米Redmi K60的海外版就是小米 POCO F5手机,新机将采用2K的屏幕,并且还有120Hz高刷,芯片方面则是高通骁龙8 Gen 1,以K系列的定...
日期:10-14
搜狐q3财报「搜狐2022年Q3营收1.85亿美元」
2022年11月14日,搜狐公司公布2022年第三季度财务报告。财报显示,搜狐第三季度总收入为1.85亿美元,归于搜狐的非美国通用会计准则净亏损为1700万美元,低于亏损预期。此前搜狐预估...
日期:11-15
港股美团收跌超9% 快手跌超4%「美团股票跌」
  讯 8月16日下午消息,香港恒生指数收跌1.05%,恒生科技指数收跌2.03%。港股美团收跌超9%,盘中市值一度跌破万亿港元。此前有市场消息称,腾讯计划出售美团的全部或大部分股权。...
日期:10-12
一汽大众官方回应中控屏弹窗:并非弹窗广告「大众车中控屏显示无条目」
9 月 28 日讯:据中国新闻网报道,针对导航弹窗一事,一汽大众回应称,车机消息推送是一汽大众面向车主的关怀行为,并非弹窗广告,提醒用户保养、品牌活动邀约等与用户息息相关的信息...
日期:09-29
华硕AMD A620入门主板隐藏两大福利:PBO超频白捡9%性能「华硕(asus) a68hm-k socket fm2+主板 支持a10 7860k」
AMD日前正式发布了入门级的A620芯片组,终于将Zen4锐龙7000系列主板拉入到千元下。当然,大家也是不小的,失去了PCIe 5.0 SSD、处理器超频等关键特色,搭档65W以上处理器会有性能损...
日期:04-06
傲林科技入选2021中国潜在独角兽,首次上榜既跻身百强
  近日,中国潜在独角兽企业报告发布会暨苏州合作交流会在苏州举行。江苏省委常委、苏州市委书记许昆林出席发布会并致辞,全国100多家潜在独角兽企业代表、苏州市和苏州工业...
日期:06-08
HTC初战受挫 安卓阵营感受苹果威胁(htc手机面临的风险)
自诞生以来,势头一直凶猛的安卓系统手机在今年夏天却遭遇一场前所未有的危机,苹果公司的专利诉讼,让HTC和其他Android系厂商感到非常不安。   美国国际贸易委员会(ITC)日前...
日期:07-22
苹果公司获取ipad商标的动机_苹果公司撤销iPad中国商标的法律分析
  据媒体报道,业内最炙手可热的电子产品,苹果公司推出两个月即销量突破200万台的新宠——全触摸屏电脑iPad最近在中国碰到了商标问题:一家名为唯冠科技的公司早在2000年就注...
日期:07-30
得物回应退货扣99元服务费:需要等待相关部门确认「得物退货收服务费」
2 月 3 日讯:据南方都市报报道,针对“退货被扣 99 元服务费”一事,得物方面回应称,目前平台只有极少数商品不支持 7 天无理由退货。对于曾提出收取 99 元服务费一事,需要等待公...
日期:02-03
男子口腔溃疡一年暴瘦62斤 一查竟患罕见病 医生:小病也得注意_最近两年口腔溃疡频发
日常生活中,我们每个人都有可能会出现一些不起眼的小毛病,不过不要小瞧它们,有可能就隐藏着巨大的祸患。特斯拉modely标准续航版交付时间俄罗斯智能手机销量据@白鹿视频 报道,近...
日期:11-28