您的位置:首页 > 互联网

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

发布时间:2023-06-11 17:04:13  来源:互联网     背景:

Tracking Everything Everywhere All at Once.

前段时间,Meta 发布「分割一切(SAM)」AI 模型,可以为任何图像或视频中的任何物体生成 mask,让计算机视觉(CV)领域研究者惊呼:「CV 不存在了」。之后,CV 领域掀起了一阵「二创」狂潮,一些工作陆续在分割的基础上结合目标检测、图像生成等功能,但大部分研究是基于静态图像的。

现在,一项称为「追踪一切」的新研究为动态视频中的运动估计提出了新方法,能够准确、完整地追踪物体的运动轨迹。

该研究由来自康奈尔大学、谷歌研究院和 UC 伯克利的研究者共同完成。他们联合提出了一种完整且全局一致的运动表征 OmniMotion,并提出一种新的测试时(test-time)优化方法,对视频中每个像素进行准确、完整的运动估计。

  • 论文地址:https://arxiv.org/abs/2306.05422

  • 项目主页:https://omnimotion.github.io/

有网友在推特上转发了这项研究,仅一天时间就收获了3500+ 的点赞量,研究内容大受好评。

图片

从该研究发布的 demo 看,运动追踪的效果非常好,例如追踪跳跃袋鼠的运动轨迹:

荡秋千的运动曲线:

还能交互式查看运动追踪情况:

图片

即使物体被遮挡也能追踪运动轨迹,如狗在跑动的过程中被树遮挡:

图片

马斯克twitter中国

小米11ultra徕卡

谷歌pixel3xl刘海隐藏

在计算机视觉领域,常用的运动估计方法有两种:稀疏特征追踪和密集光流。但这两种方法各有缺点,稀疏特征追踪不能建模所有像素的运动;密集光流无法长时间捕获运动轨迹。

该研究提出的 OmniMotion 使用 quasi-3D 规范体积来表征视频,并通过局部空间和规范空间之间的双射(bijection)对每个像素进行追踪。这种表征能够保证全局一致性,即使在物体被遮挡的情况下也能进行运动追踪,并对相机和物体运动的任何组合进行建模。该研究通过实验表明所提方法大大优于现有 SOTA 方法。

方法概述

该研究将帧的集合与成对的噪声运动估计(例如光流场)作为输入,以形成整个视频的完整、全局一致的运动表征。然后,该研究添加了一个优化过程,使其可以用任何帧中的任何像素查询表征,以在整个视频中产生平滑、准确的运动轨迹。值得注意的是,该方法可以识别画面中的点何时被遮挡,甚至可以穿过遮挡追踪点。

OmniMotion 表征

传统的运动估计方法(例如成对光流),当物体被遮挡时会失去对物体的追踪。为了在遮挡的情况下也能提供准确、一致的运动轨迹,该研究提出全局运动表征 OmniMotion。

该研究试图在没有显式动态3D 重建的情况下准确追踪真实世界的运动。OmniMotion 表征将视频中的场景表示为规范的3D 体积,通过局部规范双射(local-canonical bijection)映射成每个帧中的局部体积。局部规范双射被参数化为神经网络,并在不分离两者的情况下捕获相机和场景运动。基于此种方法,视频可以被视为来自固定静态相机局部体积的渲染结果。

图片

由于 OmniMotion 没有明确区分相机和场景运动,所以形成的表征不是物理上准确的3D 场景重建。因此,该研究称其为 quasi-3D 表征。

OmniMotion 保留了投影到每个像素的所有场景点的信息,以及它们的相对深度顺序,这让画面中的点即使暂时被遮挡,也能对其进行追踪。

图片

实验及结果

定量比较

研究者将提出的方法与 TAP-Vid 基准进行比较,结果如表1所示。可以看出,在不同的数据集上,他们的方法始终能实现最佳的位置准确性、遮挡准确性和时序一致性。他们的方法可以很好地处理来自 RAFT 和 TAP-Net 的不同的成对对应输入,并且在这两种基准方法上提供了一致的改进。

定性比较

如图3所示,研究者对他们的方法和基线方法进行了定性比较。新方法在(长时间)遮挡事件中显示出了出色的识别和追踪的能力,同时在遮挡期间为点提供合理的位置,并处理很大的摄像机运动视差。

图片

消融实验与分析

研究者利用消融实验来验证他们设计决策的有效性,结果如表2所示。

图片

在图4中,他们展示了由他们的模型生成的伪深度图,以展示学习到的深度排序。

图片

需要注意的是,这些图并不对应于物理深度,然而,它们展示了仅使用光度和光流信号时,新方法能够有效地确定不同表面之间的相对顺序,这对于在遮挡中进行追踪至关重要。更多的消融实验和分析结果可以在补充材料中找到。


返回网站首页

本文评论
一箱酸牛奶24盒_11月3日来京东,进口牛奶、酸奶一箱通通只要19.9元!
  最近同事之间的对话都是这样的:今天买啥了?给我推荐一下,我都不知道买啥。话说这位朋友你家才通网么?京东超级百亿补贴19元的锅、9.9的水果、889元的苹果耳机已经上热搜...
日期:02-22
苹果连续第16年被《福布斯》评为全球最受赞赏公司「福布斯发布品牌价值榜: 苹果7连冠 中国哪些品牌上榜?」
IT之家 2 月 5 日消息,苹果公司在《福布斯》年度全球最受赞赏公司(World's Most Admired Companies)排行榜上稳居榜首,连续 16 年获得第一名。在过去 15 年中,苹果公司一直在该榜...
日期:02-05
Redmi K60参数曝光:2K屏幕 骁龙8+芯片 只卖2000多「redmik20屏幕多少钱」
今天有博主曝光了Redmi K60系列的参数,已知消息为,K60手机将采用2K屏幕,而且搭载骁龙8+旗舰处理器,而续航方面则有着5500mAh大电池,搭配67W快充,并且Redmi解决了无线充电的难题,K60...
日期:10-18
2022元宇宙共享大会|元宇宙共创大赛暨产业风云榜合作启动「元宇宙产业委员会」
央链直播报道, 2022 年 8 月 16 日,“开放与兼容” 2022 元宇宙共享大会暨《元宇宙十大技术》图书首 发仪式,及元宇宙产业委第 一届第二次全体委员大会,在北京西山国管局杏林山...
日期:09-11
国产新机皇正式开售,真·全面屏旗舰或掀起行业设计新风尚_各品牌新机
  最近的手机市场特别的热闹,众多的手机厂商都争相的发售自己设计的新机型。于是厂商们的新产品便在手机市场上争奇斗艳,都想获得消费者们的认可,但是不同的人爱好不同,这就...
日期:11-09
区块链,定义元宇宙_元宇宙板块有哪几种代币
声明:本文来自于微信公众号 孟永辉(ID:menglaoshi0071),作者:孟永辉,授权转载发布。当元宇宙的发展开始逐渐变得深入与完善,区块链在其中所发挥的重要作用,正在逐步显现。对于很多...
日期:09-27
新增攻击模块二次染指linux服务器,“驱动人生”僵尸网络全网撒毒贼心不死
  用野火烧不尽,春风吹又生,来形容“死而不灭”的僵尸网络最合适不过。6月9日,360安全大脑监测到“驱动人生”僵尸网络的高危异动,其原有的僵尸模块进行大规模更新,增加“SMBv...
日期:07-14
暴发户专用!镶嵌劳力士iPhone14Pro售价93万
10月9日 消息:俄罗斯奢侈品定制商 Caviar 又整活了!近日,Caviar推出了劳力士定制版 iPhone14Pro。这款手机的背面镶嵌了一款如假包换的劳力士 Cosmograph Daytona 腕表,甚至还...
日期:10-09
国内第四大运营商!山东广电192友好预约用户入网时间定了(山东广电信通网络)
  6月6日,中国广电品牌升级暨广电5G和融合业务品牌发布会在北京歌华大厦举办,正式推出了“中国广电”、“广电5G”、“广电慧家”三大品牌标识及广告语,并宣布各地广电网络...
日期:07-18
在抖音上开个小店需要多少钱「3月起个人也能在抖音开店了 最快一小时入驻」
3月2日消息,据抖音电商官方披露,2023年3月起,抖音电商将开放支持个人开店,个人仅需提供符合要求的身份证并通过实名认证,即可在抖音电商注册“抖音小店”成为商家。最快1小时入驻...
日期:03-02
雾芯科技:今日起国标新品在全国统一电子烟交易管理平台发售_雾芯科技 中国烟草
  8月29日,电子烟品牌悦刻母公司雾芯科技发布公告称,公司国标新品今日起开始在全国统一电子烟交易管理平台陆续发售。目前,雾芯科技及下属企业共获得由国家烟草专卖局颁发的3...
日期:08-29
年营收突破2000万增长210% 腾讯课堂“101计划”助力图灵在线转型升级
  “图灵在线在腾讯课堂‘101计划’的精准流量扶持下取得了巨大飞跃,年营收增长210%,目前已突破2000万,人均业绩提升180%。我认为该计划是在线职业教育赋能的最佳计划,能够为...
日期:08-01
全触屏手机2021qq下载「全触屏手机」
是指手机屏幕完全由触摸屏组成,没有任何物理按键或键盘。这种手机可以通过手指触摸和滑动来完成各种操作,如拨号、发送短信、浏览网页、玩游戏等。的出现是随着科技的发展和市...
日期:05-31
淘宝新浪抢挣人才 文明盛世独创新高
  互联网行业人才缺口到底有多大?这是一个近十年来徘徊在互联网行业的巨大问题,而随着这一数字的不断攀升,背后是难以掩饰且激烈的人才竞争。06年,李开复为Google筹措的编程...
日期:07-23
汤姆猫:已尝试应用ChatGPT模型进行AI交互产品开发的初步测试
2 月 13 日讯:汤姆猫称,公司汤姆猫家族IP的智能交互属性与ChatGPT有着较高的契合度。目前公司团队已尝试应用ChatGPT模型进行AI交互产品开发的初步测试。dna的发现者被取消诺...
日期:02-13
实用至上!丰田决定用机械钥匙替换智能钥匙:原因无奈_丰田钥匙改装
10月29日消息,丰田汽车近日宣布,由于芯片短缺,其会将新车附赠的两把智能化数字钥匙其中一把暂时替换为机械钥匙,报道称,这一变化将适用于14款丰田车型,以及9款雷克萨斯品牌车型。...
日期:11-04
网易云旗下k歌软件「网易云音乐旗下K歌App“音街”宣布将于9月30日关停」
网上购物差评是真的吗  新酷产品第一时间免费试玩,还有众多优质达人分享独到生活经验,快来新浪众测,体验各领域最前沿、最有趣、最好玩的产品吧~!下载客户端还能获得专享福利...
日期:09-09
百家号公布Q4内容治理报告,全年下线违规文章超200万篇
  1月11日,百度百家号官方公布了《2019年Q4年度内容治理报告》。报告称,Q4期间百家号平台共下线低质违规文章超过26万篇,封禁账号超1.9万个。同时,为了最大化保护原创作者利...
日期:06-03
联想笔记本款式「联想笔记本款式分类」
联想是中国最大的电脑制造商之一,在全球范围内也拥有很高的知名度和影响力。联想笔记本作为其旗下产品线之一,在国内外市场上具有很高的认可度和市场份额。本文将介绍联想笔记...
日期:05-31
2010十大营销事件揭晓 360“免费战”入选
  近日,“2010第三届时代营销盛典”在世界第一大高尔夫球会观澜湖揭晓。360 公司凭借“免费杀毒”系列整合传播被评为年度十大营销事件,同时获得这一荣誉的还有万科、招商...
日期:07-25