您的位置:首页 > 互联网

又一个!北京智源推出通用视觉分割模型SegGPT

发布时间:2023-05-30 14:04:09  来源:互联网     背景:

5月30日 消息:在2023中关村论坛平行论坛之一的人工智能大模型发展论坛上,北京智源人工智能研究院推出通用分割模型 SegGPT(Segment Everything In Contex),这是一个利用视觉提示(prompt)完成任意分割任务的通用视觉模型。

SegGPT 是智源通用视觉模型 Painter 的衍生模型,可针对分割一切物体的目标做出优化。

该模型具备上下文推理能力,训练完成后无需微调,只需提供示例即可自动推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等。

李彦宏对人工智能的看法

如下图所示,标注出一个画面中的彩虹,SegGPT可批量化分割其他画面中的彩虹。

image.png

它的灵活推理能力支持任意数量的视觉提示。自动视频分割和追踪能力以第一帧图像和对应的物体掩码作为上下文示例,SegGPT 能够自动对后续视频帧进行分割,并且可以用掩码的颜色作为物体的ID,实现自动追踪。

值得一提的是,此前Meta发布了其新的基于 AI 的 Segment Anything Model (SAM) ,该模型具有识别和分离图像和视频中的特定对象的功能。通过使用SAM,用户可以通过点击物体或输入文字提示选中编辑的物体。

威斯康辛麦迪逊、微软、港科大等机构的研究人员也提出SEEM模型,通过不同的视觉提示和语言提示,一键分割图像、视频。SEEM模型是一种新型的分割模型,这一模型可以在没有提示的开放集中执行任何分割任务,比如语义分割、实例分割和全景分割。

另外,南科大发布视频分割模型TAM,可轻松追踪视频中的任意物体并消除,操作简单友好。TAM的出现为解决传统视频分割模型需要人工标记培训数据和初始化参与数据的问题提供了之前提供,将改变CGI行业的游戏游戏规则。

SegGPT相关代码发布在 GitHub 上,论文发表在预印本平台 arXiv 上。论文地址:https://arxiv.org/abs/2304.03284


返回网站首页

本文评论
男子抱娃让孩子开车 还拍抖音分享 工作丢了「抱着娃娃开车扣几分」
近日,一名男子怀抱男童,让男童操控着方向盘在道路上行驶的抖音小视频,被网友举报。索尼手机xperia1 iv发布时间海信一机三筒洗衣机评价经查,该车是一辆出租车,车主就是视频中孩子...
日期:03-14
东方卫视抖音直播是真的吗_传东方甄选直播间人气下滑因遭限流,抖音新东方均否认
记者/陈振芳   “不存在对东方甄选限流的情况,东方甄选是抖音电商优质生态中的一个代表性商家,抖音电商鼓励类似优质直播间在平台持续经营与发展。”   针对市场传闻“东...
日期:08-09
2022年7月全球热门移动游戏收入TOP10 王者荣耀蝉联冠军_2021年7月手游收入排行榜
支付宝上市股价   Sensor Tower 商店情报数据显示,2022年7月腾讯《王者荣耀》在全球 App Store 和 Google Play 吸金超过2.25亿美元,蝉联全球手游畅销榜冠军。来自中国iOS市...
日期:08-18
曙光桌面工作站实力支撑新华网两会直播
  3月4日,北京进入“两会时间”,新华网通过不间断的直播,将一场场线上线下采访及新闻发布会向全国实时播报两会动态。在新华网的两会报道战线上,一直默默支撑新华网工作人员...
日期:07-16
小米获月亮拍摄专利授权(华为申请拍月亮专利)
  2 月 11 日消息,信息显示,2 月 11 日,北京小米移动软件有限公司获得“拍摄方法、装置、终端及可读存储介质”专利授权。   摘要显示,本公开属于图像处理领域,通过启动拍...
日期:07-17
泡泡玛特上半年净利润3.76亿元,“MOLLY”不再是公司最赚钱IP「泡泡玛特2018年财报」
查看最新行情   作者/揭书宜  尽管上半年由于疫情反复对消费行业造成了冲击,泡泡玛特(09992.HK)的净利润微跌,但营收实现了逆势增长。  2...
日期:09-04
苹果iOS16.2正式版发布 推出无边记app,改进锁定屏幕
12月14日 消息:12月14日,Apple 向iPhone用户推送了iOS16.2更新(内部版本号:20C65)。本次更新是在上次发布13天后。Apple 区域节点服务器中的配置缓存问题 请注意,这可能会导致设...
日期:12-14
Mate50E将上市 华为正加大供货:3999元起「华为mate50会上市吗」
对于华为来说,Mate 50系列将会扛起他们高端系列冲量的大任,而这就少不了Mate 50E,作为全系最便宜的机型,备货多少也是很关键。华为matebook中关村伊莱克斯 苏宁联发科天玑1000pl...
日期:10-13
中国武术的魅力!赵文卓转身腾空回马枪:根本不像51岁「赵文卓会什么拳」
作为世界上唯一文明没有中断的古国,我们的老祖宗给我们留下了很多瑰宝,不胜枚举,其中最让人神往,至今依旧有很多人传承的,莫过于中国武术。大疆最新款航拍无人机htc手机电池耗电...
日期:01-22
95后Soul星人 分享提升幸福感的家居小物(soul年轻人)
  “小确幸”一词来自于日本,意为微小而确切的幸福感。作为有趣的年轻人,Soul网友们分享了那些提升幸福感的家居小物。那些看似“无意义”和“轻松诙谐”的碎片,串起来就是...
日期:12-12
合肥芯片投资_总投资 55 亿元,芯投微滤波器项目落户合肥
  1 月 26 日,旷达科技集团股份有限公司(以下简称“旷达科技”)发布公告称,公司重要参股公司芯投微电子科技(上海)有限公司(以下简称“芯投微”)与合肥高新技术产业开发区...
日期:07-17
百度搜红包活动最后三天疯狂派送 仍有400万奖品在飞_搜索活动红包
  随着正月十五元宵节的临近,兔年春节已逐渐进入尾声。作为史上最大的网络普及市场活动——百度春节“搜红包”也进入最后三天的疯狂大搜索阶段。据百度后台相关数据显示,...
日期:07-26
天梭表高仿多少钱_天梭手表指高朋售假 网购奢侈品多来路不正
针对近日备受关注的“高朋网售假天梭表”事件,天梭表业公司上周六发表声明表示,已经鉴定消费者从高朋网购买到的天梭手表均为假货,并称针对此“严重侵犯商标权及知识产权事件...
日期:07-24
谷歌集团董事长_谷歌高层调整
  (原标题::搜索和广告团队都归这位印度裔管理)   6 月 5 日消息,据国外媒体报道,Alphabet 旗下的谷歌对公司领导层进行了调整,将搜索引擎和广告产品团队的控制权交给普拉...
日期:07-14
AMD发布19h新系列CPU微码 对应最新的Ryzen 7000系列_amd ryzen 9 5900
AMD周五在linux-firmware.git上游发布了新的Family 19h CPU微代码。AMD Family 19h适用于Zen 3和Zen 3+处理器,以及新推出的Zen 4处理器,后者对应的是最新发布的Ryzen 7000系...
日期:10-04
微信商标注册案「腾讯申请注册多个微信优选商标」
  讯 9月26日上午消息,企查查App显示,近日,腾讯科技(深圳)有限公司新增多个商标申请注册信息,包括“微信优选”“微信联盟”“视频号联盟”等,国际分类涉及广告销售、教育娱乐、...
日期:09-30
微软Surface Pro 9正式发布:配备英特尔和ARM处理器 可选5G 还有新颜色_surface pro9测评
微软在10月的活动中宣布了其下一代Surface Pro平板电脑,最新机型有几个关键变化,如可选的5G连接和包含ARM处理器机型,新加入充满活力的机身颜色以及更新的配件。Surface Pro 9...
日期:10-15
微信 App 测试朋友圈“修改可见范围”「微信朋友圈调整可看范围」
IT之家 8 月 24 日消息,微信 iOS 平台迎来了 8.0.27 正式版更新。苹果 App Store 显示,微信 iOS 版 8.0.27 正式版解决了一些已知问题,但并未公布具体更新内容。据整理发现,本次...
日期:09-27
苹果明年将出售Apple TV+的广告时间 暗示可能提供基于广告支持的订阅
据报道,苹果公司已经与媒体机构和网络高管讨论了在其Apple TV+流媒体服务上出售广告时间的前景,这导致人们猜测广告支持的层级可能最终会出现,可能最快在明年。据DigiDay报道,苹...
日期:10-14
小米Civi 2续航公布:4500mAh电池支持67W快充「小米civi电池容量」
下午14:00,小米在发布会中发布了全新的小米Civi 2手机,新机主打轻薄,机身只有7.23mm的厚度,重量仅有171.8g,厚度也仅有7.23mm,与现在动不动就飚到200g以上的手机相比,称得上轻薄,而...
日期:09-30