您的位置:首页 > 互联网

即时3D搜索技术OVIR-3D开源 可从文本提示中检索3D对象_搜索3d是什么意思

发布时间:2023-11-10 16:13:15  来源:互联网     背景:

要点:

1. OVIR-3D是一个开放词汇的3D实例检索系统,能够在没有对3D数据进行训练的情况下,从RGB-D视频和语言查询中返回排名的3D实例段。

华硕eeepc上网本第一代

2. 该系统通过将问题视为从语言引导的2D区域提议进行3D融合的问题,提供了一种直观而有效的解决方案,避免了由于缺乏足够种类的注释3D数据而难以直接训练开放词汇3D分割模型的问题。

3. OVIR-3D的流程包括下载仓库、安装依赖、演示、数据集准备、2D到3D融合和推理等步骤,具有广泛的应用前景,同时有相关研究作品OVSG。

11月10日 消息:OVIR-3D是一个开放词汇的3D实例检索系统,它以直观而有效的方式解决了在没有对3D数据进行训练的情况下获取3D实例的问题。该系统通过语言引导的2D区域提议进行3D融合,为机器人应用(如操纵和导航)提供了解决方案。OVIR-3D的核心思想是直接训练开放词汇的3D分割模型在实践中变得困难,因此它从语言引导的2D区域提议出发,通过在大量2D数据集上进行训练,将2D实例信息在3D空间中投影和融合,以实现快速检索。

项目地址:https://github.com/shiyoung77/ovir-3d

搜索3d的

OVIR-3D的使用包括下载仓库、安装依赖、演示、数据集准备、2D到3D融合和推理等多个步骤。作者提供了详细的使用说明,包括如何获取仓库、安装依赖以及演示过程。此外,系统支持自定义数据集的准备,通过开源的实感相机和KinectFusion实现,用户能够以指定格式录制和重建自定义3D场景。

在OVIR-3D的背后,Detic作为2D区域提议网络的骨干,通过查询Imagenet21k的所有类别,生成置信度阈值为0.3的输出蒙版和文本对齐特征。这一步骤的输出被存储在特定文件夹中,用户可以选择保存2D可视化,尽管这可能会降低推理速度。

对于2D到3D的融合,OVIR-3D提供了一种算法来处理多个3D场景的并行融合,但作者建议至少拥有11GB内存的显卡以避免在处理大场景时出现内存问题。一旦融合完成,用户可以通过instance_query.py脚本与系统进行交互,检索3D实例。

论文中提到OVIR-3D作为开放词汇问题的一个解决方案,强调其评估方式采用信息检索标准mAP,这是一种更合理的度量方式,尽管略有不同于通常用于封闭集实例分割的mAP度量。文章还提到了OVIR-3D的应用前景,以及后续工作OVSG的介绍,该工作在OVIR-3D的基础上构建3D场景图,实现更精准的对象检索。


返回网站首页

本文评论
三星的晶圆厂「三星晶圆代工论坛将于10月3日在美国加州率先召开」
10月2日消息,三星发布公告称,首场三星晶圆代工论坛2022和三星SAFE(先进晶圆代工生态系统)论坛2022的融合活动将在线下举行。线下活动举行地点分别为:美国圣何塞市、日本东京、德...
日期:10-02
山东高速路全新“无感支付”省内上线:无需安装ETC_山东高速 无感支付
  日前,据经济网报道,9月2日,在G2京沪港沟收费站,无感支付系统在人工收费车道投入使用。这是继自助智能车道后山东高速推出又一智能高速新举措,目前在山东省内的136个收费站全...
日期:07-17
抖音“丽水宝藏古村”等项目入选“全球减贫案例”「丽水宝藏古村好玩吗」
11月18日消息,2022全球减贫伙伴研讨会近日在北京召开,为世界减贫事业贡献中国智慧和中国方案。本次研讨会由中国国际扶贫中心、国际农业发展基金、联合国粮食及农业组织等联合...
日期:11-23
天猫品牌数量「天猫平台获超1000万名会员数品牌已超40家」
10月8日 消息:数据显示,在天猫获得超过1000万名会员的品牌已超过40家。2021年4月,天猫计划未来一年孵化40家会员数达1000万的品牌,当前目标已超额完成。天猫公布的数据显示,2021...
日期:10-10
洋码头危机背后,海淘不再时髦?_洋码头的奢品护航
  文/孟倩  “我从2015年就注册了洋码头的买手,这么多年一直很信任平台”,然而在上个月,身在美国的洋码头买手汪路却中止了这份“代购”事业。过去七八年,她用心经营,通过洋...
日期:10-09
荣耀MagicPad曝光:13英寸大屏旗舰_荣耀平板magicpad
荣耀计划于7月12日举行全场景新品发布会,其中包括新款平板MagicPad。在正式发布前,荣耀平板MagicPad的外观已经公开。据悉,该平板提供青色、灰色、暖金等至少三款配色,机身背面...
日期:07-08
中国电信前三季度营收3811亿元,净利润同比增长10.4%
通信世界网消息(CWW)10日20日,中国电信公布了2023年第三季度报告。报告显示2023年前三季度,中国电信营业收入为3811.03亿元,较去年同期增长6.5%,其中服务收入为3497.43亿元,较去年...
日期:10-22
印度最高法庭维持针对亚马逊、沃尔玛旗下 Flipkart 的反垄断调查_沃尔玛收购印度电商flipkart案例分析
  北京时间 8 月 9 日下午消息,据报道,印度最高法院在周一裁定,针对亚马逊和沃尔玛旗下的 Flipkart 发起的反垄断调查必须继续下去。对于上述两家电子商务巨头来说,最高法院...
日期:08-26
特斯拉得克萨斯州锂精炼厂正式动工:可满足100万辆电动汽车需求_特斯拉锂电池厂
快科技5月9日消息,今天(北美8日)得克萨斯州Corpus Christi特斯拉锂精炼厂正式动工,埃隆马斯克亲自参与了奠基仪式。美股三大股指大跌 新闻据介绍,该厂计划投资3.75亿美元(约合26亿...
日期:05-09
华为一年之内碎屏有折扣吗?「79元起!华为碎屏无忧服务上线:屏幕碎了5折换 支持27款机型」
11月17日消息,今日,华为商城官方宣布华为碎屏无忧服务上线,售价79元起,购买该服务后,手机不慎碎屏可享5折优惠换屏。据了解,在该服务生效期间,手机因意外碰撞、跌落等原因造成屏幕...
日期:11-18
联通王睿「匠心服务诠释诚挚诺言——记北京联通智家工程师王硕」
匠心服务诠释诚挚诺言——记北京联通智家工程师王硕 通信产业网|2023-08-17 10:58:14作者:佚名来源:通信产业网【通信产业网讯】#联通好服务 用心为客户#北京联通八区分公司有...
日期:08-23
苹果10月24日推送iOS 17.1:修复iPhone 12辐射超标问题 信号会更差_iphone12的辐射
快科技10月14日消息,前段时间在iPhone 15系列发布的当天,法国突然宣布iPhone 12不能在该国销售,理由是iPhone 12超过了当地无线电频率暴露的法定范围。根据法国监管机构ANFR(国...
日期:10-15
香港 科学园「携手GSMA走进香港科学园:中国MVNO考察团再次学习交流」
通信世界网消息(CWW)2023年10月26日,“2023 GSMA HK MVNO Open Day”在香港成功举行。本次会议吸引了来自亚洲100余家MVNO产业链上下游企业的代表参会,其中信通传媒·通信世界全...
日期:10-27
男子掉入鱼塘前紧急扔出手机:价值一万多_掉进我家鱼塘需要赔偿吗
俗话说,人为财死,鸟为食亡。看完这段视频你肯定会有深刻的体会。网传一段视频显示,在贵州贵阳。一男子正在岸边蹲着,结果被损友一把推入了水塘。男子起初还在拼命挣扎,眼见无望,争...
日期:06-04
OpenAI正在准备新的开源AI模型
The Information 援引一位知情人士的话说,OpenAI 正准备向公众发布一款新的开源语言模型。报告称,OpenAI 不太可能发布与 GPT 竞争的模型。该公司没有立即回应置评请求。iphon...
日期:09-28
视频拿到小红书一级入口!_小红书 1saye
声明:本文来自于微信公众号 亿邦动力(ID:iebrun),文丨李梦琪 编辑丨石航千,授权转载发布。小红书里的“购物”不见了?有用户陆续发现,小红书App首页进行了改版升级,首页底部重要的...
日期:02-15
微软surface duo评测「微软Surface Duo翻车:升级Android 12L有概率直接变砖」
上个月,微软宣布了旗下手机Surface Duo系列的重大更新”,带来了基于Android 12L的系统版本升级。828联想超级购物节升级后的系统在UI设计上延续了Win11的设计风格,并能够更便捷...
日期:11-20
【OA技术派】华天动力OA 基于工作流的智慧OA平台「华天oa系统手机客户端」
  中国特色的市场环境造就了中国企业独特的管理模式,所谓管理,无非是计划、组织、执行、控制企业内人、财、物与时间的有机结合,而工作流就是将这些企业资源有机联结,融会贯通...
日期:02-11
给世界一个更优选择-华为新一代分布式数据库GaussDB解析_华为分布式架构
【】6月7日,华为全球智慧金融峰会2023在上海开幕,华为常务董事、华为云CEO张平安在峰会上正式发布新一代分布式数据库GaussDB。新一代分布式数据库GaussDB具备高可用、高安全...
日期:09-25
票房破3亿!新海城电影《铃芽之旅》拿下2023年引进片票房冠军
3月24日,新海诚导演电影《铃芽之旅》在内地上映,目前该片票房已突破3亿(3.47亿),超过《蚁人与黄蜂女:量子狂潮》(2.72亿),成为2023引进片票房冠军。据了解,《铃芽之旅》首日以9473万的...
日期:03-27