您的位置:首页 > 互联网

AntGPT:一个视频中长期行为预测大型语言模型

发布时间:2023-08-07 15:18:04  来源:互联网     背景:

8月7日 消息:AntGPT 是一个将大型语言模型应用于视频长期行为预测(LTA)的视觉语言框架。研究人员通过使用监督动作识别算法识别人类活动,并将其作为离散化的视频表示输入给 OpenAI GPT 模型。通过自回归方法、微调或上下文学习,GPT 模型可以预测未来的行动序列,从而实现从底向上的行动预测。

image.png

项目地址:https://brown-palm.github.io/AntGPT/

论文地址:https://arxiv.org/abs/2307.16368

他们还利用目标信息来提供以目标为条件的预测,并研究了 AntGPT 在上下文推理和少样本学习方面的能力。

定量和定性评估表明,LLMs 可以从视频观察的离散化动作标签中推断出演员的高级目标,并且在 EPIC-Kitchens-55、EGTEA GAZE + 和 Ego4D LTA v1和 v2基准测试中取得了最先进的长期行动预测性能。该研究提出了使用大型语言模型进行长期行动预测的方法,并通过 AntGPT 框架将 LLMs 与计算机视觉算法相结合,取得了显著的成果。

核心功能:

1)预测目标:AntGPT 利用大型语言模型推断演员的目标,即使只有少量观察到的人类行为。

2)目标条件预测:AntGPT 通过将目标信息嵌入视觉框架,实现了基于目标的行为预测。

荔枝第二季度营收5.157亿元 同比扭亏为盈的原因

3)建模动作时序:AntGPT通过将大型语言模型调整到特定领域的行动序列上,直接建模动作的时间动态。

4)少样本预测:AntGPT 探索了大型语言模型在少样本情况下的预测能力,并尝试了不同的提示策略。


返回网站首页

本文评论
2022年VR/AR设备全球出货量同比降12% Meta开局不利_AR/VR市场
12月29日消息,市场研究公司NPD Group公布的统计数据显示,截至12月初,虚拟现实(VR)和增强现实(AR)头盔全球出货量同比下降了12%,其中美国销量下降2%。不过,随着苹果入场,它可能在2023年...
日期:12-29
完美世界:预计2022年归母净利润13.6亿元至14.4亿元「完美世界2021季报」
1月17日消息,完美世界今日发布2022年度业绩预告。全年预计实现归母净利润13.60亿元~14.40亿元,同比上年增长268.41%~290.08%,扣非净利润为6.90亿元~7.50亿元,同比增长578.88%~63...
日期:01-17
z460联想笔记本拆机视频「z460 联想」
联想的Z460系列是一款出色的笔记本电脑系列。它被设计成一款平衡性能和便携性的笔记本电脑。该系列采用强大的Intel Core i3, i5和i7处理器和Windows 7操作系统,为用户提供最...
日期:05-29
抖音咋有些客户没有抖分期「抖客分销,真到爆发期了吗?」
声明:本文来自于微信公众号 老胡地盘(ID:laohudipan88),作者:老胡,授权转载发布。最近关于抖客社交代理分销的话题又开始热起来了,经常在微信上有很多的人跑来找我咨询,老胡现在抖...
日期:10-09
全国知识产权周活动主题_河南省知识产权宣传周主题日活动圆满落幕
  4月26日,由河南省知识产权局主办,郑州高新技术产业开发区管理委员会承办的河南省知识产权宣传周主题日活动在郑州高新区通过线上直播的方式举行。   图/河南科技报社...
日期:12-03
苹果 iPhone 15 Pro 的 Action 按钮将在执行关机/强制重启时取代音量键
4月18日消息:据一位匿名消息人士称,苹果即将推出的 iPhone 15 Pro 和 iPhone 15 Pro Max 机型将引入一个新的按钮组合,以关闭电源和强制重启设备,该消息人士声称在发布前了解有...
日期:04-18
华为云WeLink多方视频通话现已强势登陆华为智慧屏 X65(华为云welink会议电话)
  2020年4月8日,华为春季新品线上发布会正式举行。发布会上,兼具领先智慧功能与非凡音画实力的华为首款旗舰级智慧屏华为智慧屏 X65正式亮相。这款高端智慧屏产品延续贯彻...
日期:04-03
中国今年汽车销量「中国2023年汽车销量破1000万辆 出口量暴增 老外爱上国产车」
快科技6月12日消息,中国汽车工业协会公布《2023年5月汽车工业经济运行情况》。数据显示,5月,我国汽车产销分别完成233.3万辆和238.2万辆,同比分别增长21.1%和27.9%。其中,新能源...
日期:06-13
核心业务营收大跌33%,英伟达连续两季业绩未达预期_英伟达二季度营收38.7亿美元创新高
昨日,英伟达公布了今年第二季度的财报。财报显示,英伟达第二季度收入为67.0亿美元,同比增长3%,环比下降19%,这与两周前英伟达发布的业绩预览基本相当。这标志着英伟达今年一、二...
日期:09-18
雅迪电动车:让品牌读懂年轻人的世界(雅迪领跑电动车)
  日本消费研究者三浦展先生,曾以日本社会的发展为出发点研究,提出了四个消费社会理论。就我国所发展的阶段来看,有专家人士表示,若按照时间及人均GDP水平划分,我国目前处于品...
日期:07-16
良性的运营助好乐买6月发力品牌建设_好乐买运营状况
  随着电商企业在国内的不断发展,不少的企业纷纷投身品牌建设。而众所周知,品牌建设需要良好的运营体系和供货系统作为支撑。不过通过凡客在品牌建设上的成功可以看出,优秀...
日期:07-30
雷军第一次小米发布会_2月13日见!雷军联合京东推小米10线上发布会
  近日京东线上新品直播发布季正式开启,2月13日小米10成为京东直播×超级发布会的合作产品,届时雷军及小米高管将全部参与。截止目前,小米10系列在京东平台预约量已达到50万...
日期:02-28
科大讯飞 “数说”大健康 健康险C位出道
  近年以来,大健康成为全民关注的话题。再加上受疫情等因素影响,更是让大健康行业驶入发展快车道。讯飞AI营销云发布的大健康专题报告《花式惜命行为盘点》(以下简称《报告...
日期:05-03
专用元宇宙设备市场存量将在2024年达到1亿  2027年将增长到64%
10月9日 消息:元宇宙可以说是当下最热门的赛道之一,科技科技巨头们都在纷纷布局,游戏公司也成为主要入局者之一。小米印度市场占比市场研究机构Strategy Analytics发布的数据...
日期:10-10
腾讯CSIG调整组织架构,成立地图产品部与数字孪生产品部(腾讯CSIG组织架构)
记者/崔鹏   7月25日,腾讯内部发文调整腾讯云与智慧产业事业群(CSIG)组织架构和部分管理干部,宣布成立地图产品部和数字孪生产品部,同时撤销智慧空间产品部和交通平台产品部。...
日期:07-31
『飞测不可』随身携带的“专八”翻译官 科大讯飞双屏翻译机上手
  提到多屏设计,近来在行业中较为熟知的产品是智能手机,包括折叠屏和副屏等形态。5月,科大讯飞率先推出了基于双屏设计的翻译机产品,给翻译机品类带来了革新的使用方式和扩展...
日期:10-25
15岁男孩广西游玩被带至老挝电诈园区,对方要求50万赎金,警方介入
2022年12月,陈女士15岁的儿子小杰(化名)前往广西游玩,随后家人发现他出现在老挝的电诈园区。直到2023年1月,小杰才和母亲陈女士取得联系。小杰告诉陈女士,由于完不成“业绩”,他在...
日期:07-17
不文明遛狗有治了!法国一城市登记狗DNA:不铲屎就罚122欧元「法国养狗规定」
7月18日消息,日常生活中,有些养狗的不是很守规矩,比如遛狗不牵绳,不铲屎等,给其他人带去了很多烦恼,那么有没有什么方法可以减少类似事情的发生吗?近日,法国一旅游城市想出了一招。...
日期:07-18
第二款3nm工艺芯片 苹果M3处理器已在路上:最高18核「苹果m3芯片什么时候出」
快科技6月11日消息,上周的WWDC大会上,苹果发布了15寸MacBook Air笔记本,用上了M2处理器,国内售价10499元起。gpdwin3配置有陀螺仪吗此前传闻这次大会上苹果会首发M3处理器,然而实...
日期:06-13
苹果iPad新款-400 入手仅2099_ipad air4 3999值得买吗
新款的iPad刚发布不久就开始了促销,近期有立减400元的活动,此前京东原价为2499元,参加满2000-400优惠券,到手价2099元,而且还能分期。oled电视北美和菲律宾的外教这款iPad为2021...
日期:11-17