您的位置:首页 > 互联网

北大提出统一的视觉语言大模型Chat-UniVi 3天训练成果惊艳众人

发布时间:2023-11-29 16:40:57  来源:互联网     背景:

要点:

  • 北大和中山大学研究者提出的Chat-UniVi是一种统一的视觉语言大模型,能够在统一的视觉表征下同时处理图片和视频任务,且仅需三天训练即可获得130亿参数的通用视觉语言大模型。

  • Chat-UniVi采用动态视觉token来统一表示图片和视频,通过最近邻的密度峰聚类算法获取动态视觉token,多尺度表征提高了模型的性能,使其在图片和视频的各种任务中取得卓越性能。

  • Chat-UniVi在图片、视频理解以及问答任务等多个实验中表现卓越,使用更少的视觉token达到了与其他大模型相媲美的性能水平,同时开源了代码、数据集和模型权重。

特斯拉model s plaid中国交付

11月29日 消息:近日,北京大学和中山大学等机构的研究者提出了一种名为Chat-UniVi的视觉语言大模型,实现了统一的视觉表征,使其能够同时处理图片和视频任务。这一框架的独特之处在于,它不仅在深度学习任务中表现卓越,而且仅需短短三天的训练时间,就能够训练出具有130亿参数的通用视觉语言大模型。

项目地址:https://github.com/PKU-YuanGroup/Chat-UniVi

至强e52687w v2

Chat-UniVi的核心方法是采用动态视觉token,通过最近邻的密度峰聚类算法来获取这些动态token。这一方法极大地减少了视觉token的数量,降低了模型的训练和推理成本。研究人员通过实验证明,Chat-UniVi在图片理解、视频理解、问答等多个任务中都表现出色,甚至在较小的参数量下也能超越其他大型模型。

OPPO A7x手机

文章还详细介绍了Chat-UniVi的训练过程,分为多模态预训练和联合指令微调两个阶段。这一两阶段的训练策略使得模型能够在混合数据集上进行训练,无需对模型结构进行修改,展现了其在多任务学习上的灵活性和高效性。

Chat-UniVi的成功实验结果包括在图片理解、视频理解、问答等多个任务中都超越了先进的方法。而其在幻觉评估上的优越性更是引人注目,证明了采用动态视觉token和多尺度表征的有效性。

综合而言,Chat-UniVi的提出为视觉语言模型的研究领域带来了新的思路,通过统一的视觉表征实现了对多模态数据的高效处理,为深度学习模型的训练和推理提供了更加便捷和经济的解决方案。

忘记iphone锁屏密码怎么办不刷机


返回网站首页

本文评论
苹果AirPods和Mac配件很可能在2024年之前转为USB-C接口_macbook连airpod
10月10日消息:据彭博社Mark Gurman报道,所有三个型号的AirPods和Mac配件,如Magic Keyboard和Magic Trackpad,都有可能在2024年前过渡到USB-C。本周早些时候,欧洲议会批准了一项...
日期:10-11
pubg手游2.8版本更新!全新主题丧尸边缘上线
pubg手游2. 8 版版本更新的消息正式传出,很多小伙伴也是非常兴奋,新版本会增加很多新的玩法内容,其中全新主题丧尸边缘也是很值得期待的,我们将在其中体验最紧张刺激的丧尸对决,...
日期:09-08
别让弹窗广告弹到安全底线_怎样阻拦弹窗广告
  来源:北京商报  弹窗广告常见,出现在喜剧场景中博君一笑,但弹到了汽车驾驶途中,把人吓出一身冷汗。  近日,“车载导航中控屏出现弹窗广告”的事件引发争议。“出了事故算...
日期:10-05
国家安全部:这种“特殊”网络技术服务涉嫌违法_网络技术服务有哪些
据国家安全部微信公众号消息,当前,网络空间已经成为境外间谍情报机关对我渗透窃密的重要渠道,网络间谍活动愈加活跃,技术攻击精准猛烈,窃密手法层出不穷,严重威胁我国家安全。随着...
日期:11-27
董明珠谈预制菜:要让世界爱上中国味道_董明珠 专家意见
快科技7月4日消息,在空调产业之外,格力电器近年来也在多个领域扩大了投资,董明珠推动格力造芯片、造手机、搞新能源汽车、储能等等,这两年随着预制菜行业火爆,格力也要搞预制菜,而...
日期:07-04
打击网络暴力,张大奕默默搜集证据用法律维护名誉!
  我想今年以来,吃瓜最大的瓜就是张大奕和总裁的绯闻事件吧,毕竟两个人的身份特殊,背后还涉及两大上市公司,再到上自身就有很大的影响,在网络上掀起了巨大风波。   不...
日期:07-13
百川VS智谱,谁是中国的OpenAI?_百川智运
声明:本文来自于微信公众号 光锥智能(ID:guangzhui-tech),作者:郝 鑫,授权转载发布。6月初,外媒曾发出了“谁是中国的OpenAI”的拷问,经历了大模型创业潮之后,大浪淘沙,最终留下的...
日期:10-24
大一女生获世界小姐中国区总冠军 网友:厦门真是人才辈出_世界小姐中国赛区冠军2021
最新消息显示,第72届世界小姐中国区总决赛在云南大理举行。厦门理工学院2022级表演专业学生刘婉婷在比赛中获得总冠军和总决赛人气亚军。据悉,明年她将代表中国参加第72届世界...
日期:05-25
Win10“钉子户”换用Win11后 坦言打开了新世界:告别偏见
快科技6月26日讯,对于习惯了Win10的钉子户”来说,Win11真有那么不堪吗?来自PCworld的老编Gordon Ung做了尝试,他感叹仿佛来到新世界,网上所谓的Win11垃圾根本就是言过其实。马斯...
日期:06-27
天玑820相当于骁龙870「天玑8200杀疯!冲击高频率 碾压二代骁龙7」
旗舰级的天玑9200发布了,次旗舰或者说高端的天玑8200也要来了。早在今年7月底,就有消息称,联发科将推出新一代天玑8200,作为目前天玑8000系列的升级版,升级台积电4nm制造工艺,并且...
日期:11-17
奥林巴斯指前CEO泄露机密 欲提出起诉
  10月25日消息,据国外媒体报道,面对股东公开质疑奥林巴斯2008年因收购事宜支付给顾问公司6.87亿美元顾问费一事,奥林巴斯指责前CEO迈克尔·伍德福德(Michael C. Woodford)...
日期:07-24
LCD小金刚!Redmi Note 12T Pro配备12GB大内存、5080mAh电池_红米note12pro参数配置
快科技5月29日消息,Redmi Note12T Pro将于明天上午10点开启预售,是今年唯一的LCD性能旗舰。今天下午,Redmi官方确认新机将内置5080mAh电池,能达到1.35天的超长续航,连续刷14小时...
日期:05-29
iPhone 16 Pro原型机曝光:前置单挖孔摄像头,苹果要“妥协”了?_16s pro摄像头
苹果公司在最新推出的iPhone 14 Pro和Pro Max上引入了名为“灵动岛”的新功能,并计划将其应用于整个iPhone 15系列。尽管该公司通常不会在短时间内进行重大设计改变,但有报道...
日期:11-12
网站备案信息真实性核验单_江苏省通管局落实网站备案信息真实性核验方案
  近日江苏省通信管理局召开了运营商、接入商与数据中心会议,会议进一步落实网站备案信息真实性核验工作方案的实施方案,在2010年9月前要完成江苏省境内备案网站真实性的核...
日期:07-29
ebay工资高吗「eBay宣布将裁员500人 约占员工总数4%左右」
2月8日消息,据外媒报道,当地时间周二, eBay宣布将裁员500人,约占其员工总数的4%。最舒服的苹果表带据悉,在给员工的一份备忘录中,其首席执行官杰米·伊安内表示,公司在对过去几个月...
日期:02-09
iphone a15 a14「iPhone-15 Pro开测 A17 Pro翻车了?」
来源:中关村在线苹果iPhone 15系列于9月13日凌晨正式发布,这一代产品的表现似乎有些超出外界的预料。虽然苹果在iPhone 15 Pro上并没有带来“A17”芯片,而是带来了一颗“A17...
日期:09-23
三大音乐APP对比,音效与音质谁更胜一筹(音乐app音效哪个好)
  伴随互联网的广泛普及与应用,使用流媒体音乐平台听歌已融入大众的日常,市面上也涌现出花样繁多的听歌软件供君挑选。至于选择哪款软件,人们常常在意“量”——曲库的丰...
日期:02-16
苹果15系统手机发烫「苹果承认iPhone 15 Pro发热问题:将在更新修复」
自苹果公司于9月13日发布的iPhone15系列推出以来,发热问题一直是消费者关注的热点。最新消息称,苹果公司已承认该问题,并表示将在即将发布的系统软件更新中进行修复。 据透露,苹...
日期:10-04
抖音井汤博:液冷是趋势,但需理性看待「你认识汤井空吗」
通信世界网消息(CWW)当高性能计算需求日益增长,随着芯片功率密度的迅速激增,传统的数据中心风冷方式显得有些力不从心,换热效率更为优异的液冷脱颖而出,受到越来越多用户的青睐,也...
日期:07-04
恒安嘉新中标中国电信2023年5G移动互联网恶意程序监控系统扩容工程
通信世界网消息(CWW)近日,中国电信启动2023年5G移动互联网恶意程序监控系统扩容工程(31省),拟采取单一来源方式采购,恒安嘉新(北京)科技股份公司、上海欣诺通信技术股份有限公司...
日期:07-13