您的位置:首页 > 互联网

智源研究院开源发布新一代生成式多模态基础模型 Emu2

发布时间:2023-12-22 11:55:29  来源:互联网     背景:

12月22日 消息:2023年12月21日,智源研究院发布了新一代多模态基础模型 Emu2。Emu2通过大规模自回归生成式多模态预训练,显著推动了多模态上下文学习能力的突破。Emu2在少样本多模态理解任务上表现出色,超越了主流多模态预训练大模型 Flamingo-80B 和 IDEFICS-80B。在 VQAv2、OKVQA、MSVD、MM-Vet、TouchStone 等多个少样本理解、视觉问答、主体驱动图像生成任务上,Emu2取得了最优性能。Emu2是目前最大的开源生成式多模态模型,基于 Emu2微调的 Emu2-Chat 和 Emu2-Gen 模型分别是目前开源的性能最强的视觉理解模型和能力最广的视觉生成模型。Emu2-Chat 可以精准理解图文指令,实现更好的信息感知、意图理解和决策规划。Emu2-Gen 可以接受图像、文本、位置交错的序列作为输入,实现灵活、可控、高质量的图像和视频生成。Emu2使用了更简单的建模框架,并训练了从编码器语义空间重建图像的解码器,将模型规模化到37B 参数。Emu2采用大量图、文、视频的序列,建立了基于统一自回归建模的多模态预训练框架,将图像、视频等模态的 token 序列直接和文本 token 序列交错在一起输入到模型中训练。通过对多模态理解和生成能力的评测,Emu2在少样本理解、视觉问答、主体驱动图像生成等任务上取得了最优性能。在16-shot TextVQA 等场景下,Emu2相较于 Flamingo-80B 超过12.7个点。在 DreamBench 主体驱动图像生成测试上,Emu2比之前的方法取得了显著提升。Emu2具备全面且强大的多模态上下文学习能力,可以照猫画虎地完成多种理解和生成任务。Emu2-Chat 经过对话数据指令微调,可以精准理解图文指令,完成多模态理解任务。Emu2-Gen 可以接受任意 prompt 序列作为输入,生成高质量的图像和视频。Emu2的训练方法是在多模态序列中进行生成式预训练,使用统一的自回归建模方式。相比于 Emu1,Emu2采用了更简单的建模框架,训练了更好的解码器,并将模型规模化到37B 参数。

三星s7home键失灵

apple tv 4k 2017

  • 项目:https://baaivision.github.io/emu2/
  • 模型:https://huggingface.co/BAAI/Emu2
  • 代码:https://github.com/baaivision/Emu/Emu2
  • Demo:https://huggingface.co/spaces/BAAI/Emu2
  • 论文:https://arxiv.org/abs/2312.13286

返回网站首页

本文评论
苹果即将更新停产产品名单:2013/2014款iMac或退役「苹果哪款停产了」
根据苹果最新的备忘录显示的信息,在本月底,苹果将会把2013年和2014年的iMac列入停产产品列表。根据目前已知信息,此次被列入停产产品的将包含2013年的21.5英寸和27英寸iMac、20...
日期:11-07
护航安全!浪潮云“2020攻防演练成绩单”来喽
马云说电子商务这个字可能下一代特斯拉model x蓝凌智能OA雅迪电动车新闻发布会iqoo顶级旗舰 有道词典告诉你,现代孩子学习工具有多强 滴!浪潮云“春节守护计划”已经上线...
日期:07-16
中国洗碗机论坛「破解中国洗碗机普及“人货场”问题,行业进入提速“关键期”」
“精致”与“懒”从不是对立的词汇,人类科技的持续进步就是我们利用巧思不断释放体力劳动负担的过程,从纺织机到生成式大模型概莫如是。而日常生活中,“科技解放双手”的例子也...
日期:09-16
英特尔中国正式发布2022-2023企业社会责任报告_英特尔公司中国
通信世界网消息(CWW)2023年11月7日,在第六届中国国际进口博览会ESG与可持续发展领导力论坛上,英特尔正式发布2022-2023英特尔中国企业社会责任报告。报告基于履责、包容、可持续...
日期:11-08
ipad9为什么便宜「涨价上千元!iPad 10与iPad 9有啥区别?一文看懂」
在iPhone 14系列发布一个月后,苹果又出新品了,原本应该是主打低价的iPad产品线这次涨价了,iPad 10直接上涨千元,起售价3599元起。iphone14取消sim卡槽还能黑解吗亚马逊收购全食...
日期:10-21
专家再谈苹果5G虚标:不显示真实网络就是欺骗消费者_苹果显示5g网络是真的吗
【手机中国新闻】9月12日,在苹果秋季新品发布会举办前夕,通信专家项立刚发微博再谈苹果5G虚标,称苹果手机不显示真实网络,这对消费者来说就是虚假的信息。项立刚科普说,手机的角...
日期:09-12
苹果手机的静音开关主要针对什么「手机也有性格!“iPhone ePhone”梗引热议 你常年开静音吗?」
快科技8月1日消息,今日,一则iPhone ePhone”的话题突然登上微博热搜第一,引起很多网友讨论,也有一些网友表示看不懂。据了解,有博主发文调侃称常年静音的手机是iPhone,常年外放声...
日期:08-01
业内首家!阿里达摩院遥感AI大模型亮相:让AI下沉到田间地头_阿里达摩院人工智能实验室
快科技10月22日消息,据达摩院官方公众号消息,阿里达摩院发布了业内首个遥感 AI 大模型(AIE-SEG)。遥感技术在城市运营、耕地保护、应急救灾等国计民生中应用甚广,遥感AI则可大幅...
日期:10-22
数智乡村 联接美好|华为携手多方伙伴共助乡村发展_数字乡村与智慧乡村
通信世界网消息(CWW)6月6日,第31届中国国际信息通信展览会期间,以“数智乡村 联接美好”为主题的华为TECH4ALL数字包容主题媒体沙龙活动在北京成功举办。活动邀请了中国信通院、...
日期:06-09
海鲜加工厂的狠活:硼砂泡出黄金鲍 产品卖相变高端
据新京报报道,就在315消费者权益日来临之际,有人爆料称一家海鲜加工厂使用硼砂泡制“黄金鲍鱼”。为此,记者冒充操作工暗访该加工厂。该企业主要生产加工海参和黄金鲍鱼。谷歌...
日期:03-15
全球最高刷新率电竞屏亮相,TCL华星登陆CJ2021
  7月30日,中国国际数码互动娱乐展览会(以下称“ChinaJoy”)与第三届国际显示博览会(以下称“UDE”),同期同地在上海新国际博览中心举办,TCL携诸多产品参展。   在本次双...
日期:11-21
小鹏汽车严打充电桩“霸位”!超时占位每分钟1元 比特斯拉便宜
快科技8月8日消息,随着电动汽车市场快速发展,充电桩也变得越来越抢手,尤其是车企在热门商圈设立的充电桩,经常会发现一些车即使充完电,甚至没充电占用充电桩的情况,原因其实也与商...
日期:08-08
前苹果高管打造AI穿戴设备:无屏幕设计 支持投影、语音
快科技11月10日消息,据媒体报道,前苹果设计师和工程团队高管成立的初创公司Humane发布了名为AI Pin的AI穿戴设备。平面设计工具有哪些据悉,这款设备是一款可以吸附在衣服上的微...
日期:11-11
李佳琦与母亲合开新公司 李佳琦持股比例99%
据天眼查App消息,上海琦焜管理咨询有限公司正式成立,该公司的法人代表和执行董事是李文利(李佳琦的母亲),注册资本为100万人民币,主要业务包括企业管理咨询、文艺创作、文化艺术交...
日期:07-21
百度世界开发者分论坛“框计算”成绩斐然
9月2日,百度世界大会如期开启,其中以“拥抱开放,创新应用”为主题的开发者分论坛得到了众多关注。百度副总裁王梦秋、百度产品架构师田晓萌等为到会嘉宾分享了百度开放平台取...
日期:07-22
全球首款徕卡天玑旗舰!小米13T来了:官方开始预热
快科技9月5日消息,小米在社交平台上发布了一段预热视频,视频结尾出现了字母”T,暗示小米13T系列即将登场。目前小米13T系列已经获得海外认证,包含小米13T和小米13T Pro两款机型,...
日期:09-05
switch更新2021「任天堂Switch大版本更新:两项更新」
近日,任天堂Switch终于推送了新的版本更新,自上一次更新推送已经经过了很久,而此次主要更新了两大内容:氢能电动自行车在启动或重启软件时,如果用户的昵称中含有不能使用的单词,则...
日期:03-01
淘特上线两款智能新品“微店铺”和“心动搜索”_「淘特官方直营店」
11月16日消息,淘特宣布上线两款智能产品:淘特“微店铺”和“心动搜索”。amd什么时候支持ddr52019年百度沸点据介绍,淘特“微店铺”和“心动搜索”基于淘特搜索逻辑研发出的体...
日期:11-23
最新!支付宝可一键取消自动扣款,网友:再也不用吃“哑巴亏”了
编辑/李泽东;;   据中新经纬微博7月28日消息,近日,有网友发文称自己收到了许久不用软件的自动扣款通知,“每月都扣我12元”。   点开扣款通知后,该网友发现平台上线了一键“...
日期:07-31
2021 关于未来安全的几点思考(2021年安全形势)
  2020年是不同寻常的一年。这一年,疫情黑天鹅事件突袭,掀起了“新基建”的又一轮热潮,以5G、大数据、人工智能、云计算等为代表的新技术备受瞩目,远程办公、在线教育、直播...
日期:07-16