您的位置:首页 > 互联网

Meta发布类GPT-4o多模态模型Chameleon_多模态mri技术

发布时间:2024-05-21 16:09:05  来源:互联网     背景:

5月21日 消息:Meta最近发布了一个名为Chameleon的多模态模型,它在多模态模型发展中设立了新的标杆。Chameleon是一个早期融合的基于token的混合模态模型家族,能够理解并生成任意顺序的图像和文本。它通过一个统一的Transformer架构,使用文本、图像和代码混合模态完成训练,并且对图像进行分词化,生成交错的文本和图像序列。

Chameleon模型的创新之处在于其早期融合方法,所有处理流程从一开始就映射到一个共同的表示空间,让模型能够无缝处理文本和图像。它在各种任务上展示了广泛的能力,包括视觉问答、图像标注、文本生成、图像生成和长形式混合模态生成。在图像标注任务上,Chameleon达到了最先进的性能,并且在文本任务上超越了Llama-2,与Mixtral8x7B和Gemini-Pro等模型竞争。

论文地址:https://arxiv.org/pdf/2405.09818

mr多模态

Chameleon模型在技术上面临了重大挑战,Meta的研究团队引入了一系列架构创新和训练技术。例如,他们开发了新的图像分词器,基于8192大小的codebook,将512×512的图像编码为1024个离散的token。此外,Chameleon使用了sentencepiece开源库训练的BPE分词器。

在预训练阶段,Chameleon使用了混合模态数据,包括纯文本、文本-图像对以及文本和图像交错的多模态文档。预训练分为两个阶段,第一阶段无监督学习,第二阶段混合更高质量的数据。

Chameleon模型在基准评估中全面超越了Llama2,在常识推理、阅读理解、数学问题和世界知识领域都取得了显著的效果。在人工评估和安全测试中,Chameleon-34B的表现也远远超过了Gemini Pro和GPT-4V。

尽管Chameleon缺少GPT-4o中的语音能力,但Meta的产品管理总监表示,他们非常自豪能够支持这个团队,并希望让GPT-4o更接近开源社区。这可能意味着不久的将来,我们可能会得到一个开源版的GPT-4o。

Chameleon模型的发布,展示了Meta在多模态模型领域的重大进展,它不仅推动了多模态模型的发展,也为未来的研究和应用提供了新的可能性。

多模态embedding

骆驼股份是干什么的


返回网站首页

本文评论
演唱会黄牛一般加价多少「700场演出市场的复苏,从黄牛的朋友圈开始」
声明:本文来自于微信公众号 娱乐独角兽(ID:yuledujiaoshou),作者:把青,授权转载发布。“今年演出是我卖票7年最看不懂的一年。”最近一位黄牛的吐槽截图登上了微博热搜榜,黄牛几...
日期:03-30
国际赛事再现中国科技力量!科大讯飞成为布达佩斯WAC 2023供应商「科大讯飞 发布会新品」
(原标题:国际赛事再现中国科技力量!科大讯飞成为布达佩斯WAC 2023供应商) 印度近几年智能手机出货量报告 近期,一则振奋人心的好...
日期:08-21
郑州隐翅虫「河南多地已发现隐翅虫:毒液堪比硫酸 见到千万别拍」
快科技9月18日消息,最近河南地区又有不少人发现了隐翅虫,热搜话题下不少网友都表示被隐翅虫叮咬过。cpu和gpu处理器哪个系列最好DirectX12 Ultimate从大家晒出的照片可以看出,...
日期:09-18
IMX890+OIS光学防抖,12G+256G降至1689元,OPPO千元机果然公道_ois光学防抖是什么意思
花更少的钱买到更超值的手机,我想这是每一位用户的期望,然而事实却不是如此。在短视频爆火的年代,我以为山寨机已经消失了,结果它以直播的形式出现在了不少很多带货直播间,蹭着最...
日期:10-01
腾讯否认微信将推出公务员专供版:这玩笑开大了「腾讯和公务员哪个好」
7月19日 消息:最近有传言称,微信将推出“公务员专供版”,撤回时间将由原本的两分钟延长至两小时,部分领导的撤回时间甚至可延长至两天。曝一加11R详细规格苹果被曝出严重安全漏...
日期:07-19
联想坐稳一哥:PC市场份额高达42.3% 再创历史新高_联想pc市场占有率
11月15日,联想中国区召开2022/23上半年财年(4-9月)总结大会。会上,联想集团执行副总裁兼中国区总裁刘军表示,克服重重不利因素,PC市场份额保持稳定,销售额市场份额再创历史新高达42...
日期:11-17
360智能工厂在什么地方「360 AIGC产品定名360智脑、360鸿图」
快科技5月18日消息,第七届世界智能大会今日在天津开幕,周鸿祎在会上展示了两款大模型产品360智脑”及AI生图工具360鸿图”。展示过程中,360智脑”体现了强大的理解力和推理力,在...
日期:05-18
虎牙Q2总收入18.2亿元,净利润1.15亿元
8月15日晚间消息,虎牙公司(NYSE:HUYA)公布了2023年第二季度财报。财报显示,2023年第二季度,虎牙公司总收入为18.2亿元;在非美国通用会计准则下,该季度归属于虎牙公司的净利润为1.15...
日期:08-15
小米海外复制中国模式成功!郭明錤:Q4小米手机出货量将达4500万部
快科技10月13日消息,天风证券分析师郭明錤今天发布了"新生小米蓄势待发:手机业务重拾成长超预期,汽车业务迎向新风口"的文章。在这篇文章中,郭明錤对小米的汽车和手机业务进行了...
日期:10-16
快递公司开始复工!_物流公司什么时候复工
  (原标题:快递公司开始复工!申通、韵达、中通等宣布今日全面恢复正常运营)   企业推迟返工,加上部分地区交通管控,很多商品即便商家备好货,都在等待快递公司揽收,随着快递...
日期:04-17
中国矿业大学校花「1100万元的捐赠没给 中国矿业大学起诉90后校友」
2019年4月,中国矿业大学迎来110周年校庆,90后校友、镜湖资本创始合伙人吴幽宣布捐赠1100万元,这是该校史上最大一笔捐款。新氧科技股价国际航空碳抵消和减排计划然而这笔捐赠并...
日期:03-08
从Wireshark抓包看HTTPS的加密功能
  近几年,互联网发生着翻天覆地的变化,尤其是我们一直习以为常的HTTP协议,在逐渐的被HTTPS协议所取代,在浏览器、搜索引擎、CA机构、大型互联网企业的共同促进下,互联网...
日期:03-24
三星翻盖手机_三星翻盖手机老款型号大全
随着智能手机的普及,翻盖手机逐渐被人们所忽略。然而,像三星这样的电子巨头一直把翻盖手机作为重要产品线之一,并不断推出新款翻盖手机来满足市场需求。最初是以其经典的“Soul...
日期:06-01
特斯拉股价创下十年以来最大单周涨幅 暴涨33%「特斯拉今年最高股价」
1月28日消息,本周,特斯拉股价飙升33%,创下2013年5月以来的最好单周表现。美国当地时间周五,特斯拉股价上涨了11%,连续第二日盘中涨超10%,全周涨逾33%。在此之前,特斯拉股价在六个月...
日期:01-28
“川普”、“粤普”、“湘普”,哪里的普通话最不标准?_普通话不标准的省份
普通话是中国的官方语言之一,也是全国范围内使用最广泛的语言。然而,由于中国地域广阔,方言众多,不同地区的普通话发音存在差异,有些地区的普通话发音甚至不太标准。根据语言学家...
日期:12-03
消息称流媒体平台HBO Max将裁员14%:减少与Discovery+的重叠服务(HBO MAX流媒体平台)
互联网安全峰会   讯 北京时间8月16日早间消息,据报道,知情人士透露,华纳兄弟探索公司将在其流媒体平台HBO Max裁员70人,主要来自该部门的现实部门、演员阵容和收购部门。  ...
日期:08-17
pc硬件涨价「PC销量真凉凉:用户需求锐减 CPU/显卡/SSD等厂商都要大降价清货」
PC行业销量越来越差已经是不争的事实了,不少巨头已经开始调低了自己的盈利预期,这也是为什么最近半导体公司股价大跌的原因。苹果5g专利是谁的小米上半年销量统计机构IDC发布...
日期:10-12
Midjourney 进阶提示用法 25个让人惊叹的midjourney网页设计
注:本文图片均由midjourney生成网页设计水平停滞不前?没想法?没灵感?如果你想突破这种停滞不前的状态,可以试一试用midjourney进行网页设计。虽然在文字处理上,midjourney还有...
日期:06-09
微软CEO纳德拉:AI像是互联网那样的巨浪 改变了规则
8月18日消息,微软专注于人工智能(AI)技术的研发,并在OpenAI身上投入100多亿美元绝非偶然。该公司首席执行官萨蒂亚·纳德拉(Satya Nadella)认为,AI对公司以及整个行业的影响将与互...
日期:08-18
快手杨远熙:希望通过“短视频+”方式,赋能更多实体产业
11月9日,在2023年世界互联网大会乌镇峰会“互联网企业家论坛”上,快手联合创始人杨远熙表示,快手始终坚持让“平等普惠、真实向善”的价值观来引导创新,持续推进产品创新、模式...
日期:11-10