您的位置:首页 > 互联网

transformer 多模态「Hugging Face推开源多模态AI模型IDEFICS 支持图像、文本输入」

发布时间:2023-08-23 20:44:46  来源:互联网     背景:

本文概要:

1. Hugging Face 推出开源多模态 AI 模型 IDEFICS,支持图像和文本输入。

2. IDEFICS 基于 DeepMind 的 Flamingo 视觉语言模型,表现与专利模型相当。

3. IDEFICS 有90亿和800亿参数版本,支持生成连贯的文本。

全国联保一定是正品吗

8月23日 消息:最近, Hugging Face 推出了一个名为 IDEFICS 的开源多模态 AI 模型,它可以接受图像和文本作为输入,并生成连贯的文本输出。

transformer 多模态

IDEFICS 是一个强大的视觉语言模型,拥有高达800亿的参数量,功能包括根据图像生成描述、回答相关问题以及根据多个图像生成叙述等。

IDEFICS 基于 DeepMind 开发的 Flamingo 模型,后者是一种目前最先进的视觉语言模型,但尚未对外开源。相比之下,IDEFICS 作为 Flamingo 的开源实现版本,其测试结果显示在各类图像理解任务上其表现与 Flamingo 相当。

为训练 IDEFICS,Hugging Face 利用了多种公开的数据集,还额外构建了一个包含1.4亿张图像的大规模图像-文本数据集。

苹果app store的软件太多广告

transformer 多模态

IDEFICS 有两个版本,包括90亿参数的基础版和800亿参数的大模型版,可以处理不同的应用场景。

IDEFICS 的推出为研究人员和开发者提供了一个强大的开源视觉语言模型,相比专利系统如 GPT-3,它提供了更大的灵活性。同时,IDEFICS 也显示出生成式模型处理多模态输入的潜力。

未来如果能进一步提升多模态理解和生成能力,将可以大幅推动诸如机器人、自动驾驶等多模态 AI 应用的发展。

项目网址:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground


返回网站首页

本文评论
裸机值得买吗_各种“Phone”辈出 购买裸机或更划算
  近日,深圳的手机市场正上演一场名为“Phone”的大戏,但主角不只有iPhone了。联想“乐Phone”热卖、移动多款新的“OPhone”蓄势待发。中国联通则在3月1日高调推出了具有...
日期:07-26
马斯克发推特说市值「马斯克3200亿完成收购:推特将从纽交所退市」
日前,马斯克已完成以440亿美元(约合人民币3220亿)将推特私有化的交易,并已掌管公司。马斯克本人还抱着一个水槽入主了推特总部,并第一时间解雇了多名高管,包括CEO Parag Agrawal、...
日期:10-29
亮点剧透!河北联通电商直播解决方案暨5G京畿发布会即将举办「中国联通 河北」
亮点剧透!河北联通电商直播解决方案暨5G京畿发布会即将举办 通信产业网|2023-06-12 18:38:42作者:通文来源:通信产业网【通信产业网讯】6月13日,河北联通电商直播解决方案暨5G京...
日期:06-13
中国联通魏进武:坚持5G-A/6G协同发展,推动无线网络平滑演进「联通魏勇帆」
近日,由中国通信企业协会主办的5G应用创新大会在广州召开。中国联通研究院副院长魏进武出席大会并发表《坚持5G-A/6G协同发展,推动无线网络平滑演进》主题演讲。宝马车保险比...
日期:08-01
摩托罗拉折叠屏手机什么价格「摩托罗拉折叠屏3999元开售」
摩托罗拉的新机motorazr 40凭借3999元的价格把折叠屏的价格卷进4000元大关,目前已经在各大电商平台正式开售,8 128GB版本的价格为3999元,顶配版12GB 256GB也只要4699元。moto r...
日期:06-19
三星one ui苹果体验「三星在的One UI 5.0测试版中复制了iOS 16的锁屏定制功能」
iOS 16的最主要功能之一是锁屏定制功能。该功能与iPhone 14 Pro上的"灵动岛"相结合,为用户如何定制锁屏和创造真正属于自己的个性化内容提供了新的思路,从一开始推出就收到认...
日期:10-01
ChatGPT已能操控机器人,工程师连代码都不用写,网友:微软在搞天网?
声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:Alex,授权转载发布。好家伙,微软又玩出新花样当我还在跟ChatGPT吹牛尬聊时,有人已经在拿它操控机器人了。不是别人,正是OpenAI...
日期:03-27
3D虚拟人AIGC产品,或是最快规模化落地的大模型应用
声明:本文来自于微信公众号 子弹财观(ID:wwwhygc),作者:蓝齐,授权转载发布。虚拟人在国内发展已经有些年头,如较早出现的小冰,或随处可见的一些办事大厅的服务机器人。与其说他们...
日期:08-18
互动百科告百度垄断 被指借官司博眼球(百度算垄断吗)
  据新京报报道,认为自己的网站在百度搜索中被屏蔽,百科网站“互动百科”将北京百度网讯科技有限公司(简称百度)诉至一中院,要求百度停止滥用市场支配地位的行为,对原告网站...
日期:07-24
Intel推出Aurora genAI大模型 将应用于科学计算领域
5月23日 消息:Intel推出了Aurora genAI大模型,具有1万亿的参数量。Aurora genAI模型主要用于科学计算领域,包括生物学、癌症、大气科学、天文学、高分子化学等多个领域。Auror...
日期:05-23
高通骁龙8 Gen3/天玑9300劲敌!曝三星Exynos 2400重出江湖
快科技8月15日消息,据报道,三星下一代Exynos平台Exynos 2400将于明年年初回归,首发机型是三星自家的Galaxy S24系列,它的综合性能对标高通骁龙8 Gen3以及联发科天玑9300。据悉,Ex...
日期:08-15
特斯拉Cyberquad玩具车国内卖11990元!满电能跑13公里「model玩具」
快科技7月13日消息,今日,特斯拉中国官网正式公布Cyberquad玩具车售价——11990元,将于明天上午10:00在特斯拉中国官网、天猫/京东特斯拉官方旗舰店开售。从外观设计来看,Cyberqu...
日期:07-14
特斯拉前AI主管宣布将加入马斯克创立的OpenAI「特斯拉总裁马斯克人工智能」
2月9日消息,据外媒报道,特斯拉前人工智能(AI)主管安德烈·卡帕西(Andrej Karpathy)宣布,他将加入马斯克创立的美国人工智能研究公司OpenAI。iphone11pro充电断断续续5年多前,卡帕西...
日期:02-09
上汽集团2021年3月汽车销量「汽车之家2022年第三季度营收18.43亿元 净利润5.078亿元」
11月4日 消息:汽车之家发布了截至2022年9月30日止第三季度业绩。2022年第三季度,该集团期间内净收入总额为18.43亿元(人民币,下同),同比增加4.48%;归属于汽车之家的净利润为5.08...
日期:11-06
AI攻陷谷歌广告联盟,垃圾内容为何能骗到广告费_谷歌广告联盟收益如何获得
声明:本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,,授权转载发布。自去年年末ChatGPT用近乎于人类的对话能力,迅速使得大语言模型成为了资本市场的宠儿,也被外界认为...
日期:07-04
魅族推出魅客平台:分享平台内容后产生订单可获得奖励_魅族应用商店红包
  8月6日消息 根据魅族论坛的消息,魅族社区推出了魅客平台,今天开启内测。官方称分享平台内的内容产生有效订单,即可获得奖励。   魅族表示,魅客平台是魅族为回馈热爱魅族...
日期:07-09
三星Galaxy Z Flip5折叠屏曝光:外屏更大、后置横排摄像头_三星zflip5g折叠屏手机参数
近期,传出三星 Galaxy Z Flip5 折叠屏手机的最新消息。据悉,该手机的外屏尺寸较上一代产品有所增大,并且形状犹如“文件夹”,因此整体辨识度较高。此外,手机的后置摄像头采用了横...
日期:06-30
KubeCon + CloudNativeCon + Open Source Summit 2019大会第二天看点不断!
  导读: 2019年6月24日,由 CNCF 和 Linux 基金会共同举办的 KubeCon + CloudNativeCon + Open Source Summit 2019大会在上海世博中心盛大召开。来自全球各地的开源及云原...
日期:11-11
罗永浩回应在淘宝直播间卖卫星:有百万级大额优惠「罗永浩直播卖的是真的吗」
3月31日 消息:3月31日罗永浩淘宝直播间官宣,将于今晚8点首次直播卖卫星,同时还会进行百万级大额优惠,“把卫星价格打下来”。这是首次航天卫星通过直播电商平台面向大众销售。...
日期:04-01
亚马逊砍掉在线医疗业务 科技巨头为何做不好互联网医疗?「美国互联网医疗巨头」
  亚马逊此举对全球互联网医疗发展有何影响?是否意味着互联网医疗陷入了无法突破的发展困境?  随着互联网的普及、信息科技的高速发展,零售、物流、金融、餐饮等诸多行业原...
日期:09-04