您的位置:首页 > 互联网

Prismer: 一个专家集合的视觉语言模型 支持多节点训练

发布时间:2023-07-25 15:35:28  来源:互联网     背景:

7月25日 消息:prismer 是一种视觉语言模型的实现,旨在提供一个具有专家集合的系统。该系统基于 PyTorch1.13开发,使用了 Huggingface 的加速工具包,支持多节点多 GPU 的训练。它可以进行图像描述和视觉问答等任务,并且在预训练和微调方面都取得了良好的性能。通过继承来自公开的、预先训练的领域专家的大部分网络权重并在训练期间冻结它们,Prismer 只需要训练几个组件。

image.png

app store apple music怎么退款

苹果支付垄断

项目地址:https://github.com/nvlabs/prismer

核心功能:

1. 提供了 Prismer 和 PrismerZ 两种模型的预训练和微调检查点,可以进行零 - shot 图像描述和视觉问答任务。

2. 支持使用多个专家模型进行集合,提高模型的表现。

3. 提供了用于生成专家标签的工具,以构建多标签数据集。

4. 支持使用自定义数据集进行训练和微调,并提供了训练和评估脚本。

5. 提供了一个简洁的示例,可在单个 GPU 上进行图像描述任务。

优点:

Prismer 模型有几个优点,但最值得注意的优点之一是它在训练时非常有效地使用数据。Prismer 构建在预训练的纯视觉和纯语言骨干模型之上,以实现这一目标,并大幅减少获得与其他最先进的视觉语言模型同等性能所需的 GPU 时间。人们可以使用这些预先训练的参数来使用大量可用的网络规模知识。

研究人员还为视觉编码器开发了多模态信号输入。创建的多模态辅助知识可以更好地捕获有关输入图像的语义和信息。Prismer 的架构经过优化,可以最大限度地利用经过培训的专家,并且可训练的参数很少。

研究人员在 Prismer 中纳入了两种经过预培训的专家:

  • 主干网专家负责将文本和图片翻译成有意义的标记序列的预训练模型分别称为“仅视觉”和“仅语言”模型。

  • 根据训练中使用的数据,话语模型的主持人可能会以各种方式标记任务。

特性

  • 知识渊博的人越多,结果就越好。随着 Prismer 模态专家数量的增加,其性能也随之提高。

  • 专业技能越强,结果越高 研究人员用均匀分布中的随机噪声替换部分预测深度标签,以创建损坏的深度专家,并评估专家质量对 Prismer 性能的影响。

  • 抵制无益的意见 研究结果进一步表明,当噪声预测专家加入时,Prismer 的性能是稳定的。


返回网站首页

本文评论
风投DST试水京东 以5亿美元换取了京东5%的股份_京东的风投机构
  俄罗斯数字天空技术(DST)大股东之一、俄罗斯富翁Alisher Usmanov透露,在中国电子商务企业京东商城的第三轮15亿美元融资中,DST以5亿美元换取了京东5%的股份。   这意味着...
日期:07-27
12集短剧集《我是余欢水》在爱奇艺内容热度突破7000(我是余欢水 爱奇艺)
  12集短剧集《我是余欢水》目前在爱奇艺站内内容热度值已突破7000,热度呈持续上涨趋势。自4月6日在爱奇艺上线至今,《我是余欢水》不仅成功点燃了用户的追剧热情,更受到行...
日期:07-18
工信部点赞!微呼科技疫情防控外呼机器人表现突出
  6月19日,工信部官网公布《在科技支撑抗击新冠肺炎疫情中表现突出的人工智能企业名单》的通知,为榜单中企业积极响应、主动作为、攻坚克难、开拓创新的精神点赞。微呼科...
日期:07-14
京东上门换新服务新增催收功能「京东催收打电话要上门,我该怎么回答」
9月29日 消息:今日,京东京麦商家中心宣布,京东为优质用户提供的售后特色服务“上门换新”新增催收功能。据介绍,上门换新是为优质用户提供的一项售后特色服务。当信誉等级在3星...
日期:10-01
马斯克要“大赦”推特:让被封账号都回归「马斯克新推特」
凤凰网科技讯 北京时间11月24日消息,推特新老板埃隆马斯克(Elon Musk)已经解封了美国前总统特朗普的账户,但是他似乎还不满足。周三,他再次发起线上民意调查,想要在推特上发布“...
日期:11-25
CBSI:牵手百度联盟蜜月吸金 共促产业健康发展
  “CBSI旗下所有媒体都跟百度有全面而深入的合作,我希望‘蜜月期’能一直持续下去。” CBSi(中国)高级副总裁刘小东在2011年百度联盟峰会上对记者说。   作为全球最大...
日期:07-27
你觉得李彦宏「李彦宏的这个野心太大了」
出品|虎嗅医疗组作者|陈广晶题图|视觉中国李彦宏的AI“黑马”终于闯进医药圈了?中秋节前,百度CEO李彦宏牵头创办的百图生科,在北京举办了北京中心实验室开业仪式,同时首次正式对外...
日期:09-21
号称最强Win掌机!AYANEO高端掌机“鲲”真机现身
快科技7月7日消息,今天,AYANEO官方公布了旗下高端掌机AYANEO KUN 鲲”的真机外观。三星 galaxy s22ultra从外观来看,Kun的设计沿用了AYANEO一贯的设计风格,但由于双触控板的加入...
日期:07-08
生产环境触目惊心!汕头知名橄榄菜企业被连夜查处:线上平台火速下架
食品安全一直都是消费者最关注的问题,今天是3.15消费者权益日”,又到了商家大考时间,不知道今年会有多少不良商家被曝光。在3.15”前夕,南方日报报道曝光了汕头一家知名橄榄菜企...
日期:03-15
荣耀magic2屏幕是什么牌子「9.9mm厚度刷新全球记录!荣耀Magic V2屏幕由国产维信诺打造」
快科技7月13日消息,昨晚荣耀正式发布了新一代折叠屏旗舰Magic V2,仅有9.9mm的厚度刷新了行业记录,让折叠屏手机第一次进入了毫米时代。而在这背后,除了荣耀自身对于铰链结构、电...
日期:07-13
斩获卓越大奖,北银金科实力闪耀中国金融科技国际峰会(全球金融科技大赛)
  5月28日,第三届中国金融科技峰会将在上海举行。本次峰会以“融合·创新·挑战”为主题,围绕“全球金融科技监管新趋势”、“科技驱动金融创新”、“数字化时代金融与科技...
日期:01-13
2023科技业展望:ChatGPT变得更强?马斯克还会整什么幺蛾子?
凤凰网科技讯 北京时间1月3日消息,2023年的钟声已经敲响,在接下来的这一年里,科技行业有哪些值得关注的人和事呢?以下从行业趋势、焦点人物、风险和惊喜四个方面对2023年的科技...
日期:01-03
特斯拉宏图之第二篇章_马斯克最新大饼:特斯拉的“宏图”第三篇章猜想
  北京时间 3 月 21 日消息,特斯拉公司 CEO 埃隆・马斯克 (Elon Musk) 上周发布推文称,他正在制定“宏图”(Master Plan) 的第三篇章。那么,马斯克会在这个总体规划的第三篇...
日期:07-09
MAXHUB X+计划实现三大升级 携手阿里云无影赋能智慧办公
2023 年 5 月 9 日,MAXHUB携手阿里云无影等生态合作伙伴在"2023 MAXHUB领效 新品发布会"上共同发布全新"X+计划",将围绕硬件底座、软件平台、集成管理三大维度,构建从产品到方...
日期:05-10
团购平台市场份额_一淘团购报告:8月生活服务团市场份额下降 实物商品需求增大
近日,国内最大的购物搜索引擎一淘网( www.etao.com )发布了 8 月团购行业消费趋势报告,报告通过对用户 8 月在一淘团购搜索( tuan.etao.com )的商品关键词搜索、访问量进行统计与...
日期:07-22
雷军已经用上小米13和小米13 Pro「小米笔记本air13和13.3」
一早小米已经官宣了小米13系列手机,12月1日就会正式发布并且开售,而目前小米的一众高管都已经换上了小米13系列。包括雷军、卢伟冰等人在内的小米高管、官微也都换上了小米13...
日期:11-29
百度地图API发布1.2版本(百度地图5.0版本)
百度地图自去年正式对外宣布开放API(应用程序接口)以来,得到了开发者、广大站长和网民的极大欢迎。近日,又连发重磅消息,上线了文件更小、加载更快、性能更强的百度地图API 1....
日期:07-28
宁德时代:未运营“宁德时代”App及发售“宁德时代锂电池”
3 月 3 日讯:宁德时代在互动平台表示,公司并未运营“宁德时代”App及发售“宁德时代锂电池”、“宁德时代专属社会公众股”理财投资产品。iphone15系列将采用高通基带机器人...
日期:03-03
特斯拉慌了!蔚来CEO李斌再放豪言:明年销量超过雷克萨斯「特斯拉与蔚来销量」
12月25日消息,在昨晚的NIO DAY 2022上,蔚来正式发布了新款智能旗舰SUV蔚来ES8和轿跑SUV蔚来EC7,同时还带来了第三代换电站以及500kW的充电桩。今日蔚来CEO李斌在接受采访时表示...
日期:12-26
我国数字经济规模达7.1万亿美元 位居世界第二(我国数字经济规模达7.1万亿美元 位居世界第二高位)
昨天,在2022全球数字经济大会主论坛上,中国信息通信研究院发布的《全球数字经济白皮书(2022年)》显示,2021年全球47个主要国家数字经济增加值规模达到38.1万亿美元。中国数字经...
日期:07-31