您的位置:首页 > 互联网

拥有图像识别、自然语言推理能力-苹果推出300亿参数多模态AI大模型MM1.5

发布时间:2024-10-13 21:14:57  来源:互联网     背景:

快科技10月13日消息,近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。

该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在Hugging Face上发布。

MM1.5提供了从10亿到300亿的多种参数规模,拥有图像识别和自然语言推理能力。

在新版本中,苹果公司的研发人员改进了数据混合策略,极大地增强了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的能力。

宏达股份为什么这么跌

参考论文可知,团队在MM1.5的持续预训练阶段引入了高质量的OCR数据和合成图像描述,这显著提高了模型对包含大量文本的图像的理解水平。

此外,研究人员在监督式微调阶段深入分析了不同数据类型对模型表现的作用,优化了视觉指令微调数据的混合方式,使得即便是小规模的模型(如10亿、30亿参数版本)也能有出色的发挥,实现了更高的效率。

值得一提的是,苹果公司这次还推出了专门用于视频理解的MM1.5-Video模型和专门处理移动设备用户界面(UI)理解的MM1.5-UI模型。

其中,MM1.5-UI模型未来有望成为iOS背后的“苹果牌”AI,能够处理各种视觉引用与定位任务,还能总结屏幕上的功能,或者通过与用户的对话进行交互。

尽管MM1.5模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从而让“苹果牌”AI更强大。

苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力

 


返回网站首页

本文评论
天猫:今年双11,有82家品牌会员成交额破亿「天猫双11成交额3723亿」
11月3日 消息:今日下午,天猫发言人官方微博发布天猫会员成交过亿俱乐部名单。小米13pro210w超级闪充今年iphone11双十一优惠微软公司遍布多少个国家北京禁止虚拟货币交易官方...
日期:11-12
Twitter获得Tweet商标 未透露是否支付转让费_购买twitter
  10月11日消息,据国外媒体报道,微博服务提供商Twitter即将获得tweet注册商标权。周一,网络广告服务商Twittad首席执行官詹姆斯·埃利亚森(James Eliason)在接受采访时表示,T...
日期:07-23
firefox开发者「Firefox 启用 “新架构”,速度成倍提升」
声明:本文来自于微信公众号OSC开源社区(ID:oschina2013),授权转载发布。曾几何时,浏览器比现在简单得多。浏览器就是一个单一的操作系统进程,所有的一切都发生在一个进程中。这对...
日期:12-29
美国猎鹰9号火箭把龙号「打的就是SpaceX猎鹰9号!大型液体运载火箭天龙三号2024年6月首飞」
今年4月,天兵科技历经三年研制的天龙二号液体运载火箭成功首飞,一举打破了全球23年以来私营液体火箭首飞全部失利的世界级航天魔咒”,创下多项国内和国际记录。iphone最值得入...
日期:11-10
京东:采销等一线员工涨薪近100% 明年1月开始实施_京东涨工资吗
京东集团在12月27日晚间发布公告,从2024年1月1日开始,京东的一线采销员工将享受年薪的近100%的大幅提升,而京东零售的所有员工在2024年年初也将平均涨薪不低于20%电动车国际评...
日期:12-28
小度q k「小度青禾学习手机首销在即 来京东618入手新机享30天无忧试」
5 月 31 日晚 8 点,京东 618 将全面开启,预售产品可以付尾款、等收货了。作为参与今年京东 618 的一份子,小度青禾学习手机也于 5 月 31 日晚 8 点在京东开启首销。该款产品在...
日期:05-31
苹果11 pro跑分「iPhone 14 Pro跑分世界第二 第一是荣耀旗舰机」
iPhone 14 Pro发售已经三周了,而目前DXO的相关跑分已经公布,随着DXOMARK的大版本升级,手机影像部分进入第五个版本,评分机制也有了新的调整。最终iPhone 14 Pro总分高达146分,位...
日期:10-02
2024领星ERP纵横增长跨境电商亚马逊卖家峰会来了,9月20日深圳见!
360推广有手机端吗免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。...
日期:08-22
SSD价格下跌无底洞!还有水分没榨干「ssd价格暴涨」
快科技6月25日讯,最近一段时间尤其是618年中大促期间,大家入手SSD没?统计发现,今年1~3月份,SSD产品价格下滑了15~30%,而4~6月,这个跌幅数字再次来到了25%。市场平均来看,1TB/2TB/4TB...
日期:06-25
互联网大厂的“医疗健康梦”:不同的故事,同一个结果?
21世纪经济报道记者 朱萍 实习生 师梦娇 近日,美中宜和发生工商变更,小荷健康增持相关股权,对美中宜和全资控股。本次增持后,小荷健康香港有限公司、小荷健康科技(北京)有限公司...
日期:08-11
中国信科精彩亮相2024MWC上海_中国信科集团百度百科
通信世界网消息(CWW)6月26日-28日,2024MWC上海世界移动通信大会在上海新国际博览中心举行。中国信科以“连接数字化美好未来”为主题亮相盛会,在“新连接”、“新算力”、“新业...
日期:06-27
女网红半藏森林AI克隆人诞生:包月30元 1万用户1年收入可高达360万元_半藏森林哪里整的容
快科技6月3日消息,日前,小冰公司宣布首批网红GPT克隆人”上线,其中包括拥有百万粉丝的女网红博主半藏森林”成为首批AI克隆人参与制作者。据了解,AI半藏森林目前提供42冰花/月(6...
日期:06-03
今日寒露:唰一下就深秋了_今日寒露的唯美句子
快科技10月8日消息,今天正式迎来二十四节气中的寒露”。寒露是秋季的第五个节气,天气由凉转寒,自此进入深秋。寒露是一个反映气候变化特征的节气。进入寒露,时有冷空气南下,昼夜...
日期:10-08
大模型部署昂贵的原因:用最贵的模型处理最基本任务,犹如“让兰博基尼送披萨”
声明:本文来自于微信公众号 InfoQ(ID:infoqchina),作者:冬梅,授权转载发布。1.OpenAI 计划推出新功能吸引开发者,称开发成本最高降至5%近日,路透社援引消息人士称,为了吸引更多企业和...
日期:10-16
百度地图车道级定位「百度地图车道级安全预警高阶版上线:首发公交车鬼探头预警」
快科技8月16日消息,今日,百度地图宣布车道级安全预警高阶守护版上线,独家首发行人易穿行提醒、大车靠近提醒等功能。据了解,该版本支持公交车鬼探头和行人穿行预警,可精准预测行...
日期:08-16
女子吃了两捧割香螺心跳骤停 医生科普:有剧毒 1个都可致命_割香螺有毒吗
夏天到了,海鲜类美食增多,虽然味道鲜美,但要注意食品安全,浙江一女士日前就吃了海螺,结果中毒了,一度出现心脏骤停,原因就在于这种海螺中的毒素。报道显示这名51岁的张女士本身是从...
日期:06-11
如何让微信聊天记录无法恢复?专家建议做个全面彻底的删除!(怎么让删除的微信聊天记录无法恢复)
  如何让微信聊天记录无法恢复?在现在这个年代,微信现在已经是我们每一个人不可或缺的聊天工具之一,不管是年轻一族或者是老年一族都会在微信上面聊天建群等情况。有些人一...
日期:01-01
张颂文说等了高启强好多年 《狂飙》剧中是双机党:一台苹果一台华为
春节前夕开播的两部电视剧《三体》和《狂飙》,均收获了不俗口碑和收视表现,后者目前的豆瓣评分更是涨到9.1新高。最近在热搜榜,与《狂飙》相关的话题层出不穷。有数码博主注意...
日期:01-30
10月29日起 京东金融转账功能陆续停服_京东金融停息挂账
此前,京东金融发布了“转账功能停止服务”的通知。通知称,转账功能将于2022年10月29日起逐步停止服务,停止服务前不影响您正常使用相关功能。ipad mini发售据公开资料显示,京东...
日期:10-04
金壮龙:要提升新时代应急通信保障能力_如何做好应急通信保障工作
通信世界网消息(CWW)8月11日,工业和信息化部召开防汛救灾应急通信保障调度会,调度重点地区通信抢修抢通工作,视频连线保障现场。会议深入研判汛情发展态势,研究防范台风“卡努”措...
日期:08-14