您的位置:首页 > 互联网

苹果大模型MM1入场:参数达到300亿 超半数作者是华人_苹果模型机大概多少钱

发布时间:2024-03-15 19:58:44  来源:互联网     背景:

要点:

  • 苹果发布了多模态大型语言模型MM1,参数达到300亿,采用MoE架构,超半数作者为华人。

  • MM1在模型架构、预训练数据选择和训练方法上进行了详细探讨,并在多项基准测试中表现出竞争力。

  • MM1的预训练和监督微调结果显示,采用不同的数据和训练策略可以获得更好的性能,MoE模型进一步扩展了潜力。

3月15日 消息:苹果公司最新发布了一款名为MM1的大型多模态基础模型,拥有300亿参数,采用了MoE架构,并且超过一半的作者是华人。该模型在多模态领域具有重要意义,可能预示着苹果未来推出与此相关的产品。

今年以来,苹果明显加大了对生成式人工智能(GenAI)领域的投入,这一举措体现了苹果在GenAI领域取得重大进展的决心。据悉,苹果一部分转向GenAI的团队原本是从事造车项目的,而如今他们也开始投身于GenAI领域的研发工作。

apu a8 7650k

一个苹果模型机多少钱

论文地址:https://arxiv.org/pdf/2403.09611.pdf

MM1的发布引起了广泛关注。据论文介绍,该模型采用了MoE变体,并且在预训练指标和多项多模态基准测试上表现出了领先水平。研究者通过多项消融试验,探讨了模型架构、预训练数据选择以及训练程序等方面的重要性。他们发现,图像分辨率、视觉编码器损失和预训练数据在建模设计中都起着关键作用。

在预训练数据选择方面,研究者发现了几个重要经验:交错数据对提高少样本和纯文本性能有帮助,而字幕数据则对提高零样本性能具有重要作用。

此外,纯文本数据对于提高少样本和纯文本性能同样至关重要。通过合理混合图像和文本数据,可以获得最佳的多模态性能,并保留较强的文本性能。研究者还发现,人工合成数据有助于少样本学习。

一个苹果模型机多少钱

apple模型

最终,研究者确定了MM1的最终配方,包括图像编码器、视觉语言连接器和预训练数据的选择。他们还将LLM的大小扩大到3B、7B和30B个参数,并通过专家混合(MoE)进一步扩展了模型。在监督微调实验中,MM1在多项基准测试上表现出了竞争力,并且MoE模型在几乎所有基准测试中均表现优于密集模型。

MM1的发布标志着苹果在多模态领域的重要进展,也为未来苹果可能推出的相关产品奠定了技术基础。该研究的成果对于推动生成式人工智能领域的发展具有重要意义,值得业界密切关注。


返回网站首页

本文评论
马斯克哭「马斯克一怒为红颜」
《综艺》杂志报道说,扮演海王娘娘的安珀·赫德本来无缘《海王2》,导演温子仁觉得她与海王(杰森·莫玛)俩人“不来电”。《海王》于2018年公映后,华纳与温子仁觉得《海王2》应该换...
日期:10-11
跑马圈地商业模式_“跑马圈地”再度升级 社交化运营成大势所趋
  “流量红利逐渐消失,无论是互联网新增用户,还是人均时长,都已经见顶了。”   ——宝洁全域零售事业部副总裁邓胜蓝   “经济增速趋于稳定,意味着未来的市场竞争会越...
日期:07-14
弹窗广告“霸屏”问题将被重点监管_彻底阻止广告弹窗
  来源:工人日报  本报北京9月28日电 (记者杨召奎)记者今天从国家网信办获悉,由国家网信办、工业和信息化部、市场监管总局联合发布的《互联网弹窗信息推送服务管理规定》(以...
日期:10-01
OPPO 申请“AndesGPT”商标:将推出全新小布助手「oppo的小布助手是什么」
快科技9月11日消息,OPPO广东移动通信有限公司最近申请注册多个AndesGPT”AndesAI”商标,国际分类为科学仪器、通讯服务、网站服务,当前商标状态均为申请中。据了解,OPPO将基于An...
日期:09-12
山东菏泽农田里疑发现美洲犰狳:非本地物种 长相怪异
快科技10月27日消息,近日山东菏泽的一段视频引起网友关注,当地居民在田地里发现了非常奇怪的生物,疑似犰狳(qi y)。这个动物挖洞非常厉害,向下打洞几米深,后来用挖掘机才挖出来,被警...
日期:10-27
百度文心一言专业版测试申请入口 专业版邀请码获取方法_百度文心官网
百度文心一言专业版现在已经开始测试,用户可以直接申请专业版的测试资格,以下我们来看下具体如何获得专业版的邀请码。【文心一言专业版邀测】活动规则您可通过点击文心一言官...
日期:10-31
业界首个:中兴通讯与中国电信完成 5G 高频外场智能超表面技术验证测试
  7 月 9 日消息 从中兴通讯获悉,中兴通讯近日与中国电信在上海完成业内首个智能超表面反射面板在 5G 高频网络外场的远距离技术验证测试。   测试结果表明,在距离 5G...
日期:03-02
rtx40系列显卡会比30性能提升多少「RTX30怎么办?RTX 40系列显卡真来了 最快9月20日发:这性能翻倍」
对于不少期待新品的用户来说,9月份手机圈的两大重磅旗舰落地后,接下来就是NV等PC厂商秀肌肉的时刻了。NVIDIA正式揭晓谜底,将在太平洋时间于9月20日早上8点(北京时间9月20日23点...
日期:09-11
其他车企拿什么拼?马斯克称特斯拉能继续降价:为销量、不靠硬件赚钱靠软件
快科技7月20日消息,今天我们报道了特斯拉的财报,其中还是有很多干货的,比如马斯克直言为了销量可以继续降价。在最新的财报中,特斯拉单车售价:4.38万美元,同比-18%,显著低于去年同...
日期:07-20
oppo find x7图片曝光Find X7系列 旗舰影像3999起 两图看懂OPPO_oppo find7价格
来源:中关村在线今日14:30,OPPO召开了新品发布会,年度旗舰新机OPPO Find X7系列正式发布。Find X7系列拥有精致的外观设计、旗舰级别的影像性能,以及跨越式的AI升级,其中普通版的...
日期:01-09
“智能+”让热点快人一步 新浪新闻app看见热点的力量_每天热点新闻推送
  这个时代,从来不缺少新闻热点,小到衣食住行,大到国家建设,热点与我们每个人的生活息息相关。有时,热点代表着一份先机,普通人把握了热点,可能先一步抓住了改变命运的转...
日期:03-14
小米Civi 2用上骁龙7芯片:号称36个月不卡_小米civi处理器不行
小米Civi 2手机在今天正式发布,新机搭载了骁龙7芯片,这也是该芯片在市面中的首批机型,而且小米Civi 2手机还配备了前置双摄及后置5000万像素大底三摄,同时性能也很强大。三星s5...
日期:09-29
联想电脑配置清单_联想电脑配置清单在哪里看
联想作为国内知名的电脑品牌,一直以来以其高性能、高质量和高配置的电脑产品引领了市场。一份良好的配置清单对于购买一款电脑来说是很重要的,因此,下面将就联想电脑配置清单进...
日期:06-03
女子旅游后高烧不退确诊“不死癌症” 医生:晒太阳是重要诱因「出门旅游发烧了怎么办」
今年的五一”假期调休后有5天放假时间,因此很多人选择外地旅游,不过旅游后生病的游客也有不少。今日,一则女子旅游后高烧不退确诊不死癌症”的话题登上微博热搜,引起不少网友关...
日期:05-14
3D-LLM:让AI聊天机器人可以解读三维世界「聊天机器人csdn」
8月1日 消息:研究人员推出了一款名为3D-LLM的新方法,可以将对3D 环境的理解融入到大型语言模型中。这意味着聊天机器人将能够理解和处理3D 空间的概念,从而更好地在三维世界中...
日期:08-01
官宣!NFL“周日门票”明年转播权花落谷歌旗下YouTube_NFL转播费
  讯 北京时间12月23日早间消息,YouTube及美国国家橄榄球联盟(NFL)双双在推特宣布,2023年NFL Sunday Ticket(周日门票)套餐流媒体转播权被YouTube拿下,“周日门票”将于明年登陆Y...
日期:12-23
华为nova9官方最低价","info":{"wordid":"7026001518454248740"}},{"key
来源:中关村在线华为商城今日推出限时秒杀活动,特别优惠的华为nova 9官方翻新版闪购价1539元起。这款手机搭载8GB内存和256GB存储空间,降价幅度高达660元,并附赠华为66W超级快充...
日期:10-15
消息称高通骁龙 8 Gen 2 芯片售价高达 160 美元_高通骁龙8核芯片怎么样
  IT之家 6 月 4 日消息,高通和苹果都是智能手机市场的重要参与者,他们的最新旗舰芯片骁龙 8 Gen 2 和 A16 仿生芯片都是采用台积电的 N4(4nm)工艺制造的,那么它们的成本如何呢...
日期:06-04
三星 Galaxy 全球发布会汇总:两款折叠屏更轻薄,还有耳机和手表_三星第一代折叠手机
在三星官方放出的 8 月 10 日 Galaxy 全球发布会的前瞻宣传图中,「天生优越」这几个字在网友中间引起了不小的讨论。发布会前,预计在此次发布会面世的新品的情报不能说是密不...
日期:09-07
安徽电信率先完成生产系统全栈国产化试点
通信世界网消息(CWW)随着信息技术产业的发展,数字经济逐渐成为我国“十四五”经济发展关键动力。中国电信持续践行“云改数转”战略,提出“成为关键核心技术自主掌控的科技型企...
日期:06-14