您的位置:首页 > 互联网

苹果开源OpenELM,大模型开源领域再迎一巨头!_苹果开源是什么

发布时间:2024-04-25 11:28:07  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

4月24日,苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3Mini类似,是一款专门针对手机等移动设备的模型。

OpenELM有指令微调和预训练两种模型,一共有2.7亿、4.5亿、11亿和30亿4种参数,提供生成文本、代码、翻译、总结摘要等功能。

虽然最小的参数只有2.7亿,但苹果使用了1.8万亿tokens的数据进行了预训练,这也是其能以小参数表现出超强性能的主要原因之一。

值得一提的是,苹果还把训练OpenELM模型的深度神经网络库CoreNet也开源了,仅1天多的时间Github就超过1100颗星。苹果的MobileOne、CVNets、MobileViT、FastVit等知名研究都是基于CoreNet完成的。

开源地址:https://huggingface.co/collections/apple/openelm-instruct-models-6619ad295d7ae9f868b759ca

CoreNet地址:https://github.com/apple/corenet

论文地址:https://arxiv.org/abs/2404.14619

苹果开源项目

目前,大模型领域主要分为开源和闭源两大阵营,国内外知名闭源的代表企业有OpenAI、Anthropic、谷歌、Midjourney、Udio、百度、科大讯飞、出门问问、月之暗面等。

开源阵营有Meta、微软、谷歌、百川智能、阿里巴巴、零一万物等。苹果作为手机闭源领域的领导者,本次却罕见地加入开源大模型阵营,可能在效仿谷歌的方式先通过开源拉拢用户,再用闭源产品去实现商业化营利。

b85主板配什么CPU

不管咋说,苹果选择开源对于开发者、中小企业来说都是一个不错的福利。因为,与以往只提供模型权重和推理代码的做法不同,苹果发布了完整的训练、评估框架等。

苹果开源是什么

主要内容包括数据准备、模型训练、微调以及评估流程,同时提供了多个预训练检查点和训练日志,可以让我们深度了解全球顶级科技公司的技术思想和开发流程。

OpenELM架构简单介绍

荣耀play6上市时间

OpenELM采用了无编码器的transformer架构,并在多个方面进行了技术创新。OpenELM的使用了一种“层级缩放”策略,使得模型能够跨各个转换器层更有效地分配参数,能以最少的训练数据取得了更好的性能,同时极大提升准确率。

例如,11亿参数的OpenELM,比12亿参数的OLMo模型的准确率高出2.36%,而使用的预训练数据却只有OLMo的一半。

此外,OpenELM不使用任何全连接层中的可学习偏置参数,采用RMSNorm进行预归一化,并使用旋转位置嵌入编码位置信息。

OpenELM还通过分组查询注意力代替多头注意力,用SwiGLU FFN替换了传统的前馈网络,并使用了Flash注意力来计算缩放点积注意力,能以更少的资源来进行训练和推理。

训练流程与数据集

在训练流程中,苹果采用了CoreNet作为训练框架,并使用了Adam优化算法进行了35万次迭代训练。

苹果使用了批量大小为4096的小批量随机梯度下降进行模型参数更新,并设置了适当的学习率和权重衰减。

ios如果开源会怎么样

预训练数据集方面,OpenELM使用了包括RefinedWeb、去重的PILE、RedPajama的子集和Dolma v1.6的子集在内的公共数据集,一共约1.8万亿tokens数据。

此外,苹果使用了动态分词和数据过滤的方法,实现了实时过滤和分词,从而简化了实验流程并提高了灵活性。还使用了与Meta的Llama相同的分词器,以确保实验的一致性。

这次苹果真的是很有诚意的开源,一开到底所有内容都贡献出来了,家大业大就是敢玩。这也表明苹果进军大模型领域的决心,以后开源领域更热闹啦~


返回网站首页

本文评论
悠视网CEO李竹:C轮融资金额千万美金
  9月7日,悠视网CEO李竹在接受采访时表示,悠视网经过七八个月的技术研发推出新版客户端,新版客户端将会采取聚合模式,作为一个开放的播出平台聚合其他视频平台的内容,通过跟内...
日期:07-22
徕卡旗舰发布100天后,小米有没有高端?_徕卡旗舰发布100天后,小米有没有高端机型
小米发布了第三季度财报,这个财报季是 7、8、9 三个月,正好是小米 12S Ultra 发布三个月,也是小米抱起徕卡冲高端的 100 天,那么我们来看看小米现在有多高端。总销量方面,三季度...
日期:11-26
中国新能源车出海有多火:泰国人凌晨排队买比亚迪「泰国新能源汽车」
中国新能源汽车在海外有多抢手?当地消费者甚至凌晨都要起来排队购买。本月初,在泰国曼谷的一家比亚迪展厅外,有数十米的队伍早早地排起了队伍,他们所想要购买的,正是前不久在该国...
日期:11-25
八成孩子每天上网1小时以内_小学生每天上网不超过几小时
  未成年人如何使用互联网?连续五年发布的《全国未成年人互联网使用情况调查报告》给出了答案:目前,我国未成年人互联网普及率已高达97.2%,玩游戏、听音乐、刷短视频是最常见...
日期:12-26
卖2699元!苹果开售Apple Watch新款爱马仕表带
快科技3月5日消息,昨天晚上苹果突然发布新品,推出全新升级了M3芯片的MacBook Air13英寸、15英寸,同时还上新了一系列配件。新增的配件中就包括Apple Watch新款爱马仕表带--Tric...
日期:03-05
淘宝推出AI大模型应用“淘宝问问” 并开启内测「淘宝autoart模型店」
9月8日 消息:淘宝推出AI大模型应用“淘宝问问”进行内测,可满足消费者跨类别、跨领域需求及信息搜索、创意内容生成等场景需求。用户可通过淘宝App搜索或邀请码参与测试,但官...
日期:09-08
B太敦煌游良心的姐走红 出租车公司称将给予奖励_华为10畅享plus怎么关闭省电模式
据红星新闻报道,近日,甘肃敦煌的一位出租车司机何玉秀因热情诚恳的服务态度在网红博主@superB太发布的敦煌游玩视频中走红网络。富士康将造电动汽车何玉秀称,她在遇到B太时,并没...
日期:01-03
日本60岁宅男看动漫被打断对父母下狠手 啃老30年:网友吐槽二次元危害大
日本60岁男子松本淳二因杀死自己双亲,当地时间1月6日被判有期徒刑30年。苹果市值突破1万亿美元大关三星s22 骁龙8+苹果自主研发芯片据悉,松本擅自从大学退学,受到严厉训斥后,对...
日期:01-07
iQOO7下巴黑边宽度「这超窄下边框爱了,iQOO Neo7屏幕参数公布」
中关村在线消息:iQOO Neo7发布会将于10月20日19:00举行,目前iQOO官方正在对新品进行预热。今日,iQOO Neo7的屏幕参数公布,海报显示,新机将拥有非常窄的屏幕边框。Galaxy a7从海报...
日期:10-20
瑞萨电子将以2.49亿美元收购蜂窝物联网技术领导者Sequans_芯片困局之下瑞萨电子再出手:欲60亿美元
通信世界网消息(CWW)近日,全球半导体解决方案供应商瑞萨电子宣布将通过要约收购蜂窝物联网技术领导者Sequans。双方已签订谅解备忘录,瑞萨电子将以每股3.03美元的价格收购Sequan...
日期:08-11
抖音团购手续费「2023年抖音团购软件服务费政策生效 美食佣金率2.5%」
2月13日 消息:抖音开放平台团队此前发布的《2023年团购软件服务费政策》已于2月1日生效。。2023年2月1日零时起,用户支付的订单平台将按照以下表格中的标准收取对应的软件服...
日期:02-15
Kimi怎么用?如何发挥这个国产AI之光的最大价值?_kimi是怎么回事
声明:本文来自于微信公众号 喜新(ID:noyanjiu),作者:张佳,授权转载发布。要选一个能带领中国走进 AGI 时代的人,我只投杨植麟。这几天看了腾讯新闻采访杨植麟的长文,这个感受愈发...
日期:03-04
一文看完华为nova 11系列发布会,超十款产品,百元起售「华为nova11什么时候上市」
4月17日消息,华为nova11系列及全场景新品发布会举行,一口气推出了超17款产品。华为nova 11系列、华为畅享60X手机,华为MateBook D 14/D 16笔记本,华为智慧屏 S3 Pro,华为手环8,华...
日期:04-18
新的全国铁路列车运行图实行:石家庄至北京将实现一小时通达
据河北省发改委消息,按照国铁集团统一安排和部署,自12月26日开始实行新的全国铁路列车运行图。届时,省会石家庄至首都北京实现1小时通达、至承德运行时间进一步优化压缩,并开行...
日期:12-25
Steam私密游戏功能正式上线!指定游戏仅自己可见
快科技3月5日消息,今天Steam官方宣布,购买、赠送游戏以及将游戏标记为私密的更新现已完成测试,并已在Steam上对所有人推出。据官方介绍,将指定游戏标记为私密,仅对您自己可见,但其...
日期:03-05
公安交管部门:推行补换驾驶证、补换领号牌、申领临时号牌等 34 种业务网上办理
  据公安部网站,公安部推出疫情防控期间 6 项便民利企措施,服务保障物流畅通,促进产业链供应链稳定。   公安交管部门推行 34 种交管业务“网上办”。全面应用互联网服务...
日期:09-04
百度 CEO 李彦宏:文心大模型升级 3.5 版本,推理速度提升 17 倍
6 月 26 日消息,百度创始人、董事长兼首席执行官李彦宏今日出席“世界互联网大会数字文明尼山对话”,发表了题为《大模型重塑数字世界》的演讲。▲ 图源百度李彦宏认为,“新的...
日期:06-26
探寻技术前沿,三星以AI重构白电全新价值_三星白adc
甄琰||撰文在AWE2024期间,全球消费电子与家电领军品牌三星举办了2024家电新品发布会。除了发布其全球领先的以电视为代表的消费电子全明星产品外,在白电领域的新品也是超乎想...
日期:04-15
性能第一 续航还超过iPhone 14 Pro Max!博主:Redmi K60至尊版只能用可怕来形容
快科技8月8日消息,有博主测试了Redmi K60至尊版。总体而言,Redmi K60至尊版搭载的天玑9200 性能强悍,配上X7独显芯片,直接把游戏画质、游戏操作原地拉满,丝滑流畅,续航还超过了iPh...
日期:08-08
骁龙8 Gen2性能曝光AI提升50% 小米13首发「骁龙8cx Gen2」
中关村在线消息:高通年度旗舰处理器骁龙8 Gne2将于下月召开的骁龙技术峰会中正式发布,今日新处理器的性能被曝光,相比骁龙 8 Plus Gen1,骁龙 8 Gen2 的提升幅度大约在 10% 以上,...
日期:10-11