您的位置:首页 > 互联网

苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果

发布时间:2024-07-23 14:17:10  来源:互联网     背景:

声明:本文来自微信公众号“量子位”,作者:一水,,授权转载发布。

苹果最新杀入开源大模型战场,而且比其他公司更开放。

推出7B模型,不仅效果与Llama38B相当,而且一次性开源了全部训练过程和资源。

要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评:

许多声称开源的AI模型,实际上在数据和训练方法上并不透明,无法满足真正的科学研究需求。

而苹果这次竟然来真的!!

就连NLP科学家、AutoAWQ创建者也发出惊叹:

Apple发布了一个击败Mistral7B的模型,但更棒的是他们完全开源了所有内容,包括预训练数据集!

也引来网友在线调侃:

至于这次开源的意义,有热心网友也帮忙总结了:

对于任何想要从头开始训练模型或微调现有模型的人来说,数据管理过程是必须研究的。

当然,除了OpenAI和苹果,上周Mistral AI联合英伟达也发布了一个12B参数小模型。

HuggingFace创始人表示,小模型周来了!

卷!继续卷!所以苹果这次发布的小模型究竟有多能打?

效果直逼Llama38B

有多能打先不说,先来看Hugging Face技术主管刚“拆箱”的模型基础配置。

总结下来就是:

  • 7B基础模型,在开放数据集上使用2.5T tokens进行训练

  • 主要是英文数据,拥有2048tokens上下文窗口

  • 数据集包括DCLM-BASELINE、StarCoder和ProofPile2

  • MMLU得分接近Llama38B

  • 使用PyTorch和OpenLM框架进行训练

具体而言,研究团队先是提出了一个语言模型数据比较新基准——DCLM。

之所以提出这一基准,是因为团队发现:

由机器学习 (ML) 模型从较大的数据集中自动过滤和选择高质量数据,可能是构建高质量训练集的关键。

因此,团队使用DCLM来设计高质量数据集从而提高模型性能,尤其是在多模态领域。

其思路很简单:使用一个标准化的框架来进行实验,包括固定的模型架构、训练代码、超参数和评估,最终找出哪种数据整理策略最适合训练出高性能的模型。

基于上述思路,团队构建了一个高质量数据集DCLM-BASELINE,并用它从头训练了一个7B参数模型——DCLM-7B。

DCLM-7B具体表现如何呢?

结果显示,它在MMLU基准上5-shot准确率达64%,可与Mistral-7B-v0.3(63%)和Llama38B(66%)相媲美;并且在53个自然语言理解任务上的平均表现也可与Llama38B相媲美,而所需计算量仅为后者的1/6。

与其他同等大小模型相比,DCLM-7B的MMLU得分超越Mistral-7B,接近Llama38B。

最后,为了测试新数据集效果,有业内人士用卡帕西的llm.c训练了GPT-21.5B,来比较DCLM-Baseline与FineWeb-Edu这两个数据集。

结果显示DCLM-Baseline取得了更高的平均分,且在ARC(小学生科学问题推理)、HellaSwag(常识推理)、MMLU等任务上表现更好。

“小”模型成新趋势

回到开头,“小”模型最近已成新趋势。

先是HuggingFace推出了小模型家族“SmolLM”,其中包含135M、360M和1.7B型号模型。

它们在广泛的推理和常识基准上优于类似大小的模型。

然后OpenAI突然发布了GPT-4o mini,不仅能力接近GPT-4,而且价格大幅下降。

就在GPT-4o mini发布同日,Mistral AI联合英伟达发布了12B参数小模型——Mistral NeMo。

沃尔玛的零售业态

从整体性能上看,Mistral NeMo在多项基准测试中,击败了Gemma29B和Llama38B。

所以,为啥大家都开始卷小模型了?

原因嘛可能正如smol AI创始人提醒的,虽然模型变小了,但在能力相近的情况下,小模型大大降低了成本。

就像他提供的这张图,以GPT-4o mini为代表的小模型整体比右侧价格更低。

对此,我等吃瓜群众be like:

所以,你更看好哪家呢?(欢迎评论区讨论留言)

模型地址:

https://huggingface.co/apple/DCLM-7B

GitHub:

新能源汽车的威胁

https://github.com/mlfoundations/dclm

数据集地址:

https://huggingface.co/datasets/mlfoundations/dclm-baseline-1.0

参考链接:

[1]https://x.com/Yuchenj_UW/status/1813260100192334108

[2]https://x.com/casper_hansen_/status/1814269340100751382

[3]https://x.com/_philschmid/status/1814274909775995087

[4]https://x.com/LoubnaBenAllal1/status/1813252390692303069


返回网站首页

本文评论
刘军宣布联想中国新一轮组织变革:成立7大行业纵队_
4月6日消息,联想集团2023/24财年誓师大会上,联想集团执行副总裁兼中国区总裁刘军宣布了联想中国开启新一轮组织变革,正式成立7大行业纵队,建立面对大客户客群的市场销售体系,统一...
日期:04-07
instagram的贴纸「Instagram 推出定制AI贴纸和滤镜 功能强化创作者体验」
11月16日 消息:Instagram近日推出一系列新功能,进一步优化创作者在平台上的体验。最引人瞩目的就是支持用户利用AI技术为故事和短视频制作定制贴纸的新功能。小鹏汽车是纯电...
日期:11-16
美团有时间限制吗「腾讯减持美团?时间点很重要」
  每经记者 王郁彪;杨昕怡;;每经编辑 刘雪梅;;  继相继减持京东(HK09618,股价221.2港元,市值6909亿港元)、海澜之家(SH600398,股价4.5元,市值194.38亿)、Sea Limited(SE,股价89.9...
日期:09-26
直播电商门槛提高,主播应如何面对2021?辛巴辛选团队已给出答案(直播电商的门槛)
  虽然2020已经过去,但这注定是不平凡的一年。2020年特殊的疫情形势,让许多行业都有了或多或少的改变。   直播电商行业在电商基础上增添了直播成分,让消费者足不出户就可...
日期:07-16
90后有高马尾10后有鲶鱼须 网友:每个时代都有自己的审美_鲶鱼系长相适合什么发型
近日,在北京的一所中学,一位老师分享了学校女生普遍采用的一种发型,这种发型的特点在于其刘海部分酷似“鲶鱼须”,极具特色。这一现象引发了人们对不同年代审美观念的讨论,似乎每...
日期:03-25
WriteHuman:绕过AI检测,将AI生成内容转换成人类书写内容
10月12日 消息:由于人工智能的发展,AI生成的文本在很多领域都被大量应用了。但我们同样也有了一些担心,比如内容真实性和原创性。那么我们怎么才能保证AI生成的文本不被检测出...
日期:10-13
网易云音乐“一起听”跨年送祝福 请查收颜人中刘思鉴等音乐人专属祝福
  最近,网易云音乐2021用户年度听歌报告再次刷屏。在一众被讨论的亮点中,“一起听”功能也成为其中一个很特别的内容。“XXX是陪你一起听最久的人”,这一页面背后,是一段...
日期:07-17
年轻人爱上“围炉煮茶”,为何茶企却赚不到钱「冬日里的围炉煮茶」
  中新网12月3日电(中新财经记者 左宇坤)“空持百千偈,不如吃茶去。”老祖宗们雅玩清赏的好意趣,倒是在这个冬天让年轻人们咂摸出了些新滋味。  在遥远的摩洛哥拉巴特,“中国...
日期:12-12
魅族《这十八年》视频正式上线_魅族这18年在哪看
  (原标题:18/Pro 系列临近发布,:致敬中国手机行业)   3月1日消息 魅族此前宣布将于 3 月 1 日举行魅族 18 周年纪录片《这十八年》的首映;将于 3 月 2 日举行 Flyme 9 发...
日期:07-16
ipv6技术精要 pdf「“IPv6+”3.0关键技术解析与应用实践探索」
通信世界网消息(CWW)“IPv6+”作为面向5G和云计算的智能IP技术,其核心是以IPv6技术架构为底座,并基于用户的新兴业务进行创新发展而来的。任何一项技术创新的背后都有一只看不见...
日期:11-08
淄博张店烧烤店「淄博张店烧烤倡议高考停业三天 车辆尽量绕开考点」
在高考即将到来之际,山东淄博张店区烧烤协会发布了《致全体烧烤经营业主的倡议书》。百度app元旦红包苹果新一代iphone降价传闻倡议书包括以下内容:从6月6日晚至9日晚,各烧烤...
日期:06-06
中国移动新一轮5G主设备招标结果公布!涉及金额高达60亿元_中国移动5g工程中标公示
通信爆料近日,中国移动公布了其备受关注的新一轮5G主设备招标结果,表面上看,华为中标额仍是第一,但仔细一看,华为中标份额明显下降了。为何这么说呢?苏宁易购代言人彭昱畅此次招标...
日期:06-13
Meta明年将向元宇宙投入20%的成本_Meta元宇宙
  讯 北京时间12月20日上午消息,据报道,尽管Facebook母公司Meta Platforms的元宇宙战略引发争议,但该公司2023年仍将把20%的成本和费用投入到Reality Labs。  Meta CTO安德...
日期:12-20
Android 2.3“姜饼”占有率已经超越2.2版
  最新统计数据表明,Google Android 2.3-2.3.7 Gingerbread已经超越了Android 2.2 Froyo,目前占比44.4%成为被使用得最多的Android版本,而后者为40.7%,依然占有重要地位。Gin...
日期:07-24
iPhone遭遇史上最复杂攻击 iMessage漏洞被发现_iphone被曝致命漏洞
12月29日 消息:在今年6月,网络安全公司卡巴斯基发布了一份报告,披露了一个名为“Operation Triangulation”的高端iMessage漏洞。这个漏洞极为复杂,能够向iPhone植入恶意程序,并...
日期:12-29
vivo手机y10「越级新标杆来袭!vivo Y100带来“轻薄长续航 越级大内存”」
越级新标杆来袭!vivo Y100带来“轻薄长续航 越级大内存” 通信产业网|2023-10-30 15:41:54作者:党博文来源:通信产业网10月30日,vivo Y100正式发布,售价1399元起。vivo Y100致力...
日期:11-01
SharePoint(OneDrive)_微软宣布刷新 OneDrive/SharePoint 文件复制/移动体验
  10 月 3 日消息 据 mspoweruser 报道,微软近期宣布为 OneDrive 和 Sharepoint 提供更新的文件移动/复制体验,并将很快推出。   新的基于对话的体验旨在使移动和复制文...
日期:06-22
阿里蔡崇信最新发声!训练AI就像教育孩子 三四年就能赶超博士
快科技6月2日消息,阿里巴巴集团的董事长蔡崇信,在最新一次对话中,对人工智能的快速发展和未来前景进行了深入的阐述。华为p60概念图曝光iphone 14 pro max屏幕大小他将训练AI模...
日期:06-02
荣耀畅玩40上架:骁龙480 plus、5200mAh大电池「荣耀畅玩4c上市多少钱」
快科技5月17日消息,今日荣耀官网上架了一款新机荣耀畅玩40,将于5月26日正式开售。据介绍,新机搭载高通骁龙480plus处理器,它采用8nm制程工艺,CPU架构为两颗A76(2.2GHz) 六颗A55(1.8...
日期:05-17
便利店鲜食进货渠道_曝便利购业务被3000万收购 谁在“抄底”每日优鲜?
  记者/王紫薇; ;  编辑/刘雪梅;;  8月23日,据Tech星球报道,每日优鲜旗下便利购业务已经被收购,收购方为深圳每日便利科技有限公司。对此,《每日经济新闻》记者向每日优鲜...
日期:08-24