您的位置:首页 > 互联网

首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了

发布时间:2024-07-23 11:02:44  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心,作者:关注AI大模型的,授权转载发布。

Llama3.1终于现身了,不过出处却不是 Meta 官方。

今日,Reddit 上新版 Llama 大模型泄露的消息遭到了疯传,除了基础模型,还包括8B、70B 和最大参数的405B 的基准测试结果。

下图为 Llama3.1各版本与 OpenAI GPT-4o、Llama38B/70B 的比较结果。可以看到,即使是70B 的版本,也在多项基准上超过了 GPT-4o。

图源:https://x.com/mattshumer_/status/1815444612414087294

显然,3.1版本的8B 和70B 模型是由405B 蒸馏得来的,因此相比上一代有着明显的性能提升。

有网友表示,这是首次开源模型超越了 GPT4o 和 Claude Sonnet3.5等闭源模型,在多个 benchmark 上达到 SOTA。

与此同时,Llama3.1的模型卡流出,细节也泄露了(从模型卡中标注的日期看出基于7月23日发布)。

有人总结了以下几个亮点:

  • 模型使用了公开来源的15T+ tokens 进行训练,预训练数据截止日期为2023年12月;

  • 微调数据包括公开可用的指令微调数据集(与 Llama3不同)和1500万个合成样本;

  • 模型支持多语言,包括英语、法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语。

mobileye市值

图源:https://x.com/iScienceLuvr/status/1815519917715730702

虽然泄露的 Github 链接目前404了,但有网友给出了下载链接(不过为了安全,建议还是等今晚的官方渠道公布):

不过这毕竟是个千亿级大模型,下载之前请准备好足够的硬盘空间:

direcX repair

以下是 Llama3.1模型卡中的重要内容:

模型基本信息

Meta Llama3.1多语言大型语言模型 (LLM) 集合是一组经过预训练和指令微调的生成模型,大小分别为8B、70B 和405B(文本输入 / 文本输出)。Llama3.1指令微调的纯文本模型(8B、70B、405B)针对多语言对话用例进行了优化,在常见的行业基准上优于许多可用的开源和闭源聊天模型。

模型架构:Llama3.1是优化了的 Transformer 架构自回归语言模型。微调后的版本使用 SFT 和 RLHF 来对齐可用性与安全偏好。

支持语言:英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。

从模型卡信息可以推断,Llama3.1系列模型的上下文长度为128k。所有模型版本都使用分组查询注意力(GQA)来提高推理可扩展性。

预期用途

预期用例。Llama3.1旨在用于多语言的商业应用及研究。指令调整的纯文本模型适用于类助理聊天,而预训练模型可以适应各种自然语言生成任务。

Llama3.1模型集还支持利用其模型输出来改进其他模型(包括合成数据生成和蒸馏)的能力。Llama3.1社区许可协议允许这些用例。

Llama3.1在比8种受支持语言更广泛的语言集合上进行训练。开发人员可以针对8种受支持语言以外的语言对 Llama3.1模型进行微调,前提是遵守 Llama3.1社区许可协议和可接受使用策略, 并且在这种情况下负责确保以安全和负责任的方式使用其他语言的 Llama3.1。

软硬件基础设施

首先是训练要素,Llama3.1使用自定义训练库、Meta 定制的 GPU 集群和生产基础设施进行预训练,还在生产基础设施上进行了微调、注释和评估。

其次是训练能耗,Llama3.1训练在 H100-80GB(TDP 为700W)类型硬件上累计使用了39.3M GPU 小时的计算。这里训练时间是训练每个模型所需的总 GPU 时间,功耗是每个 GPU 设备的峰值功率容量,根据用电效率进行了调整。

训练温室气体排放。Llama3.1训练期间基于地域基准的温室气体总排放量预估为11,390吨二氧化碳当量。自2020年以来,Meta 在全球运营中一直保持净零温室气体排放,并将其100% 的电力使用与可再生能源相匹配,因此训练期间基于市场基准的温室气体总排放量为0吨二氧化碳当量。

用于确定训练能源使用和温室气体排放的方法可以在以下论文中找到。由于 Meta 公开发布了这些模型,因此其他人不需要承担训练能源使用和温室气体排放。

论文地址:https://arxiv.org/pdf/2204.05149

训练数据

概述:Llama3.1使用来自公开来源的约15万亿个 token 数据进行了预训练。微调数据包括公开可用的指令数据集,以及超过2500万个综合生成的示例。

数据新鲜度:预训练数据的截止日期为2023年12月。

Benchmark 评分

在这一部分,Meta 报告了 Llama3.1模型在标注 benchmark 上的评分结果。所有的评估,Meta 都是使用内部的评估库。

安全风险考量

Llama 研究团队致力于为研究界提供宝贵的资源来研究安全微调的稳健性,并为开发人员提供适用于各种应用的安全且强大的现成模型,以减少部署安全人工智能系统的开发人员的工作量。

研究团队采用多方面数据收集方法,将供应商的人工生成数据与合成数据相结合,以减轻潜在的安全风险。研究团队开发了许多基于大型语言模型 (LLM) 的分类器,以深思熟虑地选择高质量的 prompt 和响应,从而增强数据质量控制。

值得一提的是,Llama3.1非常重视模型拒绝良性 prompt 以及拒绝语气。研究团队在安全数据策略中引入了边界 prompt 和对抗性 prompt,并修改了安全数据响应以遵循语气指南。

Llama3.1模型并非设计为单独部署,而是应作为整个人工智能系统的一部分进行部署,并根据需要提供额外的安全护栏。开发人员在构建智能体系统时应部署系统安全措施。

请注意,该版本引入了新功能,包括更长的上下文窗口、多语言输入和输出,以及开发人员与第三方工具的可能集成。使用这些新功能进行构建时,除了需要考虑一般适用于所有生成式人工智能用例的最佳实践外,还需要特别注意以下问题:

工具使用:与标准软件开发一样,开发人员负责将 LLM 与他们所选择的工具和服务集成。他们应为自己的使用案例制定明确的政策,并评估所使用的第三方服务的完整性,以了解使用此功能时的安全和安保限制。

多语言:Lama3.1除英语外还支持7种语言:法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语。Llama 可能可以输出其他语言的文本,但这些文本可能不符合安全性和帮助性性能阈值。

Llama3.1的核心价值观是开放、包容和乐于助人。它旨在服务于每个人,并适用于各种使用情况。因此,Llama3.1的设计宗旨是让不同背景、经历和观点的人都能使用。Llama3.1以用户及其需求为本,没有插入不必要的评判或规范,同时也反映了这样一种认识,即即使在某些情况下看似有问题的内容,在其他情况下也能达到有价值的目的。Llama3.1尊重所有用户的尊严和自主权,尤其是尊重为创新和进步提供动力的自由思想和表达价值观。

但 Llama3.1是一项新技术,与任何新技术一样,其使用也存在风险。迄今为止进行的测试尚未涵盖也不可能涵盖所有情况。因此,与所有 LLM 一样,Llama3.1的潜在输出无法事先预测,在某些情况下,该模型可能会对用户提示做出不准确、有偏差或其他令人反感的反应。因此,在部署 Llama3.1模型的任何应用之前,开发人员应针对模型的具体应用进行安全测试和微调。

模型卡来源:https://pastebin.com/9jGkYbXY

参考信息:https://x.com/op7418/status/1815340034717069728

https://x.com/iScienceLuvr/status/1815519917715730702

https://x.com/mattshumer_/status/1815444612414087294


返回网站首页

本文评论
华强北无可奈何,只因一个ID密码,无数的iPhone要当垃圾扔掉_华强北id解锁
在我们的日常生活中,什么东西占用我们每天的最多闲暇时间呢?当然是我们现在“赖以生存”的手机了,现如今手机不仅是我们社交生活的重要媒介还是我们在生活中方方面面都要用到的...
日期:07-17
佰维芯片「佰维再获NCN-ICT峰会大奖——2022年度领先闪存厂商」
近期,佰维亮相第 15 届年度NCN-ICT渠道合作伙伴峰会,并斩获“ 2022 年度领先闪存厂商”奖。去年,佰维亦在该峰会上斩获 “消费级存储领域杰出成就”奖,表明佰维不断深耕全球市场...
日期:06-26
调休模式下双休变单休!“五一其实只放一天”引热议:中国假期真的少吗
快科技4月16日消息,今年五一小长假的安排已经敲定,从5月1日(星期三)至5月5日(星期日)将放假调休,共计5天,而4月28日(星期日)和5月11日(星期六)则是正常工作日。这意味着,五一假期前将连续...
日期:04-16
三星Galaxy Z Fold5/Flip5折叠屏手机跑分曝光:骁龙8 Gen 2 for Galaxy加持
三星 Galaxy Z Fold5 和 Galaxy Z Flip5 折叠屏手机的美国版型号已现身 Geekbench 跑分网站上,确认两款手机都将使用骁龙 Snapdragon 8 Gen 2 for Galaxy 芯片。这是与Galaxy...
日期:03-30
《英雄联盟》宣布将停止支持DirectX 9:官方建议玩家赶快升级_英雄联盟支持dx11吗
快科技3月19日消息,日前,《英雄联盟》官方发布公告,称将逐步停止支持DirectX 9。据介绍,为了提升游戏的稳定性和性能,对于玩家不再广泛使用的旧硬件或软件,客户端将逐渐停止对这部...
日期:03-20
转载推特「NFT“泡沫”破了!推特首条推文转卖价格缩水99.93%」
快科技7月25日消息,2021年3月,历史上发出的第一条推特被作为NFT资产出售,最终卖出1630.58以太币,以当时的交易价格换算,这条推文卖出了290万美元。但时隔两年,近日买下这条推特的...
日期:07-25
用行动支持鸿蒙!深圳高校开鸿蒙班:首批学生100%报名
近日,深圳信息职业技术学院(深信院)与深圳开鸿数字产业发展有限公司联合举办“开源鸿蒙班”开班典礼,并启动开源鸿蒙人才认证体系标准建设。北京八维职业技术学院都有哪些专业该...
日期:10-16
苹果iPhone 15还在用60Hz屏和20W充电 老外快忍不了了「苹果手机15w快充对手机有害吗」
【手机中国新闻】目前,我们距离iPhone 15系列的发布已经越来越近了,关于该系列机型的配置,也逐渐有各种消息开始流传。近日,手机中国注意到,随着部分iPhone 15系列机型配置的流出...
日期:07-18
小鹏汇天飞行汽车旅航者 X2 获迪拜飞行许可 即将海外公开首飞_小鹏汇天X2飞行汽车价格
9月29日消息:据小鹏汇天官方微博消息,小鹏汇天飞行汽车旅航者X2在迪拜民航局监管下进行了严谨的评审工作,顺利通过特定运行风险评估,并获得在迪拜开展海外首次公开飞行许可。10...
日期:10-01
情侣远程接吻「常州一学院已申请远程接吻装置专利 异地恋接吻神器你会买吗?」
2月21日 消息:近日,一款专为异地恋情侣研发的产品“异地恋接吻神器”引发了网友的热议。它能将感受到的嘴唇动作和力度转化成讯号,传送到对方的嘴唇上,甚至可以在APP中体验到不...
日期:03-01
陶哲轩转赞!40多年忙碌海狸数学难题获突破,4万行Coq代码立大功
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】忙碌海狸难题困扰了计算机科学家40多年。如今,来自全球各地20+业余开发者和数学家们,终...
日期:07-03
收到背去世老人下楼订单?顺丰回应引围观 网友感叹这单也敢接
日前,四川自贡一则同城取送平台收到背去世老人下楼订单”的信息引发网络关注。有网友称,订单太过惊悚。”敢接这种单子的外卖小哥,不仅胆大,也够拼的。”但也有网友质疑,莫不是恶...
日期:03-07
理想汽车:「新势力一哥」的荣耀与隐忧_造车新势力理想汽车
“理想汽车管理层称,6月份销量争取交付3万台,二季度的核心目标是把市占率从一季度的11%提升到13%;城市NOA早鸟测试会在6月份推送。”作者 | 思琳编辑 | 雨晨理想汽车2023年一季...
日期:05-12
赵明回应华为中低端5G手机回归:荣耀没压力 我们新机目前没对手
快科技11月24日消息,荣耀100系列新机发布后,赵明接受媒体采访时被问及是否害怕有竞争,其直言荣耀毫不畏惧。天道酬勤厚德载物是什么意思当被问及华为也要在中低端市场带来5G功...
日期:11-24
史上最冷直播精彩回顾!荣耀X30挑战极限冰冻,品质实力共同见证
  史上最冷直播终于在12月16日晚,于李佳琦直播间正式开启,李佳琦首当品质考核官,将对荣耀X30进行一系列的考验,直播现场热闹非凡。此次荣耀X30作为李佳琦新助理挑战零下20度...
日期:07-17
英诺赛科参股公司「英诺赛科:氮化镓技术引领行业创新与生态系统升级」
在快速发展的半导体行业中,英诺赛科(苏州)科技股份有限公司(简称:英诺赛科)以卓越的氮化镓(GaN)技术脱颖而出,成为全球功率半导体革命的领导者。作为首家实现量产8英寸硅基氮化...
日期:07-22
SAGA:毫秒实现3D高斯交互分割,加速近1000倍_高斯视角
划重点:SAGA(Segment Any3D GAussians)在3D场景理解和操作中取得了重要突破,能够在几毫秒内实现精细的三维分割,支持多种提示类型,包括点、涂鸦和掩码。SAGA通过融合2D分割和3D高...
日期:12-07
YashanDB荣获“鼎新杯”数字化转型应用奖项
(原标题:YashanDB荣获“鼎新杯”数字化转型应用奖项) 近日,深算院YashanDB 团队与深燃集团联合共建的深圳燃气集团数据库国产化...
日期:09-25
荣耀X40 GT手机开售:144Hz电竞屏 仅售1999起
荣耀X40 GT手机在上周发布,可以说这是今年荣耀名义上的首款游戏理念手机,产品的表现和用户口碑是不错而,荣耀X40GT手机搭载高通骁龙888游戏平台,而荣耀将这款手机内部植入了很大...
日期:10-17
顺义消费券怎么领「北京顺义发放500万元电商消费券 先到先得」
2月9日 消息:今日,北京市顺义区启动“品顺义·乐生活”顺义电商消费节活动,发放500万元电商消费券,促进当地消费。首批300万元消费券按“先到先得”原则发放。apple watch市场...
日期:02-13