您的位置:首页 > 互联网

邢波团队提出全开源倡议LLM360 让大模型实现真正的透明

发布时间:2023-12-14 01:38:44  来源:互联网     背景:

要点:

  • LLM360是邢波团队提出的全方位开源倡议,旨在使大型语言模型的训练过程真正透明,包括训练数据、代码、模型检查点和性能指标等全方位开放。

  • LLM360的框架包括训练数据集与处理代码、训练代码与配置、模型检查点以及性能指标,提供了标准以确保更好地在社区中流通与共享,推动人工智能领域的开放合作研究。

  • 研究者通过LLM360框架发布了两个大型语言模型:AMBER和CRYSTALCODER,详细揭示了它们的开发细节、评估结果以及对于LLM研究的经验和教训。AMBER在性能上相对较强,CRYSTALCODER在语言和代码任务之间取得平衡。

12月13日 消息:开源模型在人工智能领域展现强大活力,但闭源策略限制了LLM(大型语言模型)的发展。邢波团队提出的LLM360全面开源倡议旨在解决这一问题。该框架明确了包括训练数据、代码、模型检查点和性能指标在内的各方面细节,为当前和未来的开源模型树立了透明度的样本。

马云在香港退市

论文地址:https://arxiv.org/pdf/2312.06550.pdf

项目网页:https://www.llm360.ai/

博客:https://www.llm360.ai/blog/introducing-llm360-fully-transparent-open-source-llms.html

刘洋选航天员的时候发生了什么

三星s22系列官方价格和详细参数

肉末粉条的做法不粘锅

LLM360的核心组成部分包括训练数据集、训练代码与配置、模型检查点以及性能指标。这一全方位的开源使得研究者可以更好地在社区中分享与流通,推动人工智能领域的开放合作研究。同时,LLM360框架下发布的AMBER和CRYSTALCODER是两个从头开始预训练的大型语言模型,为研究者提供了开发经验和性能评估结果。

AMBER是基于1.3T token进行预训练的7B英语语言模型,性能相对较强。而CRYSTALCODER是基于1.4T token训练的7B语言模型,在语言和代码任务之间取得了很好的平衡。这两个模型的开源不仅提供了性能评估结果,还为整个LLM领域的研究提供了实质性的经验和教训。

总体而言,LLM360的提出为大型语言模型的透明训练提供了一个标准,推动了开源模型的发展,加速了人工智能领域的进步。这一全面开源的趋势有望促进更多研究者的参与与合作,推动人工智能技术的不断创新。


返回网站首页

本文评论
谷歌宣布将于明年1月18日关闭云游戏服务Stadia_谷歌放弃云游戏
9月30日消息,据国外媒体报道,由于没有获得预期的吸引力,谷歌宣布,将于2023年1月18日关闭其云游戏服务Stadia。谷歌将退还所有通过谷歌商店购买的Stadia硬件,以及所有从Stadia商店...
日期:10-03
为什么是佐藤恒治?丰田换帅的背后「佐藤健为什么这么帅」
撰文/ 张霖郁编辑/ 黄大路设计/ 赵昊然“您为什么选择佐藤恒治做接班人?”主持人问丰田章男。“首先他年轻,第二佐藤非常喜欢汽车,同时也非常喜欢造车。你和他聊几分钟,会发现‘...
日期:01-29
人民日报评论:电商平台不该成为盗版图书的“隐秘角落”
文/林风   近日,有媒体调查发现,不同电商平台存在售卖疑似盗版图书的现象。这些盗版图书的印刷成本往往低至几元钱一本,售卖图书的网店入驻资质也有一条灰色产业链。电商平台...
日期:07-31
Win11系统更开放 19款第三方桌面应用进驻微软应用商店
  再过一周时间,微软就要正式发布Win11系统了,距离6月底发布正好三个月了。Win11带来了不少变化,其中微软这次进一步向第三方开放,全新的Win11应用商店现在有19款应用进驻,并...
日期:07-17
闲鱼推出七天无理由退货 仅针对经营性卖家_闲鱼没有七天无理由退货
10月9日 消息:二手交易也能无理由退货了?近日,闲鱼发布了关于新增《闲鱼社区七天无理由退货规范》的公示通知。公告称,为保障卖家权益,闲鱼社区新增了七天无理由退货。iphone 1...
日期:10-18
天价柠檬茶卖300一杯!后续:商家被罚20万_柠檬茶涨价了
天眼查App显示,近日,上海玖月粮仓品牌管理有限公司因虚假或者误导性的商业宣传,被黄浦区市场监督管理局罚款20万元。上海市市场监管局网站公布的行政处罚决定书显示,上海黄浦区...
日期:04-04
英特尔第五代 Emerald Rapids及Granite Rapids Xeon CPU性能揭晓_5代英特尔cpu
IT之家 11 月 14 日消息,英特尔在 SC23 上公布了最新的至强处理器性能数据,包括即将发布的第五代 Emerald Rapids 的实测结果和下一代 Granite Rapids 的预测结果。英特尔宣称...
日期:11-14
OpenAI暂停ChatGPT Plus用户注册 因超出服务器承受范围
11月15日 消息:今天上午,OpenAI的CEO Sam Altman在社交平台上宣布,由于近期ChatGPT的使用量激增,超出公司的承受能力,因此他们决定暂停新的ChatGPT Plus账号注册,以确保每位用户...
日期:11-15
段永平斥资2500万元买入10万股腾讯_段永平投资腾讯股票
互联网直播经济今年苏宁易购双十一活动三言财经8月2日消息,知名投资人段永平在社交媒体上透露,“刚刚$37.37再买了10万股腾讯。”即动用了370万美金,约合2530万人民币,在美股买...
日期:09-06
国家首次采购AVS产品 双国标数字电视修成正果(AVS地面数字电视标清机顶盒)
  2010年12月17日,由腾讯公司承办的AVS产业联盟第20次会议在深圳腾讯公司总部召开,创维、TCL、华为、长虹、国茂等成员代表出席了会议。按照惯例,AVS产业联盟秘书长张伟民要...
日期:07-25
三星cpu叫什么名字「挑战Intel/AMD!三星计划推出适用Windows PC处理器」
快科技10月25日消息,三星目前正在考虑推出适用于Windows PC的处理器。多年来,x86架构几乎是PC平台唯一的选择,PC处理器市场主要由Intel和 AMD主导。一加6t新配置曝光新增绿色和...
日期:10-26
淘宝活跃度超疫情前 阿里巴巴:4月让利40亿促消费回暖_疫情期间淘宝消费大数据
  4月7日,阿里巴巴时隔11年再次启动“春雷计划”。今日,阿里巴巴宣布,4月份,阿里巴巴数字经济体将举办至少33场“打开春天”系列活动,并联合生态伙伴让利40亿,线上线下齐发力,助...
日期:12-24
2020年全球供应链企业25强排行榜「全球供应链榜单公布:联想位居第8 阿里位列23」
5月26日消息,近日,全球供应链榜单Gartner Top 25公布新一年排名,联想集团再次入围并录得历史最佳排名,位居第8,超过沃尔玛、特斯拉、西门子等跨国企业。这也是联想集团再次蝉联亚...
日期:05-26
就离谱,多国苹果App Store全面涨价
中关村在线消息:近期苹果公司宣布,10月5日起,苹果应用商店(App Store)在智利、埃及、日本、马来西亚、巴基斯坦、波兰、韩国、瑞典、越南以及所有使用欧元的地区将会提高应用程序...
日期:10-16
奢望AI写作文?先把校对干好再说_奢望的奢
声明:本文来自于微信公众号 智商税研究中心(ID:gh_c55b3561ece1),作者:潘哥,授权转载发布。连高考作文都能写,面对更简单的校对工作,AI大模型能做好吗?高考开始后,除了考生之外,最忙...
日期:06-09
VIAVI 100周年新产品发布暨网络转型技术研讨会将于12月19日召开
通信世界网消息(CWW) 2023年是VIAVI创立100周年的重要里程碑。经过百年历程,VIAVI已经成为通信测试测量及光学技术领域的全球领导者。VIAVI的成功源于我们的员工、客户和合作...
日期:12-06
越南苹果代工质量「为苹果代工的业务“上新”,越南制造又赢了?」
据日经亚洲(Nikkei Asia)网站8月17日报道,有消息称,苹果公司正就首次在越南生产Apple Watch和MacBook进行谈判。报道称,身为科技巨头,苹果如今正寻求在中国以外的区域生产其产品,而...
日期:09-18
苹果新款MacBook Pro 14/16英寸将在今年Q4量产(macbook pro(13英寸,2015年初期))
IT之家 8 月 23 日消息,据分析师郭明錤称,苹果下一代 MacBook Pro 14 英寸和 16 英寸机型将于 2022 年第四季度进入量产阶段。苹果手表价格郭明錤在推文中表示,鉴于台积电的指...
日期:08-24
苹果15promax参数「iPhone15 Pro Max预计售价2万块 基础版也可能涨价」
iPhone15Pro Max最新的外观图已经曝光,这是根据一个配件制造商的CAD图纸绘制的,整体看起来还是比较可靠,同时也透露了不少有关iPhone15Pro Max外观和功能上的细节。从曝光信息...
日期:04-10
联合国警告脑机接口的危害:AI可能操纵人类大脑「脑机接口最新研究」
快科技7月17日消息,联合国最近对神经技术快速发展带来的潜在危害”发出警告,称大脑植入物和脑部扫描可能会让人工智能(AI)操纵人类大脑,侵犯私密的人类思想。联合国教科文组织...
日期:07-17