您的位置:首页 > 互联网

手机就能运行,1万亿训练数据!StableLM-3B-4E1T来啦

发布时间:2023-10-03 19:18:10  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

美东时间10月2日,著名开源平台Stability.ai在官网宣布,推出开源大语言模型StableLM-3B-4E1T。(开源地址:https://huggingface.co/stabilityai/stablelm-3b-4e1t)

据悉,Stable LM3B是一款主要面向手机、笔记本等移动设备的基础大语言模型,在保证性能的前提下,极大降低了算力资源的要求。

Stable LM3B支持生成文本/代码、总结摘要、数据微调、常识推理、解答数学题等功能,全局上下文长度为4096。(简称“Stable LM3B”)

随着ChatGPT的火爆出圈,全球掀起了轰轰烈烈的“大模型开发热潮”。但多数模型皆需要耗费大量算力资源才能预训练、微调,同时对开发的生成式AI应用的运行环境也有很高的要求。高通更是发布了专门针对移动端的生成式AI芯片,以解决算力问题。

Stability.ai希望通过开源Stable LM3B,帮助那些没有庞大算力资源的开发者,也能打造小巧精悍的生成式AI产品,可以安全、稳定地在移动端运行。

Stable LM3B训练数据集

虽然该模型只有30亿参数,却使用了一个包含文本、代码、维基百科、ArXiv、图书、C4等多种数据的1万亿tokens庞大的训练数据集。

该数据集由多个开源的大规模数据集经过筛选混合而成,包括Falcon RefinedWeb、RedPajama-Data、The Pile以及 StarCoder等。

这使得Stable LM3B以更少的资源,性能却超越同等规模模型,甚至比一些70亿、100亿参数的大模型更强。

Stable LM3B训练流程

Stable LM3B以bfloat16精度训练972k起步,全局上下文长度为4096,而不是像 StableLM-Alpha v2那样从2048到4096进行多阶段提升。

Stability.ai使用了AdamW进行性能优化,并在前4800步使用线性预热,然后采用余弦衰减计划将学习率降至峰值的4%。

早期的不稳定性归因于在高学习率区域的长期停留。由于模型相对较小,没有采用dropout。

在训练过程中,Stability.ai评估自然语言基准,并在学习率衰减计划的尾声阶段,观察到训练带来的稳步提升。基于这个原因,开发人员决定将学习率线性降低至0,类似于Zhai等人的做法,以期获得更好的性能。

此外,在预训练的初始阶段依赖于 flash-attention API及其开箱即用的三角因果屏蔽支持。这迫使模型以类似的方式处理打包序列中的不同文档。

在冷却阶段,Stability.ai在并发实验中凭经验观察到样本质量提高(即:减少重复)后,为所有打包序列重置 EOD 标记处的位置ID和注意掩码。

beats耳机假货价格

硬件方面,StableLM-3B是在Stability AI的算力集群上训练的。该集群包含256个NVIDIA A10040GB显卡。训练开始于2023年8月23日,大约消耗了30天完成。

性能测试方面,StableLM-3B在零样本的lm-evaluation-harness评估框架中,进行了性能测试。结果显示,性能完全不输70亿参数的模型,甚至比一些100亿参数的更强。


返回网站首页

本文评论
否认将被索尼收购 CD,Projekt第一季度净利润同比增长1%_索尼收购了哪些公司
5 月 30 日消息,波兰游戏开发商 CD Projekt 周一重申,该公司不会被出售,此前周末有传言称,这家《赛博朋克 2077》的制作商可能成为索尼的收购目标。“我们这边没有任何变化,我可...
日期:09-26
Facebook雇佣OpenAppMk创始人开发HTML5应用_facebook开发者
  9月9日下午消息,据美国科技博客TechCrunch报道,Facebook已经雇佣了HTML5移动网络应用商店OpenAppMkt.com创始人兼CEO泰克·谢(Teck Chia)负责其移动应用商店项目。   F...
日期:07-22
普华永道:AI 生成内容在文本和程序代码方面已极具实用性_普华永道 人工智能
3月31日消息:普华永道发布了一份关于新消费领域 AIGC(人工智能生成内容)业态和模式的分析报告,报告指出 AIGC 领域存在技术成熟度、算法偏见、版权和隐私保护等挑战。ok镜最新...
日期:04-01
Apple Watch Ultra被吐槽:警笛求救功能实测效果不如几块钱的哨子
Apple Watch Ultra是当前苹果最高端的智能手表(6299元一块),也是一款面向户外极限运动场景设计的穿戴设备。贝索斯前妻捐款鸿蒙系统与安卓系统强多少对于热衷于户外冒险的朋友,...
日期:12-26
国家电网:应对用电高峰 试点推行电动汽车错峰充电_国家电网充电峰谷时段
高温天气影响下,多个省份的用电负荷屡创新高,为保障用电高峰电网安全运行,国家电网在部分高温高负荷省份试点推行电动汽车错避峰充电。   首批开展试点的是重庆、浙江、湖北...
日期:08-20
iPhone 15全系配置售价曝光!标准版和Pro版有啥区别?选购指南来了「苹果15和15.1」
快科技8月9日消息,目前,多方消息指向,苹果公司的年度iPhone发布会预计将于今年9月12日星期二或9月13日星期三举行。按照苹果公司的惯例,新款iPhone的预订将于几天后的9月15日星...
日期:08-09
特斯拉新工厂选址已有眉目:马斯克在这个国家早有部署(马斯克想建造特斯拉外星工厂)
全球电动汽车龙头特斯拉已开始游说加拿大安大略省政府,有意在该地区建立一个新的电动汽车工厂。财联社8月9日讯(编辑 赵昊)综合多家外国科技媒体报道,全球电动汽车龙头特斯拉已...
日期:08-20
关于抖音电商,还有哪些增量可以拿?「抖音电商产业带」
声明:本文来自于微信公众号 深响(ID:deep-echo),作者:何文,授权转载发布。不到三年时间,抖音电商不断发展。2020年,以罗永浩为代表的名人明星掀起直播带货热潮。内容电商随之破圈,...
日期:05-18
小米MIX Flip渲染图曝光:最具辨识度的MIX旗舰「小米mix folder」
快科技9月7日消息,根据市场研究机构IDC的数据,2022年中国折叠屏手机市场出货量近330万台,同比增长118%。折叠屏手机产品在整个手机市场的占比从2021年的0.5%上升到1.2%,预计2023...
日期:09-07
造车新势力 Silence 宣布量产旗下首款电动汽车 S04:电池可拆卸_silence s01电动车
IT之家 6 月 10 日消息,前捷豹路虎 SVO 部门主管约翰爱德华兹和前日产汽车营销总监托尼刘易创立了电动车品牌 Silence,该品牌近日宣布将正式进军电动汽车市场,其首款四轮电动车...
日期:06-11
LG W20手机配置曝光,搭载紫光展锐虎贲SC9863A芯片_紫光展锐手机芯片型号
  1月19日消息 据91mobiles报道,近日在Google Play的列表中发现了LG W20手机部分配置信息,可以看到这款产品搭载紫光展锐虎贲SC9863A芯片。   据了解,LG新款W系列早在去...
日期:05-19
直播电商“大考”在即,品牌和商家如何实现生意爆发式增长?「直播电商的兴起」
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:Bamboo,授权转载发布。一年一度的电商大考就要来了。近日,各大平台纷纷启动招商,亮出压箱底的看家本事,打响了年终大促的发令枪...
日期:10-03
荣耀60pro提前上市「荣耀80系列有望11月发 :Pro+版本缺席」
目前双十一大促节已拉开序幕,手机圈也热闹起来,将会有不少新机将赶在双11前发布,荣耀手机这边也有大动作。特斯拉已经与印尼达成协议据数码博主厂长是关同学 ”透露,荣耀将会在1...
日期:11-02
千元LCD屏降临!真我11x发布:190g机身塞进5000mAh大电池_真我11参数配置
快科技8月24日消息,真我11x在印度亮相,6GB 128GB售价14999印度卢比(约合人民币1322元),8GB 128GB售价15999印度卢比(约合人民币1400元)。这是一款LCD屏手机,屏幕尺寸是6.72英寸,分辨...
日期:08-24
暴雪 停运「网易宣布暴雪停服:感谢玩家相伴14年 期待玩家重返国服_」
1月23日,网易发布《网易致暴雪国服玩家的告别信:感谢相伴14年》公告,正式宣告暴雪游戏停服。2023年1月24日0时,由网之易代理的《魔兽世界》《炉石传说》《守望先锋》《暗黑破坏...
日期:01-24
百度地图怎么绕开拥堵_上下班总是因“堵”烦恼?百度地图熟路模式带你智慧避堵
  通勤路上,上班族们为准时到岗总是“分秒必争”,路况便成了人人关注的重点。了解哪里堵、堵多久、哪条路拥堵更少,才能选择最佳通勤路线。近日,百度地图推出更懂用户、懂路...
日期:03-25
哔哩哔哩将于3月2日发布2022年第四季度及全年财报「哔哩哔哩2020年全年财报」
  讯 北京时间2月14日晚间消息,在线娱乐平台哔哩哔哩(B站,Nasdaq:BILI,HKEX: 9626)今日宣布,将于美国东部时间2023年3月2日美国股市开盘前(北京时间3月2日晚)发布2022年第四季度及...
日期:02-15
未来还将推出安卓版-ChatGPT正式发布App,iOS客户端可下载_chat下载手机版
5月19日消息,在手机上也能玩ChatGPT了!三星2017评测FF融资闹乌龙OpenAI宣布推出聊天机器人ChatGPT的APP,目前已上架苹果App Store,这是该软件首次发布手机APP。官方还承诺未来也...
日期:09-28
U-Mail邮件系统采用专属加密技术保障邮件信息的安全_加密邮件发送
  电子邮件(E-Mail)是互联网中最早出现的服务之一,也是目前应用最广泛、最成功的互联网应用之一,与其他通信方式相比,电子邮件具有跨平台、成本低、速度快、信息多样性等优...
日期:07-18
阿里申请香港纽约双重主要上市 有望获得更高流动性(阿里巴巴纽约上市)
为什么ipad涨价我国电子商务网站数量增速下降 面临三道坎是指win11微软商店怎么下安卓三星S6颜色谷歌彻底放弃中国 查看最新行情   记者/李丹昱   今...
日期:07-31