您的位置:首页 > 互联网

Stable家族上新!全新编码工具StableCode,16000上下文,5个Python文件同编辑

发布时间:2023-08-11 22:27:14  来源:互联网     背景:


yu新智元报道

编辑:桃子

【新智元导读】「Stable」家族又上新了!全新编码工具StableCode,最大支持16000上下文。

继文生图Stable Diffusion、SDXL1.0、语言模型StableLM之后,独角兽Stability AI又放大招了。

刚刚,Stability AI宣布推出,首个用于编码的生成式AI产品——StableCode。


StableCode提供了三种不同模型:通用基本模型、指令模型,已经支持多达16,000个token的长上下文窗口模型。

目前,它能够支持Python、Go、Java、JavaScript、C、markdown和C++编程语言的开发。

xbox360服务器停运

建在BigCode之上

具体来讲,StableCode通过使用3种不同的模型,来帮助程序员们编码,从而提高效率。

我们都知道,训练任何大模型都依赖于数据,对于StableCode,这些数据来自BigCode项目。

其实,使用BigCode作为LLM生成AI代码工具的基础并不是一个新想法。

亚马逊站内广告投放模式

马斯克新推特

5月,HuggingFace和ServiceNow早就推出了向公众开放的StarCoder LLM,它就是基于BigCode打造的。


基础模型首先在BigCode的堆栈数据集(v1.2)中的各种编程语言上进行训练。

Stability AI的首席研究科学家Nathan Cooper在采访中表示,StableCode的训练涉及对BigCode数据的重要过滤和清理。

然后,再使用Python、Go、Java、Javascript、C、markdown和C++等流行语言上进行进一步训练。

总的来说,Stability AI在HPC集群中560亿的token上训练了模型。

基础模型训练完成后,指令模型针对特定用例进行调整,以帮助解决复杂的编程任务。

大约120,000个以Alpaca格式的代码指令/响应对在基础模型上进行了训练。


使用StableCode Instruct生成对给定指令的响应代码

16000上下文,5个Python文件同编辑

StableCode 是那些希望学习更多编码知识的人的理想构件,而更长上下文窗口模型则是确保为开发者提供单行和多行自动完成建议的完美助手。

该模型可同时处理更多代码(比之前发布的上下文窗口为16,000个token的开放模型多2-4 倍)。

这样,开发者们可以同时查看或编辑相当于5个平均大小的Python文件。

Cooper解释说,更长的上下文可以使用更专业和复杂的代码生成提示。这也意味着开发者们可以让StableCode查看包含多个文件的中型代码库,以帮助理解和生成新代码。


StableCode使用Pytorch深度学习库完成一个相对复杂的python文件(灰色文本显示StableCode的预测)

与所有现代生成AI模型一样,StableCode也是基于Transformer架构。

StableCode没有使用ALiBi方法来定位Transformer模型中的输出,而是使用了一种称为旋转位置嵌入(RoPE)的方法。

Cooper说,Transformer模型中的ALiBi方法倾向于更重视当前token,而不是过去的token。

在Stability AI看来,这不是代码的理想方法,因为与自然语言不同,代码没有一个带有开头、中间和结尾的固定叙述结构。

代码函数可以为应用程序流程中的任何点定义。

那么,StableCode与其他模型相比,效果如何?

Stability AI将其与有相似的参数和训练的token数量的模型进行了比较。其中,使用流行的HumanEval基准,采用标准的pass@1和pass@10指标。


StableCode的基准分数


与类似大小(3B)模型的比较

30亿参数StableCode

StableCode-Instruct-Alpha-3B是一个30亿参数的纯解码器指调优的代码模型,预先在不同的编程语言集上进行了训练。

用法

该模型旨在按照指令生成代码。用于训练模型的数据集以Alpaca格式化。使用以下代码片段开始使用 StableCode-Instruct-Alpha-3B 生成代码:

米家激光影院

from transformers import AutoModelForCausalLM, AutoTokenizertokenizer = AutoTokenizer.from_pretrained("stabilityai/stablecode-instruct-alpha-3b")model = AutoModelForCausalLM.from_pretrained("stabilityai/stablecode-instruct-alpha-3b",trust_remote_code=True,torch_dtype="auto",model.cuda()inputs = tokenizer("###Instruction\nGenerate a python function to find number of CPU cores###Response\n", return_tensors="pt").to("cuda")tokens = model.generate(**inputs,max_new_tokens=48,temperature=0.2,do_sample=True,print(tokenizer.decode(tokens[0], skip_special_tokens=True))

模型详情

- 开发者:Stability AI

- 模型类型:StableCode-Instruct-Alpha-3B 模型是基于Transformer解码器架构的自回归语言模型。

模型架构


训练

StableCode-Instruct-Alpha-3B是带有代码指令数据集的StableCode-Completion-Alpha-3B上的指令微调版本。

参考资料:

https://stability.ai/blog/stablecode-llm-generative-ai-coding


返回网站首页

本文评论
苹果Mac三大新品国行价格汇总:巅峰顶配9.7万元_mac国产
WWDC 2023开发者大会上,苹果不但按惯例更新了iOS 7、iPadOS 17、macOS 14 Sonoma、watchOS 10、tvOS 17五大操作系统,还带来了顶级的M2 Ultra处理器,以及四款全新的硬件产品。...
日期:06-06
“精神辞职”的打工人:被劝退、被恶评、被工作PUA_打工经常被辞退的人
声明:本文来自于微信公众号 开菠萝财经(ID:kaiboluocaijing),作者 | 吴娇颖 金玙璠 苏琦 编辑 | 吴娇颖,授权转载发布。这届打工人,最近开始流行“精神辞职”。所谓的“精神辞职”...
日期:10-21
《流浪地球2》票房破32亿元 导演谈第3部:原班人马再来一遍「流浪地球同期电影票房」
贺岁档科幻大片《流浪地球2》票房已经突破32亿元,无论是从口碑、票房还是从影片本身的预设来看,必然会有下一部。官微分享的视频显示,在重庆站路演现场,被问及下一部选角时,郭帆...
日期:02-05
AI助力审美革新,更美App深抓年轻消费者心智(提升审美app)
  随着市场的发展,医美市场伴随着颜值时代成长起来,同时也是近些年发展迅猛的行业之一。而更美App在后疫情时代,紧抓市场机遇,业绩直线上升,成为年轻一点消费者的品质之...
日期:07-14
前腾讯新闻负责人王诗沐将加入百度?百度:尚无定论_腾讯新闻 王诗沐
相关新闻:消息称腾讯新闻前负责人王诗沐离职,将加盟百度担任AI产品总经理   讯 8月16日下午消息,今日,有媒体报道称腾讯新闻前负责人、知名产品经理王诗沐已经离职,将加入百度...
日期:08-20
湖北移动5G赋能农业生产 万亩农田“上云端”「湖北移动5g招标公告」
湖北移动5G赋能农业生产 万亩农田“上云端” 通信产业网|2023-06-19 14:42:52作者:通文来源:通信产业网【通信产业网讯】栽种初夏秧,稻谷满粮仓。眼下,湖北武汉市黄陂李家集街畅...
日期:06-19
小米集团全球副总裁辞职;李想称理想L5车型非SUV;顺丰发布2022年度业绩预告;
文章目录福特汽车发展 顺丰发布2022年度业绩预告 小米集团全球副总裁辞职 李想称理想L5车型非SUV 顺丰发布2022年度业绩预告顺丰控股发布2022年度业绩预告称,公司2022年度业...
日期:01-31
或为V社最成功硬件:Steam Deck销量榜连续夺冠20周
今天,Steam公布了10月10日至10月16日的销量榜,V社自家的掌机Steam Deck继续位列榜首,拿下了夸张的20连冠,配套基座则拿下榜单第二。对于一款游戏平台来说,在长达20周的时间内,都没...
日期:10-19
微软Windows 7全球销量突破3.5亿套(windows系统全球占有率)
  微软在官方博客上公布称Windows 7销量已经达到3.5亿套。微软于18个月前推出Windows 7,至今已经一年半时间,其销量已经达到另一个里程碑:已经售出3.5亿份授权。微软发言人...
日期:07-27
MWC19上海 | 新华三彰显5G融合应用与行业数字大脑创新成果_新华三5G
  6月26日,备受业界瞩目的MWC19 上海盛大开幕,来自 110 多个国家和地区的逾6万名专业人士和550家知名企业共聚这一亚洲科技盛会。作为数字化解决方案领导者,紫光旗下新华三...
日期:03-16
腾讯云公布大数据平台数据 日实时计算量超40万亿_腾讯在线数据统计
9月11日消息,在2020腾讯全球数字生态大会上,腾讯云副总裁刘煜宏透露,腾讯云大数据平台的算力弹性资源池达500万核,每日分析任务数达1500万,每日实时计算次数超过40万亿,能支持超过...
日期:08-01
京东双11苹果成交额1分钟破10亿「京东 双十一成交额」
中关村在线消息:近日,根据国内媒体报道,在京东双11“巅峰28小时”活动的国产中,根据京东提供的数据,苹果产品成交额1分钟突破10亿元,小米、华为、荣耀、OPPO、iQOO、三星、一加、r...
日期:11-14
奢侈品电商寺库之殇:市值蒸发50亿元,退市破产进行时_数次调整发展方向后,中国奢侈品电商寺库或将退市
  文/邓双琳   编辑/李薇   0.239美元,这是奢侈品电商寺库8月18日盘中的股价。较13美元的发行价,寺库股价已下跌超98%,市值由巅峰时的7.7亿美元,缩水至1629万美元,蒸发掉...
日期:08-20
国内外多地政策发布,推动电子签名加速发展
  近期,国内外多地政府机构以多种形式鼓励电子证照、电子签名与电子印章应用,电子签名技术在政务服务、司法诉讼以及外贸等领域得到更广泛普及。   国内外多地政府机构...
日期:05-12
抖音拿下春晚红包意在社交,不在支付_央视春晚抖音app红包
  1月26日,抖音与央视春晚联合宣布,抖音成为2021年春晚独家红包互动合作伙伴。消息一经发布,外界便纷纷猜测,抖音意在借助春晚红包争夺支付市场。毕竟,抖音支付恰巧最近在抖...
日期:07-10
追梦学习机,只有IT直男爸爸才懂的高品质
  IT直男,也许大家并不陌生。但是IT直男爸爸,不知你们见识过没?   IT直男爸爸,你见过他带娃时顺便把娃当哑铃锻炼身体,像撸猫一样给宝宝擦面霜,把宝宝粘贴在墙上与他一起看...
日期:07-16
集中抛售,腾讯的投资风向变硬了?_腾讯投资面经
记者;|王郁彪;杨昕怡;;编辑;|;刘雪梅 董兴生 ; ; ; ;继相继减持京东(HK09618,股价221.2港元,市值6909亿港元)、海澜之家(SH600398,股价4.5元,市值194.38亿)、Sea Limited(SE,股价89....
日期:08-19
梅西加冕球王 直呼阿根廷是冠军:个人10号球衣二手售价近4000元_梅西签名球衣市场价
12月18日,阿根廷队最终赢得了世界杯冠军。当日,在卡塔尔卢赛尔球场进行的2022卡塔尔世界杯足球赛决赛中,阿根廷队与法国队在常规时间和加时赛战成3比3平,通过点球大战阿根廷队以...
日期:12-19
港股美团股价「港股美团跌超11%,市值跌破1万亿港元」
  讯 8月16日下午消息,港股美团跌超11%,报159.6港元每股,市值跌破1万亿港元。此前有市场消息称,腾讯计划出售美团的全部或大部分股权。对此,腾讯方面回应称,不予置评。小米11 ul...
日期:09-27
用阅读拓宽生命边界!讯飞有声书发起读书日活动「讯飞有声2018」
我们有多久没有真正地大声读一本书了?通过书籍去了解不一样的生活与人生,在今年这个久违的春天里,讯飞有声书联合了单向空间,发出阅读的号召:不如大声读书!从2015年的世界读书...
日期:04-22