您的位置:首页 > 互联网

Stability AI发布全新代码模型Stable Code 3B,媲美70亿Code Llama,没GPU也能跑_aide代码大全

发布时间:2024-01-18 15:57:11  来源:互联网     背景:

苹果airpodspro和beats

声明:本文来自微信公众号“新智元”(ID:AI_era),作者:新智元,授权转载发布。

今天,Stability AI发布了自家在2024年的第一个模型——Stable Code3B。

新东方智慧学堂怎么样

顾名思义,Stable Code3B专注于代码能力,实际的表现也是非常亮眼。

在仅仅3B参数的规模之下,达到了比肩Code Llama7B的效果。

相较于Code Llama7B,Stable Code3B的体积减少了60%,但在多种编程语言上保持了相当的水准,在Python和C++的代码补全中甚至反超了Code Llama7B。

另外,由于模型仅有3B大小,Stable Code3B可以在MacBook Air等普通笔记本电脑上实时运行,甚至没有独立GPU也可以!

有网友将Stable Code3B称为Copilot的离线替代品,并希望能在VS Code上使用它。

4个小时后,有网友发推表示自己在VS Code上更新了LLama Coder插件,可以支持最新的Stable Code3B模型。

它非常好!它很小,这意味着它可以在任何硬件上运行,并且运行速度非常快。

插件地址:https://t.co/Mn7onaDpge

虽然模型名义上叫做Stable Code3B,但其实是一个2.7B 参数的纯解码器语言模型。

除了模型比较轻量之外,Stable Code3B还支持高达100K的上下文大小,可以更方便、更精确地辅助编码。

另外,模型参考了2023年StackOverflow开发者调查中,最受欢迎的18种编程语言,针对这18种语言进行了训练,提供了同等规模模型中最优秀的性能。

  • C

  • CPP

  • Java

  • JavaScript

  • CSS

  • Go

  • HTML

  • Ruby

  • Rust

  • Markdown

  • Shell

  • Php

  • Sql

  • R

  • Typescript

  • Python

  • Jupyter-Clean

  • RestructuredText

在与同量级的竞品模型的比较中,Stable Code3B也几乎拿到了最好的成绩。

目前,Stable Code3B已经加入了Stability AI的会员大礼包中,只要不涉及商用,用户都可以免费使用。

李诞的老婆淘宝店

Stable Code3B

电动卡车加速很快的速度之王

Stability AI从2023年底开始推出更小尺寸、但功能强大的模型,包括StableLM Zephyr3B等用于文本生成的模型。

Stable Code3B的前代是Stability AI在8月份发布的Stable Code Alpha3B。

Stable Code Alpha3B使用来自BigCode的堆栈数据集(v1.2)来训练基础模型,并使用Python、Go、Java、Javascript、C、Markdown和C++等流行语言进一步训练(共560B代码token)。

建立基础模型后,开发人员针对特定用例对指令模型进行了调整,使用大约120000个Alpaca格式的代码指令/响应来训练模型,以提升解决复杂编程任务的能力。

上图展示了Stable Code Alpha利用Pytorch库完成一个相对复杂的python文件,灰色部分为Stable Code的预测。

参数细节:100K上下文,支持FIM

Stable Code3B 在256个英伟达A10040GB GPU(AWS P4d实例)的集群上进行训练,

使用ZeRO-1的数据并行和张量并行,并依赖FlashAttention以及FlashAttention-2的SwiGLU和Rotary Embedding内核。

模型的训练流程由类似于Code Llama的多阶段过程。

第一步,以使用自然语言数据预训练的StableLM-3B-4e1t为基础(使用4万亿个token训练),对多个代码和代码相关数据集进行无监督微调,包括 CommitPack、GitHub Issues、StarCoder和其他数学数据集。

模型在上述数据集上使用bfloat16进行了精确预训练,并使用AdamW进行了优化。

第二步,使用16384个token的更长序列进一步微调模型,同时与Code Llama类似,使用一种称为旋转位置嵌入(RoPE)的技术进行优化,使上下文大小扩展到了100k个token。

另外,新的Stable Code3B模型还支持Flash Attention2。

作为改进版本,Stable Code3B不仅可以建议新的代码行,还可以填补现有代码中较大的缺失部分——称为中间填充功能(FIM)。

Stable Code3B的模型架构如下表所示:

旋转位置嵌入应用于前25%的head embedding,以提高模型的吞吐量;

使用GPTNeoX Tokenizer的修改版本——NeoX,并添加特殊token来训练中间填充功能,比如<FIM_PREFIX>、<FIM_SUFFIX>和其他特殊token。

在使用BigCode的评估工具测试的多种编程语言的MultiPL-E指标上,Stable Code3B展示了最先进的性能。

上表中,Stable Code3B与同等规模的编码模型进行比较,在全部的六种编程语言中,都处于领先。

而相比于体积大2倍多的Code Llama7B,Stable Code3B也拿到了3项胜利。

Stability表示将发布一份完整的技术报告,包含更多细节和消融实验等。

aide代码大全手册

代码生成之战

目前,AI代码生成工具的市场竞争非常激烈,70亿参数的来自Meta的Code Llama7B被广大开发者所使用。

而在30亿参数这个量级,StarCoder LLM(由 IBM、HuggingFace和ServiceNow共同开发的开源项目)广受欢迎。

从测试成绩上来看,Stability AI的这个模型要优于StarCoder,不知道Stable Code3B会给Stability和市场带来怎样的变化。

参考资料:

https://stability.ai/news/stable-code-2024-llm-code-completion-release

https://huggingface.co/stabilityai/stable-code-3b


返回网站首页

本文评论
前5分钟都留不住玩家,现在的游戏新手教程到底差在哪?「新手如何玩好」
声明:本文来自微信公众号“游戏葡萄”(ID:youxiputao),作者:Wenlon,授权转载发布。当开发者从玩家视角思考这个问题。玩家首次进入游戏的第一印象至关重要,它决定了玩家会不会留...
日期:10-21
腾讯高管回应减持京东美团:投资策略非常清晰 将投资者利益最大化
11月15日下午,腾讯公司发布了Q3季度财报,同时还宣布了多个重大事项,其中就包括减持美团。腾讯公告称,董事会决议将按合资格股东持有每10股股份获发1股美团B类普通股的基准,向股东...
日期:11-17
瑞芯微与百度飞桨联手推动AI应用场景普及
  在AI向前不断推进的过程中,随着业界对AI应用落地的迫切需求,AI软硬件的充分结合势在必行。瑞芯微高算力AI芯片与百度飞桨开源深度平台之间的合作,强势赋能AI行业。   ...
日期:12-21
段永平买了多少腾讯股票「腾讯股价跌60%创4年来新低 段永平再度高呼买入腾讯」
10月12日,腾讯股价盘中再创新低,跌破250港元,创4年来新低,相比2021年的高点已经腰斩60%。就在腾讯股价创新低之际,中国巴菲特”段永平再次发声,表示计划明天32美元左右再买点。”...
日期:10-14
微软 Edge 浏览器已开始支持 PDF 文件进度记忆功能(edge默认打开pdf)
  9 月 2 日消息 与谷歌 Chrome 或 Firefox 火狐不同,微软 Edge 浏览器包含多项高级 PDF 功能,例如注释工具等。   据外媒 Windows Latest,近日,微软终于在 Windows、macOS...
日期:07-17
1支有道词典笔相当于13本词典?原来可以这样为学生“减负”_有道词典笔专业版和加强版
  当前,市面上中英翻译的黑科技可谓层出不穷,从拍照翻译到扫描翻译,无论是给专业英语学习者,还是原版书籍爱好者都带来了很多便利。前段时间在网易有道CEO丁磊直播首秀中...
日期:07-14
【58同城】打印机租赁「91租毕业季特惠|超值A4打印机租赁低至531元/月,包耗材,随便印!」
现在越来越多的人选择居家办公和远程工作,因此对于办公和生活设备的需求也越来越高。为了满足顾客的需求,震旦 91 租在毕业季来临之际推出超值A4 打印机租赁活动。这个活动包...
日期:05-19
家里兵器比化妆品多,玩成百万网红女侠,这位小姐姐太酷了
声明:本文来自于微信公众号 秋叶大叔(ID:qiuyedashu),作者:秋叶大叔,授权转载发布。很多网红的套路都能复制,但这个姑娘的不行,她不是套路,而是真功夫。就问你打的好不好看?过不过...
日期:09-12
网页版ChatGPT!超强插件Monica来了_autochartist网页版
最近,超强Chrome插件Monica在网络上爆火。据了解,Monica是一款搭载ChatGPT的网页助手,可以聊天、生成文案、阅读网页信息并拓展相关问题。生成文案的时候,你甚至可以具体要求到...
日期:04-18
美登月火箭发射连续推迟 马斯克暗示应改用甲烷作为燃料「马斯克为什么发射火箭」
9月5日消息,当地时间周六,美国宇航局(NASA)再次决定推迟无人环绕月球任务Artemis 1(“阿耳忒弥斯1号”)的发射,此前任务团队在向太空发射系统(SLS)火箭加注液氢时遭遇泄漏问题。对...
日期:10-01
男子欲试睡“凶宅”躺赚大钱被骗 网友揭秘:杀猪盘骗局
杀猪盘骗局真是无穷无尽,各种套路层出不穷,大家一定要擦亮眼睛!据报道,近日云南昆明男子小彭刷短视频时,看到有人招募凶宅试睡员”,薪酬优厚,心动的小彭就添加了对方联系方式。对方...
日期:02-10
小米14维修价格公布:换电池119元,换屏幕最低630元_小米售后换屏价格表
作为小米最新发布的年度旗舰手机,小米14系列凭借着优秀的外观设计、强劲的硬件堆料和不俗的使用体验,受到了许多消费者的关注。根据官方公布的消息显示,小米14系列首销5分钟的...
日期:11-06
分析称日本地震不会影响苹果iPad 2供应链
  日本近日遭受里氏9级大地震袭击,由于日本是世界上主要NAND闪存制造中心,有分析师担心地震会对闪存生产和价格产生巨大冲击,进而影响苹果 iPad 2的销售。对此,美国科技新闻...
日期:07-26
Stability AI 政策负责人:人工智能不会摧毁创造力「人工智能的政策意识」
7月19日 消息:Stability AI 公共政策主管Ben Brooks表示,人工智能不会摧毁创意市场,反而会为创作者赋能。Ben Brooks 在美国参议院知识产权小组委员会上发表讲话时表示,像 Stab...
日期:07-19
手机网购_手机网购好还是实体店好
随着移动互联网的飞速发展,已成为人们生活中不可或缺的一部分。不仅方便快捷,而且越来越多的二三线城市人也开始通过享受到优质的生活。携程二季度净营收87亿元,继续市场下沉...
日期:05-29
淘宝扶持政策_淘宝网即将推出扶持计划持续帮助创业者
10月17日下午,阿里巴巴集团董事局主席兼CEO马云在淘宝商城媒体沟通会上表示,继淘宝商城推出18亿消费者保障和商户扶植计划后,淘宝网也将在近期推出中小卖家创业扶持计划。 马...
日期:07-24
Redmi宣布联名兰博基尼超跑!K70或推兰博基尼定制版_兰博基尼小米联名
11月29日,Redmi宣布与兰博基尼汽车SQUADRA CORSE合作推出联名款手机。据悉,Redmi将于当天晚上19点发布K70系列新机,预计会有三款机型可供选择,其中包括兰博基尼定制版。歌尔股份...
日期:11-30
神操作 外卖小哥为闯红灯S形走位 被罚20元_外卖小哥闯红灯现象
近日,在浙江省嘉兴市区,一名外卖骑手驾驶电动自行车不仅闯红灯,还上演S”形走位,在十字路口随意穿插任性驾驶,全然不顾其它车辆。视频中可以看到,这名外卖小哥开始骑着电动自行车...
日期:01-30
支付宝上线40城“端午旅行打卡地图”,热门景点出行一键智能规划
6月19日 消息:端午将至,又适逢暑假,各地即将迎来出游高峰。为助力游客便捷出游、绿色出行,支付宝推出端午出行大礼包和全国40座热门旅游城市的“旅行打卡地图”,帮游客一键规划...
日期:06-19
发现一线标杆:“5G+”灯塔应用和全连接工厂调研巡礼_灯塔设备
发现一线标杆:“5G+”灯塔应用和全连接工厂调研巡礼 通信产业网|2024-01-05 15:11:08作者:胡媛来源:通信产业网【通信产业网讯】(记者 胡媛)行业应用是5G的“主战场”。2023年,在...
日期:01-11