您的位置:首页 > 互联网

ai开源项目「Stability AI开源3B代码生成模型:可补全,还能Debug」

发布时间:2024-03-27 10:26:56  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。

Stable Diffusion3还没全面开放,这家公司的代码生成模型先来了。

本周一,Stability AI 开源了小体量预训练模型 Stable Code Instruct3B。

这些价值超百万的ai开源模型,聪明人已经都下载好了

高通arm芯片

Stable Code Instruct3B 是一个基于 Stable Code3B 的指令调整编码语言模型(Code LM)。给出自然语言 prompt,该模型可以处理各种任务,例如代码生成、数学和其他软件工程相关的任务。

Stability AI 宣称,该模型在3B 规模上提供了 SOTA 性能,并且优于 CodeLlama7B Instruct 等更大规模的模型,甚至在软件工程相关任务中,性能与 StarChat15B 相当。

美国奈飞股价

  • 模型:https://huggingface.co/stabilityai/stable-code-instruct-3b

  • HuggingFace 试用:https://huggingface.co/spaces/stabilityai/stable-code-instruct-3b

  • Stable Code 技术报告:

https://static1.squarespace.com/static/6213c340453c3f502425776e/t/6601c5713150412edcd56f8e/1711392114564/Stable_Code_TechReport_release.pdf

Stable Code Instruct3B 增强了代码补全能力,并支持自然语言交互,旨在提高编程和软件开发相关任务的效率和直观性。实验测试表明,该模型在各种与编码相关的任务中优于 Codellama7B Instruct 和 DeepSeek-Coder Instruct1.3B 等同类模型。

方法介绍

Stable Code 建立在 Stable LM3B 的基础上。Stable Code 是一个因果纯解码器 transformer,类似于 LLaMA 架构,与 LLaMA 的主要区别如下:

  • 位置嵌入,旋转位置嵌入应用于头嵌入维度的前25%,以提高吞吐量;

  • 标准化,带有学得偏差项的 LayerNorm;

  • 偏差,除了键、查询和值投影的偏差,Stable Code 从前馈网络和多头自注意力层中删除了所有偏差项。

下表给出了预训练语料库数据集的采样权重、 epoch、类别等信息。

根据 Stack Overflow2023开发者调查报告,Stable Code Instruct3B 重点关注 Python、Javascript、Java、C、C++ 和 Go 等语言,这些语言对于各种开发人员来说是最流行和最有影响力的。虽然这些语言被选为训练的重点,但该模型还针对其他广泛采用的语言(例如 SQL、PHP 和 Rust)进行了训练。

这些价值超百万的ai开源模型,聪明人已经都下载好了

即使对于最初未包含在训练集中的语言(例如 Lua),Stable Code Instruct3B 也能提供强大的测试性能。这种熟练程度可能源于其对底层编码原理的理解,以及利用编码任务固有的可预测性,在不同编程环境中适应概念的能力。

Stable Code Instruct3B 不仅精通代码生成,还精通 FIM(Fill in the Middle)任务、数据库查询、代码翻译、解释和创建。其指令调整使其能够理解并按照细致入微的指令采取行动,促进除简单代码完成之外的广泛编码任务,包括数学理解、逻辑推理和围绕软件开发处理复杂的技术描述。

性能评估

与 Codellama7B Instruct 和 DeepSeek-Coder Instruct1.3B 等领先模型相比,Stable Code Instruct3B 在一系列编码任务中展现出卓越的性能。

研究团队还在 Multi-PL 基准上比较了三种模型。尽管参数量较少,但 Stable Code Instruct3B 在所有语言上的表现均明显优于 CodeLlama Instruct。

下表8展示了几种模型在 FIM 任务上的性能:

aia源代码下载

实验测试表明,Stable Code Instruct3B 在代码完成准确性、对自然语言指令的理解以及跨不同编程语言的能力方面可与其他模型媲美甚至超越。

Stable Code Instruct3B 的参数规模和低硬件要求使其可供广泛的受众使用,使开发人员能够更高效地工作。值得一提的是,Stable Code Instruct3B 现在可以通过 Stability AI 会员资格用于商业目的。

参考链接:

https://stability.ai/news/introducing-stable-code-instruct-3b

https://twitter.com/StabilityAI/status/1772345514023116828

曲面屏和2.5d屏哪个好


返回网站首页

本文评论
小米手机fsn码「小米手机f码怎么获得」
小米手机在市场上一直备受追捧,但是它的知名度不仅仅是因为它的好机型,也因为它的f码抢购系统。小米手机f码是什么?怎么获得?下面我们来详细了解一下。58姚劲波新闻何为小米手机...
日期:06-03
全球独角兽遭遇“十年之痛”「世界独角兽」
  来源:日经中文网京东互联网之路成功的关键电子商务聚美优品销售总监  文/奥平和行 今堀祥和   企业估值超过10亿美元的未上市企业被称为“独角兽”已有10年。从约40...
日期:09-27
美团外卖:直播商品券让商家货架交易同步增加50%_「美团外卖商品券是什么意思」
5月17日消息,近日美团外卖公布了首场直播带动货架的“交叉销售”数据。数据现实,平均1张商品券核销带动产生了商品券价值1.5倍的订单交易额。硅谷的科技此前的4月18日,美团外卖...
日期:05-17
公司回应招聘前台要求身材 硬性要求臀围86腰围58:网友吐槽离谱_招聘前台标准
据九派新闻视频报道,近日,有网友发文称,自己找工作时,发现某公司行政前台岗对身高、体重、肩宽、腰围、臀围等均有要求,像选美一样,引起广泛关注。该岗位的招聘要求中明确提到,因为...
日期:03-25
苹果罕见大降价,华为的压力给到了?_苹果华为今年的趋势
栏目|网易科技《态度》栏目作者|崔玉贤编辑|丁广胜1、 苹果官网罕见大降价冲上热搜。原因是苹果中国上线了迎新春限时优惠活动,1月18日至1月21日,以符合条件的支付方式购买指定产...
日期:01-15
运行 Win11更顺畅了,DuoWoA项目为Surface Duo 手机发布驱动更新_微软surface驱动下载
IT之家 5 月 10 日消息,开发者 Gustave Monce 近日更新 DuoWoA 项目,为 Surface Duo 手机发布了 2305.25 驱动版本更新,让这款双屏手机更顺畅地运行 Win11 系统。恒生指数服务...
日期:05-10
卢伟冰将接任小米集团总裁 现任总裁王翔月底退休_小米集团副总裁卢伟冰
12月23日消息,昨天晚间雷军发内部信表示,现任小米总裁王翔将于2022年12月30日正式卸任小米集团总裁。同时经过公司合伙人委员会的慎重讨论和协商,决定晋升卢伟冰为新一任集团总...
日期:12-23
增程式suv是什么意思「增程式技术落后?李想回应:5年内增程式仍是SUV最佳方案」
理想汽车CEO李想回应外界对于增程式技术的质疑。8月15日,在理想汽车(Nasdaq :LI;02015.HK)第二季度财报电话会上,李想谈及中长期产品规划时表示,往后看5年,增程式仍旧是SUV最佳解决...
日期:09-20
月薪6000小伙为见女主播打赏9000万  因挪用公司公款被判14年
近日,一个月薪仅为6000元的小伙刘明胜,因痴迷于女主播K宝的直播间,竟然动用公司的公款打赏女主播达1.2亿的事件引发网友关注。刘明胜为了追求刺激和与K宝见面,频繁地挪用公司资...
日期:09-21
奔驰二手车怎么折价「男子网拍二手奔驰车遇调表 拍卖公司退一赔三赔偿70余万」
买卖二手车,如果车主遭遇调表、火烧泡水、重大事故等故意欺诈行为,可拿起法律武器维权,如果销售欺诈成立,车商最高可被处罚退一赔三。据了解,陈先生诉称,2021年10月,自己从某拍卖公...
日期:03-25
小红书2023春节消费报告:关于旅游笔记的发布量同比增长近70%「2020端午小红书旅游趋势报告」
2月1日 消息:小红书与数据分析机构易观分析联合发布《小红书2023春节消费报告》。报告显示:流动成为年轻人的关键词,他们或奔赴山海游玩,或托运宠物一起回乡团圆;热闹氛围蔓延...
日期:02-01
上海浦西第一高楼为2023世界粮食日亮灯_浦西第一高楼会德丰
(原标题:上海浦西第一高楼为2023世界粮食日亮灯) 中国上海,2023年10月16日 – 杜塞尔多夫展览(上海)有限公司与联合国粮农组...
日期:10-16
上海科技大学 人工智能「上海科技大学推人脸模型HACK 可高质量生成3D人物模型」
内容概要:HACK 是一个新的参数化人脸模型,可以高质量生成人物头部的几何模型。HACK 解决了现有模型的问题,包括缺乏亚洲人数据、拓扑结构和表情变形体过于简化以及缺乏颈部运...
日期:08-10
YouTube 推出一系列新 AI 工具 包括Dream Screen、Aloud等
9月22日 消息:在 “Made On YouTube” 活动上,YouTube 宣布了一系列新的 AI 技术工具,旨在推动创造力的边界。这些新功能包括 AI 生成的背景、视频灵感洞察和视频制作辅助工具...
日期:09-22
国家规定2g退网「工信部明确:2G3G面临“退网” 也要保障用户权益」
工信部近期发出通知,计划逐步淘汰2G和3G网络,这一决定将给通信行业带来一场巨大的变革。2G和3G曾是移动通信技术的领先者,在过去的几十年里为人类社会的信息化进程做出了重要贡...
日期:12-05
李佳琦现身直播间辟谣双11后停播传闻 每年都会进行停播休息
李佳琦在双11大战结束后,终于现身公开场合,参加了上海“2023美one新址开幕庆典”,并亲自动手剪彩。第二天晚上,他又回到了直播间,继续为大家推荐好物。之前,因为花西子“79元眉笔...
日期:11-23
趣店目标从大学生转至宝妈,罗敏的预制菜背后仍涉金融借贷业务
作者/吕倩   在微博搜索“罗敏”,显示页面顶端仍是趣店创始人罗敏在微博投放的广告“趣店预制菜”。与之形成鲜明对比的是,广告下方即是冲上热搜的词条“罗敏到底得罪了多少...
日期:07-31
华为手机c8812_华为手机C8816D怎么刷机
华为手机c8812是一款于2012年推出的手机,是当时市场上一款非常受欢迎的手机。首先,华为c8812采用了高通MSM8625处理器,该处理器拥有双核心1.2 GHz的主频以及512MB的RAM。这个配...
日期:05-31
邮政管理部门加强寄递行业监管的对策建议「国家邮政局就规范快递市场秩序对五家企业开展集中行政指导」
10月12日 消息:据国家邮政局消息,10月11日,国家邮政局在江苏南京召开会议,就规范快递市场秩序,强化突出问题治理,对中通、圆通、韵达、申通、极兔等5家快递企业总部开展集中行政...
日期:10-12
四姑娘山越野赛摄影师死亡「两女子违规穿越景区:被终身禁入四姑娘山」
10月10日消息,据媒体报道,王某某、采某于2023年10月8日进入四姑娘山长坪沟景区后,无视标识标牌提示和工作人员的劝阻,在景区内开展徒步穿越活动。微软正式推出Windows 11系统后...
日期:10-11