您的位置:首页 > 互联网

上下文1.6万token的编程大模型来了!与Stable Diffusion出自同门,一次吃5个Python文件不费劲

发布时间:2023-08-09 14:05:49  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:西风 ,授权转载发布。

一个Stable Diffusion还不够!Stability AI再放杀手锏,进击代码生成领域:

推出了一款自称具有革命性的编码工具StableCode

敲重点的是,StableCode不仅支持Python、Go、Java、JavaScript、C、Markdown、C++等多种编程语言。

还直接把上下文长度拉到16000个token

图片

好家伙,网友直呼疯批:

图片

这波还直接戳中网友痛点:

我们真的很需要一个能够将整个代码库塞进上下文的工具。

移动无限流量校园卡

图片

上下文窗口16000token

官网显示,StableCode模型具有30亿参数,将提供基础模型、指令模型、长上下文窗口模型三种不同的模型,帮助开发人员编码。

图片

StableCode在HPC(高性能计算)集群上,使用5600亿代码token的编程语言数据集starcoder-data对基础模型进行了训练。

StarCoder是HuggingFace和ServiceNow合作成立的开放科学合作组织BigCode于五月份开源的针对代码的大模型。

Stability AI首席研究科学家Nathan Cooper对VentureBeat表示:

我们非常喜欢BigCode,因为他们在数据治理、模型治理和模型训练方面做了惊人的工作,我们用了他们的数据集,并对其进行了额外的过滤和清理,同时也用在了构建长上下文窗口的模型,在我们的集群上进行了训练。

对于复杂的编程任务,StableCode则针对特定用例进行了指令调优。

在基础模型的基础上,用约120000个Alpaca格式的“代码指令-回答”对训练了指令模型。

图片

StableCode指令生成对给定指令响应的代码。

此外,为了满足用户对上下文窗口长度的需求,StableCode的长上下文窗口模型直接将上下文窗口拉长至16000个token,是此前开源模型的2-4倍

图片

与类似大小的模型(3B)进行的 HumanEval 基准比较。

不仅为用户提供了可单行、多行自动完成建议的工具,还允许用户同时查看编辑相当于五个中等大小的Python文件,允许更专业复杂的代码生成prompt。

下面是一个StableCode利用Pytorch深度学习库完成一个相对复杂的Python文件展示(灰色文本显示了StableCode的预测)。

图片

小米智能耳机新品

华为mate50 pro防摔防窥手机壳

三星平板s7+充电

使用了RoPE的方法

此外,StableCode也是用到了Transformer架构,不同于StarCoder用ALiBi(线性偏差的注意力)的方法定位模型输出,StableCode则是使用了RoPE(旋转位置嵌入)的方法。

Cooper表示:

在Transformer模型中,ALiBi方法倾向于更加重视当前的token,而不是过去的token。这对于代码生成来说不是一个理想的方法,因为代码没有固定的叙述结构,没有明确的开始、中间和结束。代码的功能可以在应用流程的任何点被定义。所以我们使用RoPE,它没有这种偏见。

StableCode目前还处于早期阶段,初始发布的目标是观察开发者如何接受和使用这个模型。

我们将与社区进行互动合作,看看他们会提出哪些有趣的方向,并针对开发者领域进行生成式探索 。

研究主管Christian Laforte也浅聊了StableCode的目标:

与Stable Diffusion帮助世界上任何人成为艺术家类似,我们希望StableCode模型能让任何有好点子但却遇到问题的人,能够编写一个解决问题的程序。

看到Stability AI再放大招的这波操作,有网友在去测试Github Copilot的路上来了个掉头:

图片

还有网友希望“预定”下一次动作:

真的很想看Stability AI在文本转语音方面,做些类似谷歌SoundStorm(声音风暴)的事啊。

图片

此外,StableCode目前已经开源啦!

参考链接:

[1]https://venturebeat.com/programming-development/stability-ai-launches-stablecode-an-llm-for-code-generation/

[2]https://twitter.com/StabilityAI/status/1688931312122675200


返回网站首页

本文评论
多行业复苏趋势明显 《2023行业突围与复苏潜力报告》发布_各行业复苏
随着疫情防控机制优化调整,近期来自多方数据均显示,中国经济尤其是实体行业、线下消费已呈现出加速恢复的态势。1月10日发布的《2023行业突围与复苏潜力报告》(下简称报告)显示,2...
日期:01-11
商家狡辩没缺斤短两:0.35kg就是700g!网友都给整不会了_缺斤短两怎么赔偿消费者
2月22日,湖北武汉,一男子网上买菜时遇到了一个奇葩商家,因为千克、克的换算问题争论起来。双方的对话记录显示,男子收到买的菜后发现,净含量与商家标注的600克不符,用家里的称实测...
日期:02-25
刚刚 腾讯宣布大变革!互联网开启下一个时代!
今天,腾讯在20岁生日之际,宣布组织架构调整方案:既保持深耕垂直领域的优势和特点,保留原有的企业发......
日期:09-30
红魔推出新品魔灵电竞机械键盘 自研主控芯片1ms超低延迟「红魔键位」
7月3日 消息:红魔今日官宣了一款新品红魔魔灵电竞机械键盘,采用定制黑金轴体,具有8000万次按压寿命。ipad对大学生的意义巴菲特比亚迪股份比例据介绍,新款键盘采用100键紧凑设...
日期:07-03
新游近百万美金月流水,合成出海,「柠檬微趣」不再孤单
声明:本文来自于微信公众号 白鲸出海(ID:baijingapp),作者:孙惊雷,授权转载发布。自去年8月8日上线以来,「Gossip Harbor」收入稳中有升,根据点点数据统计2023年4月,该游戏双端流水...
日期:06-07
华为余承东:麒麟芯片成为绝唱「余承东“不讲武德”,麒麟9000+翻新机卖6199元,花粉: 后悔买晚了」
2020年10月,华为旗下新一代旗舰手机华为mate40pro发布,这款手机发布之初就受到广大用户的追捧,短短3个月销量就突破500万台,成为当年的爆款机型。赶集网是不是真的3年过去了,华为...
日期:07-03
苏宁易购:双11以来门店家电订单量环比增长146%「苏宁家电市场份额」
10 月 28 日消息,苏宁易购数据显示,自双 11 开启以来,全国门店客流环比增长185%,门店家电订单量环比增长146%,其中洗烘一体机、节能热水器等暖冬升级类家电增幅较大,环比超135%。...
日期:10-29
安卓机皇!三星Galaxy S23 Ultra限量版上市:9488元
快科技5月13日消息,据GSMArena报道,三星在越南推出Galaxy S23 Ultra限量版,该版本不是新配色,而是将智能手表、无线充电器和手机打包组成套装售卖,比消费者单买更便宜,总价是31990...
日期:05-14
李国庆谈海天事件:别丑化添加剂 海天产品没啥问题但公关太臭了
10月10日,李国庆发布视频表示,别把添加剂丑化了,添加剂过量当然有害,适量是可以接受的。李国庆指出,海天酱油这次公关太臭,但海天酱油依然值得信赖,毕竟是上市公司,造假成本很高,而且...
日期:10-11
AI前哨 | GPT-5什么时间上线?OpenAI CEO在中国会议上发言
凤凰网科技讯 《AI前哨》6月10日消息,在2023北京智源大会上,智源研究院理事长张宏江提问,会很快看到GPT-5吗?Sam Altman表示,我也很好奇,我们没有答案,我们不会很快有GPT-5,我们必须...
日期:06-10
湛庐·现实科幻系列第一季发布:周炜谈科幻对商业创新的推动
iphone7能用无线充电吗为什么要发展lte中国移动卖的苹果是合约机吗三星zflip3发售价极米投影仪双十一降价多少啊soul女的都比较作   8月10日(三),由湛庐举办的主题为“让科幻...
日期:08-12
山姆回应卖399元山寨迪奥产品:涉事商品已下架_山姆超市买到假货
9月30日 消息:近日,山姆会员商店上架的一款标注为“Dior”联名的儿童玩具被曝出是山寨产品。这款售价399元的玩具上标注着“Dior珠宝设计师”“Dior授权 山姆限定首发”的字...
日期:10-04
理想汽车3月交付「新势力第一家!理想汽车:12月交付量将超2万」
(原标题:新势力第一家!理想汽车:12月交付量将超2万) 鸣盏电热水杯第一家月交付量突破2万台的造车新势力即将诞生,它正是理想汽车!12...
日期:12-30
元宇宙招聘「元宇宙相关岗位平均月薪1.85万元 最高能拿4万」
  来源:快科技  元宇宙作为第三代互联网形态,其时空拓展、高度沉浸、感官延伸、人机融生等特点,让人心生向往。目前各大企业也纷纷布局元宇宙。  9月26日,智联招聘发布《2...
日期:09-29
每日优鲜订单存在风险被取消「每日优鲜浙江公司注销 原因为决议解散」
  企查查App显示,近日,浙江每日优鲜电子商务有限公司注销,注销原因为决议解散。企查查信息显示,该公司成立于2019年,法定代表人为张二迁,注册资本1000万元人民币,经营范围包含:食...
日期:09-29
刘骏正式加入人民搜索网络股份公司担任首席科学家
  近日,前谷歌中国工程研究院副院长刘骏正式加入人民搜索网络股份公司担任首席科学家,并将全面领导公司技术相关部门。同时,刘骏及其技术团队将与人民搜索合作开发新一代大...
日期:07-26
曝苹果iPhone 15仍采用高通基带 自研5G芯片要到2025年「苹果13是集成5g基带吗」
10月9日消息,今天有内部人士透露称,苹果iPhone 15仍采用高通基带,苹果的自研5G芯片要到2025年。所以高通仍将是所有iPhone 15和iPhone 16系列机型的调制解调器供应商。huawei m...
日期:10-13
新娘婚礼当天穿上奥特曼服装 新郎直呼非常懵:背后原因让网友羡慕
近日,郑州一对新人结婚上了热搜,原来是新娘穿了奥特曼的服装,这让新郎万万没想到。按照新郎郑先生的说法,婚礼的每个细小环节都是他和妻子精心策划的,当时结婚当天一进门看见一个...
日期:05-26
软硬件结合提供最优游戏体验 黑鲨4将与更多游戏厂商深度合作(黑鲨4系列软件系统)
  最近的手机市场可谓热闹非凡,伴随着高通新一代旗舰处理器骁龙888的问世,众多新机蓄势待发引起了不少用户的关注与讨论。强悍的性能一直都是游戏手机的标配,黑鲨作为游...
日期:09-10
特斯拉1月国内销量26843辆 出口39208辆「2017年特斯拉中国销量」
2月8日消息,乘联会数据显示,2023年1月特斯拉中国销量66,051辆,环比增长18%。其中,国内销量26,843辆,出口39,208辆。具体到车型,1月Model Y销量40,903辆,Model 3销量25,148辆。findx...
日期:02-09