您的位置:首页 > 互联网

普林斯顿首个开源AI程序员进场 基于GPT-4,可自动修复bug_普林斯顿仪器

发布时间:2024-04-03 18:35:28  来源:互联网     背景:

4月3日 消息:普林斯顿大学最近推出了一款名为SWE-agent的AI程序员,这是世界上首个开源的AI程序员,它基于GPT-4技术,能够在GitHub仓库中自动修复bug。这个智能体-计算机接口(ACI)的诞生,标志着AI在软件工程领域的应用迈出了重要一步。

SWE-agent在SWE-bench测试集上的表现令人瞩目,它成功解决了12.29%的问题,平均耗时仅为93秒,准确率与之前推出的AI程序员Devin相当。SWE-agent的开源性质意味着它在GitHub上迅速获得了1.6k星和109个Fork,显示出开源社区对这一技术的高度认可和兴趣。

普林斯顿创新测评

项目地址:https://github.com/princeton-nlp/SWE-agent

SWE-agent的工作原理是与专门的终端交互,它可以打开、滚动和搜索文件,编辑特定行并自动进行语法检查,编写和执行测试。这种设计类似于为人类设计的UI,能够阻止错误并提供反馈。例如,在处理一个矩阵操作bug时,SWE-agent能够重现问题、定位到问题代码、进行修改并成功解决问题。

普林斯顿大学的研究人员为SWE-agent设计了简洁的指令和反馈格式,使得模型能够更轻松地浏览代码仓库、查看、编辑和运行代码文件。SWE-agent的工作流程分为两个阶段:推理和评估。推理阶段,SWE-agent处理GitHub上的问题并生成修复方案;评估阶段,则确认方案是否真正解决了问题。

这项研究的核心作者John Yang和Carlos E. Jimenez,都是普林斯顿大学的研究助理和博士生,他们的研究兴趣集中在语言基础、交互、LLM的基准测试、软件工程和代码生成等领域。他们的工作展示了AI在软件工程领域的潜力,引发了关于AI与人类在工程过程中角色和能力的深层次思考。

抖音外卖功能什么时候上线

普林斯顿mfe

随着AI技术的发展,我们看到了AI在编程领域的进步,它们不仅能规划和执行复杂的工程任务,还能修复漏洞并负责整个项目的开发流程。然而,尽管AI在编写安全代码方面取得了进展,但人类的监督仍然至关重要。AI的兴起虽然还未能达到完全取代软件工程师的阶段,但它正在改变技术领域的面貌和未来的走向。

普林斯顿团队的这一开源AI程序员,不仅为软件工程领域带来了新的研究和应用前景,也为我们提供了一个关于人工智能与人类合作共创未来的思考机会。随着技术的不断进步,我们或许将见证AI在软件工程领域扮演更加重要的角色。

普林斯顿cs


返回网站首页

本文评论
元旦假期全国预计航班量将达到49000班_元旦飞机票涨价吗
记者从民航局了解到,元旦假期期间,全国预计航班量将达到49000班,较2023年同期增长约85.5%,日均约16300班。预计1月1日为假期单日航班量最高,预计达到16600班。iphone13换电池价格...
日期:12-29
vivo X100标准版参数曝光 内存影像全面升级_vivo x10多少钱
11月2日 消息:vivo于近日宣布,将于11月13日在北京发布X100系列新品。据博主@数码闲聊站爆料,vivo X100标准版将首发搭载联发科最新的旗舰处理芯片天玑9300,同时,vivo X100将升级...
日期:11-02
小米13 Ultra真机曝光:徕卡高管泄露_小米mlul13
小米13 Ultra将于4月18日19点正式发布。据报道,徕卡CEO Matthias Harsch一行昨日专程到访小米集团北京总部,为小米与徕卡全球影像战略合作开启全新阶段。b460是amd主板吗苹果1...
日期:04-14
深信服对外披露自研安全GPT技术应用「深信服入围gartner」
共享充电宝10块一小时关晓彤最新代言深信服科技董事长 何朝曦5月18日消息,深信服科技今日正式对外披露安全大模型技术应用。深信服安全大模型(安全GPT)为深信服自主研发,由“大...
日期:05-18
京东达达上市了吗「达达市值跌去50亿美元,京东系高管“救火”靠谱吗?」
查看最新行情   来源:36氪荣耀ceo赵明  作者/王晗玉  编辑 /潘心怡  从8月23日集团发布二季度财报后,至美国东部时间9月6日纳斯...
日期:09-10
谍踪Phone影 有关手机安全的那些事儿
iPhone牌跟踪器 用iPhone的朋友大概都听说了这件事儿,两名美国开发者最近爆出了iPhone跟踪并存储用户地理位置信息的新闻。简单点说,就是你带着 iPhone去了那儿,什么时候去的,...
日期:07-28
iphone换usb接口多少钱「历史性一刻!iPhone 15系列更换USB-C接口:lighting被抛弃」
快科技9月13日消息,之前的介绍,包括是外观展示,苹果都刻意避开了接口部分。现在,谜底终于揭晓iPhone 15更换USB-C接口。苹果表示,USB-C是公认的标准,不过具体的快充规格和传输速率...
日期:09-13
京东618开门红:全国92%区县消费者订单已送达「2021京东618开始时间」
6月1日 消息:京东618火热开启,截至6月1日开门红中午12点,全国92%的区县已收到京东快递小哥送货上门的商品。值得一提的是,今年京东物流扩增夜间生产能力,经过全国上千仓库的彻夜...
日期:06-01
山姆超市同款蛋糕杭州卖165上海卖95 网友以为全国价格一样
近日,有网友在社交平台上发帖“杭州的山姆超市卖的蛋糕怎么比上海的贵这么多”,内容为在山姆超市app内,一款名为“The Cheesecake Factory 美国进口原味干酪蛋糕1.7kg”在杭州...
日期:05-29
小米迷你主机降至 2599 元:i5 + 16G + 512G 配置_小米电脑用的什么主板
IT之家 9 月 30 日消息,小米迷你主机在去年 12 月发布,i5-1240P + 16G + 512G 配置首发价 3699 元。现在,小米迷你主机京东百亿补贴,售价降到了 2599 元。IT之家整理小米迷你主...
日期:10-01
近一年超1000万人网购装修工位 超100万人装修办公室「中国装修工人数量」
过去一年中,超过1000万人在网上购买了装修工位,其中超过100万人是为了装修办公室而购买的。这表明装修工位市场需求巨大,同时也反映出人们对美好生活的追求和对办公环境的关注...
日期:03-24
魅族 Flyme 9 图库新增“机型水印自适应”功能,正逐步全量推送_魅族内测水印
  7 月 12 日消息 魅族 Flyme 今日宣布,Flyme 9 图库 App 新增“机型水印自适应”功能,用户可自定义机型水印开关,让摄影乐趣尽情释放。   具体设置路径为:图库-编辑-机型...
日期:05-12
llm jm「LLM是世界模型的新证据?ChatGPT能理解WiFi等物理信号,并猜出你的位置」
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。大语言模型是否是世界模型?大语言模型除了在数字世界完成如写作或翻译等任务,它们能否理...
日期:02-13
云视频前景「IDC:2022下半年中国视频云市场规模达到49.8亿美元」
4月24日 消息:据国际数据公司(IDC)公布的数据显示,2022下半年中国视频云市场规模达到49.8亿美元,与去年同期维持在同一水平,其中视频云基础设施与解决方案市场进一步分化,相比2021...
日期:04-24
OpenHarmony3.2 Release版本发布 社区累计代码量超1亿行_openharmony2.0
4月19日消息,开放原子开源基金会OpenHarmony开发者大会2023举办。在此次大会上,OpenHarmony 3.2 Release版本正式发布。OpenHarmony项目群工作委员会主席候培新介绍道,截至目前...
日期:04-19
美国要求芯片大厂交出「AI前哨|传美国欲收紧对华AI芯片出口 英伟达:后果很严重」
英伟达CFO克雷斯凤凰网科技讯《AI前哨》北京时间6月29日消息,有消息称,美国正在考虑进一步收紧对中国的人工智能(AI)芯片出口管制。对此,美国主要AI芯片供应商英伟达CFO克莱特...
日期:06-29
Evisort成功开发法律合同领域的大型语言模型(LLM)
10月11日 消息:Evisort成功开发了专门用于法律协议的大型语言模型(LLM),并将其作为其新的多方位生成AI引擎的关键组成部分。该LLM将使Evisort能够提供比通用的第三方LLMs更准确...
日期:10-11
巴菲特净赚117亿美元「巴菲特再捐7.58亿美元  累计已捐赠460亿美元」
11月24日 消息:一份监管文件显示,巴菲特于当地时间11月23日额外又捐赠了240万股伯克希尔哈撒韦B类股票,按收盘价计算价值约7.58亿美元。其中,巴菲特向苏珊·汤普森·巴菲特基金...
日期:11-25
153亿晶体管「920亿!晶体管数量是国产5G芯片的6倍,苹果遥遥领先」
苹果发布了全新的M3处理器,晶体管数量达到920亿,性能提升五成,再次成为ARM阵营性能最强的处理器。苹果这次推出的M3处理器采用了台积电的3纳米工艺,先进工艺进一步提升了处理器...
日期:11-01
发黑床单、盗版影片、摄像头偷窥无遮拦:这样的私人影院难持久
只需一套投影设备、一组氛围灯、一张床,消费者就能享受自在的观影乐趣。如今,凭借可提供更为私密、更多选择的观影体验的优势,私人影院在各地蓬勃发展。然而,记者调查发现,生机盎...
日期:08-16