您的位置:首页 > 互联网

伯克利分校推开放大模型Starling-7B 接受人工智能反馈训练_伯克利llm professional track

发布时间:2023-11-29 21:10:58  来源:互联网     背景:

要点:

  • 由加州大学伯克利分校研究人员推出的Starling-7B是一款基于Reinforcement Learning from AI Feedback(RLAIF)的开放式大型语言模型(LLM),采用人工智能反馈来提升其性能,特别是在聊天机器人响应方面。

  • RLAIF采用来自其他人工智能模型的反馈进行训练,以改进模型的性能。相比于以往的人工反馈,AI反馈具有更低的成本、更快的速度、更透明和更可扩展的潜力。Starling-7B通过RLAIF在性能上取得了显著的改进。

  • Starling-7B在两个基准测试中(MT-Bench和AlpacaEval)表现优异,尤其在安全性和帮助性方面。研究人员指出,虽然RLAIF主要提高了模型的帮助性和安全性,但在基本能力方面,如回答基于知识的问题、数学或编码,改进不大。未来的研究方向可能包括引入高质量的人工反馈数据,以更好地适应模型对人类需求的理解。

伯克利 data science

伯克利 data science

11月29日 消息:加州大学伯克利分校的研究人员推出了一款名为Starling-7B的开放式大型语言模型(LLM),采用了一种称为Reinforcement Learning from AI Feedback(RLAIF)的创新训练方法。

RLAIF的独特之处在于利用其他人工智能模型的反馈来提升性能,相较于传统的人工反馈,这种方法更具有成本效益、速度快、透明度高、可扩展性强的优势。Starling-7B基于新的Nectar数据集进行训练,包含183,000个聊天提示和380万个成对比较。

lg显示器freesync扩展

研究人员使用两个基准测试(MT-Bench和AlpacaEval)评估了Starling-7B的性能,这两个测试使用GPT-4进行评分,分别关注模型在简单指令跟随任务中的安全性和帮助性。Starling-7B在MT-Bench中表现良好,与OpenAI的GPT-4和GPT-4Turbo相媲美,在AlpacaEval中达到了与商业聊天机器人相当的水平。

研究人员指出,RLAIF主要改善了模型的帮助性和安全性,而在基本能力方面,如回答基于知识的问题、数学或编码等,改进较小。

尽管基准测试的实际应用有限,但对RLAIF的应用前景充满希望。研究人员建议的下一步是通过引入高质量的人工反馈数据,更好地调整模型以满足人类需求。

与此同时,研究人员强调,Starling-7B和其他类似的大型语言模型在需要推理或数学任务时仍然存在困难,并可能产生幻觉。他们将Nectar数据集、Starling-RM-7B-alpha奖励模型和Starling-LM-7B-alpha语言模型发布在Hugging Face上,并提供了研究许可证,代码和论文将很快公开。感兴趣的人还可以在聊天机器人领域测试该模型。

特斯拉 胜诉


返回网站首页

本文评论
共话机遇与挑战——以数字化转型赋能教育高质量发展
通信世界网消息(CWW)9月1日,以“科技创新助力教育数字化转型”为主题的研讨会于北京举行。正值开学季,来自政府、社会、教育行业和科技企业的代表齐聚一堂,碰撞思想,共同探讨教育...
日期:09-01
每一个风口出现,出书的都跑在最前面,还是同一拨人
声明:本文来自微信公众号“三言财经”(ID:sycaijing),作者:三言,授权转载发布。自ChatGPT横空出世以来,AIGC无疑科技圈儿最火的话题之一。国内外的科技公司纷纷宣布入局,谷歌的Bard...
日期:04-19
京东回应出版社封杀事件  称优惠属正常经营_京东评价封禁
一边与当当、卓越等竞争对手在图书领域大打价格战,另一边又和出版社闹得不可开交,京东商城被称为图书业的“搅局者”一点也不为过。 昨日,京东商城公开回应了关于24家少儿出...
日期:07-28
谷歌ai作画「Midjourney等也将跟进 谷歌为AI生成图片内嵌水印」
5月12日消息,谷歌在2023年的开发者大会上表示,将确保公司的每一张AI生成图片都内嵌水印,该水印无法以肉眼识别,但谷歌搜索引擎等软件可读取并以标签显示出来,以提示用户该图片由A...
日期:09-29
马斯克回应「火药味渐浓:马斯克将接受Twitter律师询问,他是否会出言不逊?」
  讯 北京时间9月27日早间消息,据报道,本周,Twitter律师将会对亿万富豪埃隆·马斯克(Elon Musk)进行询问,了解他为何在7月突然宣布放弃对Twitter440亿美元的收购。  Twitter的...
日期:09-30
苹果iOS CoreTrust漏洞被修复 巨魔商店:TrollStore要凉凉
近日,巨魔商店在其公众号中宣布,其开发人员在iOS系统中发现了一个新的CoreTrust漏洞。这个漏洞可能会利用未来升级中的iOS 15.5-16.6和17.0版本,但是这个漏洞已经被修复,因此后...
日期:10-07
《阿凡达2》宣布3月28日上线数字平台:收录3小时额外内容「阿凡达2什么内容」
20世纪影业宣布,《阿凡达:水之道》(《阿凡达2》)将于3月28日在数字平台上线。生化8怎么打中文补丁电影将以4K超高清+杜比全景声形式登陆Prime Video、Apple TV、Vudu、Movies An...
日期:03-08
揭秘17位华人巨富的第一桶金 他们是如何致富(华人第一富豪)
  很多成功创业者掘到“第一桶金”的爆发点,与后来真正做大的主业并不一致。   人们大多喜欢津津乐道于成功者的传奇故事,并将其中的种种艰辛视为“调味品”——能更进一...
日期:07-30
获中国电信“生态合作卓越奖”:真我realme亮相2023数字科技生态大会
获中国电信“生态合作卓越奖”:真我realme亮相2023数字科技生态大会 通信产业网|2023-11-10 11:05:56作者:通文来源:通信产业网11月10日,2023数字科技生态大会在广州市广交会展...
日期:11-13
Android 版的 Edge 浏览器开始为新 Edge 浏览器做同步准备_edge正在设置同步
  基于 Chromium 的 Microsoft Edge 浏览器将在 2020 年 1 月 15 日正式发布,因此微软应用也在为切换进行准备工作。其中 Android 版的 Edge 浏览器已经在同步设置中加入...
日期:12-22
阅文集团上半年营收40.9亿元 净利6.7亿元基本持平(阅文集团财报)
影响团购的因素 查看最新行情   讯 8月15日下午消息,阅文集团今日发布截至6月30日的2022年上半年财务报告。财报显示,2022年上半年,阅文集团营收为40.9亿...
日期:08-16
360安全卫士 网盾_360安全卫士强行卸载金山网盾事件始末
  背景:   1、金山网盾是金山安全软件有限公司于2009年2月推出的浏览器保护软件,用户可以使   用金山网盾进行默认浏览器锁定、IE首页锁定等操作,防止浏览器和IE首页被...
日期:07-26
GPT-5 短期内不会问世,AI的安全问题仍被放大
声明:本文来自微信公众号“CSDN”(ID:CSDNnews),作者:陈静琳,授权转载发布。【CSDN编者按】一封要求暂停AI的公开信引发热议,随之而来的是GPT-5被抵制。在麻省理工学院的活动中,Ope...
日期:04-19
拼多多申请“拼甄选”等商标「拼多多申请多多拼菜商标」
10月12日 消息:企查查APP显示,近日,拼多多关联公司上海寻梦信息技术有限公司申请注册多个“拼甄选”“拼臻选”“多多小圈”“井下圈”商标,国际分类为设计研究、社会法律等,当...
日期:10-21
齐家滨率全市领导观摩腾渊达项目建设基地
  根据省委、省政府实施新旧动能转换、推进高质量发展,“双招双引”“担当作为”“狠抓落实”“七赛七比”等系列活动部署要求,11月29日上午,市委书记齐家滨、市委副书记 市...
日期:09-06
企鹅FM将于9月6日停止运营 即日起关闭用户注册及充值功能_企鹅fm付费一次是永久免费吗
7月7日 消息:腾讯旗下的音频平台企鹅FM发布了停运公告,由于业务调整的原因,企鹅FM即日起将关闭用户注册和充值功能,并将于2023年9月6日0时正式停止运营。数据显示,企鹅FM是腾讯...
日期:07-07
2023年淘宝天猫京东双11红包领取第2波京东天猫双十一活动时间什么时候开始到几号结束?
本文为大家提供众多福利:2023 年淘宝/天猫双十一红包第 2 波活动时间与领取入口最高 23888 超级红包及跨店满减规则;2023 年京东双十一红包第 2 波活动时间与领取入口最高 111...
日期:11-03
无人驾驶公司Oxa融资1.4亿美元 希望利用AI改善通勤体验
文章概要:1. Oxa是无人驾驶领域的初创公司,完成了1.4亿美元C轮融资2. 它与Beep合作,在佛罗里达推出自动驾驶班车3. Oxa认为自动驾驶单人轿车难以改善拥堵状况9月4日 消息:无人...
日期:09-04
谷歌云游戏平台Stadia将关闭,底层技术或聚焦toB业务_谷歌stadia云游戏官网版
  21世纪经济报道记者 蔡姝越 上海报道  云游戏平台龙头Stadia,在屡次运营试错无果后走向了关停的结局。  9月29日,谷歌宣布将于2023年1月18日关闭Stadia服务器。在此之...
日期:09-30
mate20pro戴口罩「华为Mate 50 Pro喜迎新功能:终于支持戴口罩识别」
如今,出门戴口罩已经成为常态,很多小伙伴都在期待手机支持支持戴口罩识别。近日,数码博主@曦夕Katarina 透露称,华为Mate50 Pro的全新鸿蒙HarmonyOS 3.0.0.150版本,有望支持戴口...
日期:10-05