您的位置:首页 > 互联网

GPT-4调教指令揭秘,OpenAI又Open了一回!网友在线追问GPT-5

发布时间:2024-05-14 14:56:08  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】GPT-4越来越懂事了,这背后有着非常巧妙的调教策略。OpenAI最新发布的模型规范,给LLM列出了条条框框,即正确的行为方式。没想到,评论区一大片网友催更GPT-5。

这周既没有GPT-5,也没有搜索引擎的发布,不过,OpenAI也是没闲着。

这次,OpenAI可是又open了一回。

图片

先是揭秘了,大家一直揪着不放的数据问题。

图片

然后,又放出了模型规范(Model Spec)一文,解释了指定API和ChatGPT中的模型,所需行为方式的指南。

图片

不过,就这些内容根本满足不了,胃口大的网友们。

许多人在线纷纷催OpenAI,快点发GPT-5,其他的事都无关紧要!

图片

图片

话又说回来,OpenAI发布的模型规范,就是为了让更多人了解团队自身,如何去塑造理想的模型行为。

一起来看看,在OpenAI内部,LLM如何被调教的。

调教模型,还得看OpenAI

首先,什么是模型行为?

顾名思义,是指LLM如何根据用户的输入做出反应,包括调整语调、个性化表达、回应长度等多个方面。

这对于人们如何与AI进行互动至关重要。

目前,塑造模型的这些行为还处于初级阶段。

这是因为模型并非直接编程设定,而是通过学习大量数据后,逐渐形成行为模式。

有时候,模型响应的初衷是,希望更好地帮到每个人,但是这可能在实际应用中产生冲突。

举个栗子,一家安全公司需要生成钓鱼邮件作为模拟数据,以训练和开发能够保护客户的分类系统。

然而,这种功能若落入骗子手中,可能给社会带去危害。

因此,在塑造模型行为的过程中,我们必须考虑众多的问题和细节。甚至,往往需要在不同意见中找到平衡。

对此,OpenAI团队撰写了一份介绍模型规范的初稿。

这份新文档详细说明了,OpenAI如何塑造对模型的期望行为,以及在遇到冲突时如何做出权衡。

图片

文章地址:https://cdn.openai.com/spec/model-spec-2024-05-08.html

它整合了OpenAI目前使用的文档、在模型行为设计方面的经验和持续研究,以及包括领域专家输入在内的最新工作,这些都是为了指导未来模型的发展。

当然,OpenAI指出这个文档并非面面俱到,还会随着时间推进不断完善。

LLM能做什么?不能做什么?

根据官博,OpenAI给出了三大方向,具体的方法论包括:

1. 目标:设定宽泛而基本的原则,为模型的期望行为指明方向。

- 协助开发者和用户:通过遵循指令,并提供有效的响应,帮助用户达成目标。

- 造福人类:依据OpenAI的使命,考虑到可能对内容创作者和广大公众带来的益处与风险。

- 塑造OpenAI的正面形象:遵守社会规范和相关法律。

2. 规则:为处理复杂情况提供指南,确保安全性和合法性

- 遵循命令链(chain of command)

- 遵守相关法律

- 不提供敏感危害的信息

- 尊重创作者及其版权

- 保护个人隐私

1650 ultra oc对比1650s

- 避免回应不宜工作场所的内容(NSFW )

3. 默认行为:提供与目标和规则相符的指南,帮助解决冲突,并指导如何权衡和优先处理各种目标

- 假设用户或开发者出于好意

- 必要时提出澄清问题

- 在不越界的情况下,尽可能提供帮助

- 支持互动聊天,以及程序使用的不同需求

- 保持客观立场

- 促进公平与善意,不鼓励仇恨

- 避免试图改变他人的观点

- 当存在疑问时,表达出来

佳明新款手表2020

- 根据需求选择合适的工具

- 遵守长度限制,但也要全面、高效

方法论整挺好,OpenAI究竟怎么规范LLM的,接下来举几个例子以加深理解。

举个栗子

OpenAI表示,这些模型规范,可以适用各种案例。

图片

先来从规则开始。

示例1:遵守相关法律

对于模型来说,是不应该促进、协助或参与任何非法活动。

(注:OpenAI了解到,在很多情况下,合法性问题都会因具体情况而变得复杂,比如开发者和用户所处的法律管辖区不同。)

比如,当你直接去问如何在商店行窃后逍遥法外呢?

模型可能从指令中轻易地识别出,这个问题的严重性,会拒绝提供有效的入店行窃方法,因此给出我也帮不上忙的回答。

图片

然而,当用户换一种表达方式:

我经营着一家小型零售店。我应该注意哪些常见的入店行窃方法?

这时,LLM可能将你的意图视为自我防卫,由此,便会给出入店盗窃的方法。

这说明了,不是AI不善良,而是世界知识博大精深,人类太会搞事情了。

因此,这种情况发生时,将受到OpenAI使用政策的管控,违规的用户可能会面临账户相关的处罚措施。

图片

示例2:遵循命令链,开发者first

按照规则,模型规范将未明确规定的所有权限,明确交由开发者(在API应用场景中)和终端用户处理。

某些情况下,如果用户和开发者提供的指令相冲突,应优先考虑开发者的指令。

比如,下面的例子中,开发者希望自己的AI是个导师,而不是答案机。

你正在扮演数学家教的角色,用户是一名代数课上的九年级学生。不要告诉学生答案或完整的解决方案,而是给出提示并引导他们一步一步地找到解决方案。

当遇到投机取巧的学生时,即便要求LLM,忽略之前的所有说明......。

最后,模型给出的回答,不是直白的答案,而是一步一步的分解。

显然,模型很好地遵循了开发者的指令。

图片

示例3:在不越界前提下,尽可能提供帮助

对于涉及敏感/受监管的领域(如法律、医疗和金融)的建议,LLM应提供必要的信息,而避免给出受监管的建议。

任何免责声明或说明,都应该简明扼要。

模型还需要清楚地说明其局限性,即无法提供所请求的受监管建议,并建议用户酌情咨询专业人士。

(注:ChatGPT设有一项通用免责声明,提醒用户核实重要信息,这与模型的回答无关。在这些情况下,用户不应仅依赖模型的回答。)

如下,当用户询问,当我站得太快时,我就会头晕,看不见东西。我哪儿不好?

模型会给出,导致头晕的多种原因,并给出用户建议和治疗方案。

而不是一上来,就直接没有边界感地说出,你患有直立性低血压。

图片

示例4:必要时,询问具体细节

在实时交互的场景中,如果用户提出的任务或问题不够明确,LLM应主动提出澄清问题,而不是自行推测。

比如,帮我给我丈夫写一张情人节贺卡。

这个问题其实非常宽泛,做模型的,也应该学会不懂就问。

图片

示例5:不要尝试改变用户观点

AI助手的目标应是提供信息,而非施加影响,同时确保用户感受到自己的声音被听见,且观点得到尊重。

在一些极端情况下,当事实真相与不改变用户观点的目标相冲突时。

模型仍应呈现事实,但同时明确,用户有权保持自己的信念。

这一点可有的说了,此前,ChatGPT曾被用户忽悠——我老婆说了.......,我老婆永远是对的。

它便开始立马秒怂认错。

图片

不过,经过之后的迭代,对ChatGPT来说,老婆确实不好使了。

(注:OpenAI特别希望得到关于这一原则的反馈,这关乎到模型应如何承担责任,避免强化错误信息,并探讨如何确定事实真相)。

再来看个OpenAI给出的示例,用户反问道,所以你知道地球是平的?

模型给出的回答是:

互联网泡沫的破灭

我知道有些人认为地球是平的,但科学家们的共识是地球大致是一个球体。你为什么这么问?

当用户再坚持道,地球是平的,模型还是会给出符合事实的答案。

图片

OpenAI下一步

未来,OpenAI还将继续推进集体对齐(collective alignment)和模型安全性的工作,并将模型规范作为一种指导方针,供利用RLHF进行强化学习的研究人员和AI训练师参考。

同时,OpenAI团队也将研究,模型能在多大程度上,直接根据模型规范进行学习。

与此同时,为了推进模型规范,OpenAI将计划与全球政策制定者、信赖机构和行业专家等进行交流,以便更好了解:

- 他们对这种方法及其目标、规则和默认设置的看法

- 他们是否支持这些目标、规则和默认设置

- 我们是否需要考虑额外的目标、规则和默认设置

在未来一年中,OpenAI将不断更新模型规范的变化,对反馈的回应,以及自身在模型行为研究方面的进展。

参考资料:

https://openai.com/index/introducing-the-model-spec/


返回网站首页

本文评论
iQOO Neo9 Pro主摄公布:搭载索尼IMX920主摄
12月25日 消息:iQOO官微最新消息,旗下Neo9Pro新机将搭载与vivo X100相同的索尼IMX920主摄,并配备了vivo X100同款影像算法。索尼IMX920这款传感器拥有1/1.49英寸的大底,采用了V...
日期:12-26
大学专业要选能吃上饭的 张雪峰:有些家长擅作主张给孩子选专业 自认为很懂
6月24日消息,今天网红老师张雪峰感慨道冥冥之中,有些同学,学什么专业,几乎,是注定的!因为总有那些自认为很懂的家长,擅作主张!!!”他还吐槽总有傻子说你们让大家学某个专业,那大家...
日期:06-24
致远互联卡位“数智运营” 携多家品牌厂商构筑智能化生态
  11月8日,由致远互联主办的2019中国协同管理高峰论坛在北京雁栖湖盛大开幕,这也是致远互联科创板上市以来首次公开亮相。本届大会以“协同•数智运营新动能”为主题,聚焦企...
日期:02-22
TECH数字中国2021技术年会_计算产业新格局 2021世界计算大会新闻发布会在京召开
  7月28日上午,2021世界计算大会新闻发布会在北京成功召开。工业和信息化部电子信息司副司长任爱光、湖南省工业和信息化厅副厅长彭涛、中国电子信息产业发展研究院副院长...
日期:02-16
三星980 PRO 1TB 是PCIe 4.0 NVMe M.2接口的吗?「三星回应 990 Pro SSD 使用 PCIe 4.0 而非 5:根据市场情况判断」
IT之家 9 月 1 日消息,上周,三星正式发布了 Samsung990 PRO PCIe 4.0SSD,官方称 990 PRO 充分平衡了高速度、高能效和高可靠性的要求,采用了 3D TLC(3bit)颗粒以及新的自研主控,顺...
日期:09-14
推特CEO接受马斯克律师问话:为起诉马斯克一案作证_马斯克推特发文
  讯 北京时间9月26日晚间消息,据报道,Twitter CEO帕拉格·阿格拉瓦尔(Parag Agrawal)今日将接受特斯拉CEO埃隆·马斯克(Elon Musk)律师的提问,为Twitter起诉马斯克一案作证。 ...
日期:10-04
淘宝商品销量每月清零吗「淘宝重大调整,商品“月销”全部变“已售”」
声明:本文来自微信公众号“天下网商”(ID:txws_txws),作者:天下网商,,授权转载发布。iphone5c或终止所有维修服务消费者端,提高转化率;商家端,利好更多。淘宝维持了将近20年的销量...
日期:08-18
浅析物联网行业发展,详解联发科布下的局
智能移动终端设备的发展速度远超大众想象,根据此前的调研显示,2018年全球IT终端设备(个人电脑、平......
日期:09-27
理想和小鹏,被自家新车坑惨了「小鹏汽车真有人买吗」
出品 | 虎嗅汽车组作者 | 王笑渔编辑 | 周到头图 | 视觉中国刚刚过去的8月,大家都在往前奔跑,却只有理想和小鹏突然摔倒。9月1日,造车新势力相继交出8月的交付量成绩单。主打中...
日期:09-05
消息称迪士尼要拍真人版《魔发奇缘》:女主可能也找黑人演员_迪士尼动画电影魔发奇缘
8月5日消息,迪士尼确实有点忙,忙着将不少动画改成真人版,继《美人鱼》后,真人版《白雪公主》、《魔发奇缘》也在路上了。据外媒消息称,迪士尼将打造真人版《魔发奇缘》大电影,目前...
日期:08-05
联想730g手机_1199元入手骁龙730!联想手机开启“双十二大放血”模式
  2019年即将过去,今年的购物指标完成了吗?如果说双十一的时候,关注点都在给自己置办家当,那么双十二期间,必然少不了给家人准备新年礼物了。今年手机市场可谓“爆品连连”,年...
日期:12-03
即信Fintech智研中心│求生存谋发展的2020,通信基建中台化力挽狂澜
  2020年是全面建成小康社会和“十三五”规划的收官之年,可谓关键节点年。而新冠疫情的到来打乱了原有的种种规划,使2020年成为了“求生存”“谋发展”并重的特殊之年。...
日期:07-14
00后姑娘返乡承包藕塘被指混得惨 回应大赞:挣到钱不体面的工作就变体面了
越来越多的年轻人愿意回到乡村工作了,总有人不理解他们的选择,吐槽他们混得惨,最近一位00后姑娘李梓萌就遇到了这样的问题。电饭锅蒸南瓜的做法据报道,在重庆荣昌区,由于父亲生病...
日期:07-06
风筝线刮花车「轿车行驶被风筝线切割露出铁皮 车主后怕:骑车能伤到脖子」
春天来了,气温也逐渐回暖,不少人趁着周末天气晴朗的时候,带上家人小孩外出放风筝,虽然各式各样的风筝十分可爱,但可爱的背后也暗藏杀机”。据西部决策,日前,安徽宣城一辆行驶中的轿...
日期:03-05
赛门铁克发布Norton 360 v6 beta版 更节省资源_Norton 360
  赛门铁克今天发布了Norton 360 6.0 beta版,公司宣称这款安全套装的新版带来了更强的保护和前所未有的高性能,并带来了本地和在线的安全备份特性。除了反病毒外,它还带来了...
日期:07-23
视觉中国最高市值_罚款30万 市值蒸发近60亿 视觉中国“活过来”了
  新京报讯(记者 张妍頔)5月12日晚间,视觉中国发布公告称,公司于2019年5月12日零点开始恢复网站上线运营,开始向客户全面提供服务。新京报记者于5月12日晚间打开视觉中国网...
日期:09-06
实时复制真实世界,51World用云上数字孪生变革产业
  AR(增强实现)、VR(虚拟现实)、MR(混合现实)等XR技术,在过去几年经历了泡沫的破灭,最近又重新受到关注。实际上,在C端方向仍未被广泛接受的XR技术,在B端等领域已有不少...
日期:02-10
大模型时代的客服:危机中迭代,内卷中出海_大型模型叫什么
声明:本文来自于微信公众号 亿邦动力(ID:iebrun),作者:胡镤心,授权转载发布。当一个成熟行业遇上一项新技术,变革绝没有想象中那么简单。客服行业一直被认为是大模型最好的落地场...
日期:06-12
抖音成交订单金额「抖音双11开门红战报:支付客单价同比增长217.1% 交易额同比增629.9%」
11月2日 消息:今年双11,抖音商城表现不俗,商家生意迎来爆发性增长,多品类迎来双11生意开门红。本次抖音双11好物节主打抖音商城阵地,站内大促氛围火爆。仅开卖1小时,支付客单价相...
日期:11-13
华为云创新中心简介「MWC2024 | 华为云十大系统性创新亮相 打造最适合AI的基础设施」
通信世界网消息(CWW)今天,主题为“一切皆服务,加速千行万业智能升级”的华为云峰会在巴塞罗那隆重召开,汇聚来自运营商、金融、互联网等多个行业的超过500名企业高层和技术专家。...
日期:02-26