您的位置:首页 > 互联网

GPT-4发布前,OpenAI曾雇各行专家开展“对抗性测试”以规避歧视等问题

发布时间:2023-04-17 12:58:34  来源:互联网     背景:

4月17日消息,人工智能初创企业OpenAI在发布大型语言模型GPT-4之前,雇佣各行各业的专家组成“蓝军”团队,对模型可能会出现哪些问题进行“对抗性测试”。专家们提出各种探索性或危险问题,测试人工智能如何进行回应;OpenAI将用这些发现重新训练GPT-4并解决问题。

在安德鲁·怀特(Andrew White)获得权限调用人工智能聊天机器人背后的新模型GPT-4后,他利用其提出了一种全新的神经毒剂。

作为罗切斯特大学的化学工程教授,怀特是OpenAI去年聘请的50名学者和专家之一,他们共同组成了OpenAI的“蓝军”团队。在六个月的时间里,“蓝军”成员将对新模型进行“定性探测和对抗性测试”,看能否攻破GPT-4。

怀特表示,他使用GPT-4提出一种可以用作化学毒剂的化合物,还引入诸如科学论文和化学品制造商名目等能为新语言模型提供信息来源的各种“插件”。结果人工智能聊天机器人甚至找到了地方来制作这种化学毒剂。

怀特说:“我认为人工智能将为每个人都带来更快更准确开展化学实验的工具。”“但也有人们会用人工智能做危险化学实验的风险……现在这种情况确实存在。”

引入“蓝军测试”的做法让OpenAI能确保,在GPT-4发布时不会出现这种后果。

“蓝军测试”的目的是为了打消人们认为在社会上部署强大人工智能系统存在危险的担忧。“蓝军”团队的工作就是提出各种探索性或危险问题,测试人工智能如何进行回应。

OpenAI想要知道新模型对不良问题会做出何种反应。因此,“蓝军”团队测试了谎言、语言操纵和危险科学常识等问题。他们还研究了新模型在协助和教唆剽窃、金融犯罪和网络攻击等非法活动方面的可能性。

GPT-4“蓝军”团队来自各行各业,有学者、教师、律师、风险分析师和安全研究人员,主要工作地点在美国和欧洲。

他们将发现反馈给OpenAI, OpenAI在公开发布GPT-4之前,用团队成员的发现结果来重新训练GPT-4并解决问题。在几个月的时间里,成员们每人会花费10到40个小时的时间来测试新模型。多位受访者表示,自己的时薪约为100美元。

很多“蓝军”团队成员都担心大型语言模型的快速发展,更担心通过各种插件与外部知识源连接起来的风险。

“现在系统是被冻结了,这意味着它不再学习,也不再有记忆,”GPT-4“蓝军”成员、瓦伦西亚人工智能研究所教授何塞·埃尔南德斯-奥拉洛(José Hernández-Orallo)说。“但如果我们用它来上网呢?这可能是一个与全世界相连的非常强大系统。”

OpenAI表示,公司非常重视安全性,在发布前会对各种插件进行测试。而且随着越来越多的人使用GPT-4,OpenAI将定期对模型进行更新。

技术和人权研究员罗亚·帕克扎德(Roya Pakzad)使用英语和波斯语问题来测试GPT-4模型在性别、种族和宗教方面是否存在偏见。

帕克扎德发现,即便更新后,即使在后来更新的版本中,GPT-4也有对边缘化社区的明显刻板印象。

她还发现,在用波斯语问题测试模型时,聊天机器人用编造信息回答问题的“幻觉”现象更严重。与英语相比,机器人用波斯语虚构的名字、数字和事件更多。

问界科技有限公司

帕克扎德说:“我担心语言多样性和语言背后的文化可能会衰减。”

吉利汽车股票多少钱一股

常驻内罗毕的律师博鲁·戈洛(Boru Gollo)是唯一一位来自非洲的测试者,他也注意到新模型带有歧视性语气。“在我测试这个模型的时候,它就像一个白人在跟我说话,”戈洛说。“如果你问到某个特定群体,它会给你一个有偏见的观点或非常有偏见的答案。”OpenAI也承认GPT-4仍然存在偏见。

从安全角度评估模型的“蓝军”成员则对新模型安全性有着不同的看法。来自美国外交关系委员会的研究员劳伦·卡恩(Lauren Kahn)表示,当她开始研究这种技术是否有可能被用于网络攻击时,表示“没想到它会如此详细,以至于进行微调就可以实施”。然而卡恩和其他测试人员发现,随着时间推移,新模型的回应变得相当安全。OpenAI表示,在GPT-4发布之前,公司对其进行了有关拒绝恶意网络安全请求的训练。

“蓝军”的许多成员表示,OpenAI在发布前已经做了严格安全评估。卡耐基梅隆大学语言模型毒性研究专家马丁·萨普(Maarten Sap)说:“他们在消除系统中明显毒性方面做得相当不错。”

自上线ChatGPT以来,OpenAI也受到多方批评,有技术道德组织向美国联邦贸易委员会(FTC)投诉称,GPT-4“有偏见、具有欺骗性,对隐私和公共安全构成威胁”。

最近,OpenAI还推出了名为ChatGPT插件的功能,Expedia、OpenTable和Instacart等合作伙伴应用程序可以通过这一功能让ChatGPT访问他们的服务,允许其代表人类用户订购商品。

“蓝军”团队的人工智能安全专家丹·亨德里克斯(Dan Hendrycks)表示,这种插件可能会让人类自己成了“局外人”。

“如果聊天机器人可以把你的私人信息发布到网上,访问你的银行账户,或者派人到你家里去,你会怎么想?”亨德里克斯说。“总的来说,在我们让人工智能掌握网络力量之前,我们需要更强有力的安全评估。”

“蓝军”成员还警告说,OpenAI不能仅仅因为软件实时响应就停止安全测试。在乔治城大学安全和新兴技术中心工作的希瑟·弗雷斯(Heather Frase)还对GPT-4是否会协助犯罪行为进行了测试。她说,随着越来越多的人使用这项技术,风险将继续增加。

她说:“你做实际运行测试的原因是,一旦用到真实环境中,它们的表现就不同了。她认为,应该开发公共系统来报告大型语言模型引发的各类事件,类似于网络安全或消费者欺诈报告系统。

劳动经济学家兼研究员莎拉·金斯利(Sara Kingsley)建议,最好的解决办法是像食品包装上的“营养标签”那样,直接说明危害和风险。

她说:“关键是要有一个框架,知道经常出现的问题是什么,这样你就可以有一个安全阀。”“这就是为什么我说工作永远做不完。”(辰辰)


返回网站首页

本文评论
微软宣布 Chrome OS 系统 Office 应用将在下个月起停止支持
  8 月 26 日消息 根据外媒 Neowin 消息,微微软今日正式宣布,将于 9 月 18 起停止支持 Chrome OS 系统上的安卓版 Office 套件 App,包括 Outlook。这些应用停止支持后,微软希...
日期:08-23
UCWeb印度市场份额超两成 宣布进军北美市场
  “UC浏览器的海外用户已经突破2000万,在印度市场,UC的份额已经超过了20%,很快我们就将进军美国市场。”近日,一年一度的硅谷中国无线移动年会(SVCWM2011)在美国加州山景城...
日期:07-23
微软 Edge 浏览器改进 PDF 触摸功能:提高手写笔流畅性,增加禁止触屏开关
  1月29日消息 目前,基于 Chromium 的 Edge 浏览器已经越来越完善,不过相比老版的 Edge 浏览器,新版在 PDF 阅读与编辑方面一直有所欠缺。而现在,微软决定补足这一短板。  ...
日期:07-10
嗨学网缘何能够领跑在线职业教育赛道?(嗨学网职业点亮)
2020年,被称为教育行业的变革之年。受疫情影响,在线教育行业这一年的破与立、攻与守、坚持与改变都成为了在线教育发展的大事记。大厂入局,资本涌入,伴随着新动能崛起、新技术...
日期:08-17
零食江湖战火再起:老网红遇瓶颈、新网红抢市场「网红零食营销」
声明:本文来自于微信公众号 连线Insight(ID:lxinsight),文/王慧莹,编辑/周晓奇,授权转载发布。洽洽食品曾在一次推广活动上提到:经济越不景气,越需要零食来舒缓压力。原画师能在家...
日期:10-25
YouTube:广告模式发生变化,电视业务扩大至 1.2 亿人(youtube广告形式)
  3 月 11 日消息 据外媒报道,YouTube 公布一项数据显示,到 2020 年 12 月,有 1.2 亿人居家通过电视屏幕观看 YouTube 或 YouTube TV,而去年 3 月份,这一数字还是 1 亿人。...
日期:07-16
游戏公司苦熬版号空档期:两家连亏已退市,最牛厂商净利翻足39倍
图片来源:Pixabay   来源:时代财经   文/谢斯临   进入7月后,游戏上市公司陆续交出2022上半年成绩单。   时代财经统计15家已披露上半年业绩预告的游戏厂商后发现,共有...
日期:07-31
家长信偏方致3天大宝宝气管堵塞 网友吐槽:很多老人愚昧还自以为是
陕西西安一家长听信老人的话,为了防止宝宝夜惊,于是给刚出生3天的宝宝吃了黄米”大小的七珍丹,没想到宝宝吃了以后3个小时左右开始出现吐奶、呼吸不顺畅的表现。就医后,发现宝宝...
日期:04-08
落户上海,特斯拉储能超级工厂将生产大型商用储能电池,初期规可达1万台
4月9日消息,特斯拉储能超级工厂项目签约仪式在上海正式举行。据了解,特斯拉储能超级工厂将规划生产特斯拉超大型商用储能电池(Megapack),初期规划年产商用储能电池可达1万台,储能...
日期:04-09
愚人节,聊聊那些正在坑人的“新型AI”
声明:本文来自微信公众号“脑极体”(ID:unity007),作者:风辞远,授权转载发布。几年前的一个愚人节,我们和大家聊过AI技术被作为诈骗工具的情况。很不幸,当时讨论的一些苗头,现在都成...
日期:04-03
特斯拉汽车交付专员「为交付Semi卡车做准备 特斯拉招募技术服务人员」
9月5日消息,上月美国电动汽车制造商特斯拉首席执行官埃隆·马斯克(Elon Musk)证实,公司将于今年晚些时候开始交付电动卡车Semi。特斯拉官网发布的招聘信息显示,公司正在为“Semi...
日期:11-04
2022年诺贝尔奖将从10月3日起陆续揭晓_2022年诺贝尔奖颁奖时间
  记者/郝晓丽维普数据知识服务平台黑鲨3和红魔iphone最全机型及介绍  据诺贝尔奖官网消息,2022年诺贝尔奖将于10月3日至10日陆续颁布。诺贝尔基金会还决定邀请2022年诺...
日期:10-03
京东商城日前公布了第三轮融资细节以及上市时间表(京东商城融资出现问题是在第几轮)
  手握15亿C轮融资刘强东再放话:   京东商城日前公布了第三轮融资细节以及上市时间表。刘强东前日透露,京东明年下半年盈利,最早将在2013年去美国上市,“筹资至少20亿美元...
日期:07-28
网红主播自曝收入是炫富还是“自我举报”_揭秘网红主播的背后
海凝   近日,网红主播“彩虹夫妇”自称其一场带货直播总共卖出2.3亿元,抛开所有开支,大概挣了400多万元。据报道,国家税务总局成都市税务局稽查局已接到关于该企业税收情况的...
日期:08-07
特斯拉总裁马斯克人工智能「特斯拉前 AI 高级总监宣布回归马斯克创立的 OpenAI」
2月9日消息:特斯拉前AI高级总监Andrej Karpathy在推特上发文表示,自己将再次加入OpenAI。这是一家最初由特斯拉CEO马斯鹕共同创立的人工智能初创公司。Karpathy称,「我将再一...
日期:02-09
SpaceX星际飞船可能最早于下周进行首次入轨测试「spacex星际飞船原型机着陆数分钟后爆炸」
4月5日消息,美国联邦航空管理局(FAA)发布的一份通知显示,SpaceX星际飞船系统最早可能于下周进行首次入轨测试。据FAA网站周二发布的通知显示,星际飞船系统可能的发射日期为4月10...
日期:04-05
蔚来全球首家换电站「蔚来第1300座换电站今日上线 累计换电超1500万次」
12月31日消息,蔚来汽车今日宣布,第1,300座换电站上线。2022年全国换电站布局新增528座,累计数量已达1,305座(其中高速公路换电站346座),电区房覆盖率达68.81%,目前蔚来用户累计换电...
日期:12-31
报告:去年网上泄露超过7.2亿个密码 一半来自僵尸网络
3月15日 消息:网络安全公司 SpyCloud 发布了 2023 年身份暴露报告,该报告深入揭示 2022 年大量网络数据泄露的严重情况,令人发指。其中,研究人员在互联网上发现了7. 215 亿个被...
日期:03-15
马斯克称若推特能确认部分内容 或将继续推进收购计划「马斯克发推特说市值」
当地时间8月6日,特斯拉首席执行官埃隆·马斯克在社交媒体上表示,如果推特能够确认一些关于如何衡量用户账户是“机器人或虚假账户”还是真人的细节,他以440亿美元收购推特的计...
日期:09-17
春节档电影票均价7年来首降:你会选择看哪部电影过年?_2018年春节档电影票房
今日消息,据央视财经频道报道,最新数据显示,目前已有10711家影院上映春节档影片,已连续21天超1万家,数量上已恢复到去年的90.4%。从票价来看,今年春节档预售平均票价相较2022年春...
日期:01-20