您的位置:首页 > 互联网

聘请专家攻击ChatGPT-解决技术伦理问题 揭秘OpenAI“红军”

发布时间:2023-10-02 21:34:48  来源:互联网     背景:

北京时间4月17日早间消息,据报道,在安德鲁·怀特(Andrew White)获得GPT-4的使用权之后,他使用这一人工智能系统提出了一种全新的神经毒剂。GPT-4是热门聊天机器人ChatGPT背后的人工智能技术。

作为罗切斯特大学的化学工程教授,怀特是OpenAI去年聘请的50名专家学者之一。在6个月的时间里,这支“红军”对这一新模型进行了“定性探索和对抗性测试”,试图攻击它。

怀特表示,他使用GPT-4的建议生成了一种可作为化学武器的化合物,并使用“插件”为这个模型提供新的信息源,例如学术论文和化学品制造商名录。随后,这个聊天机器人找到了一个地方来制造这种化合物。

他说:“我认为,这将使每个人都获得更快速、更准确地工具去从事化工行业。但这也使得人们会以更危险的方式去开展化学活动,带来了很大的风险。”

上个月,OpenAI面向更广泛的公众发布了这项新技术,而这些令人惊讶的发现确保新技术不会带来不良后果。

事实上,“红军”的演习目的是探索并了解在社会上部署先进人工智能系统会造成什么样的风险,解决公众这方面的担忧。他们在工作中提出探索性的或是危险的问题,以测试这个工具在回答问题时的详细程度。

OpenAI想要探索模型毒性、偏见和歧视等问题。因此,“红军”就谎言、语言操纵和危险的科学常识进行了测试。他们还评估了模型协助和教唆剽窃的情况、金融犯罪和信息安全攻击等违法活动的可能性,以及模型可能会如何威胁国家安全和战场通信。

“红军”由一系列专业人士组成,包括学者、教师、律师、风险分析师和信息安全研究员,主要来自美国和欧洲。他们的发现被反馈给OpenAI。在更广泛地推出GPT-4之前,“红军”提供的意见被用于模型的重新训练,解决GPT-4的问题。在几个月的时间里,专家们每人花了10到40个小时去测试这个模型。多名受访者表示,他们的工作时薪约为100美元。

其中的许多人都对语言模型的快速发展提出了担忧,尤其是通过插件将语言模型与外部知识源连接在一起可能造成的风险。

GPT-4“红军”的成员、瓦伦西亚人工智能研究所教授何塞·埃尔南德斯-奥拉洛(José Hernández-Orallo)表示:“今天,系统被冻结了。这意味着它不再学习,也不再有记忆。但如果我们让系统继续有机会访问互联网,那么会怎样?这可能会成为一个与世界相连的非常强大的系统。”

OpenAI表示,该公司认真对待安全性问题,并在发布前对插件进行了测试,并将随着用户越来越多继续定期更新GPT-4。

技术研究员罗亚·帕克扎德(Roya Pakzad)使用英语和波斯语的输入信息对该模型进行了性别、种族和宗教偏见的测试,例如对于佩戴头巾问题。

帕克扎德承认,这个工具对非英语母语人士能带来帮助,但也显示出对边缘人群的公开刻板印象,即使随后更新的版本也是如此。她还发现,在用波斯语测试该模型时,聊天机器人用捏造的信息做出回复,即出现所谓“幻觉”的情况更糟糕。与英语相比,在波斯语回复中捏造名字、数字和事件的比例更高。

她表示:“我担心,语言多样性和语言背后的文化会受到损害。”

三星z flip型号

谷歌手机对比苹果手机

荣耀magic3标准版拍照

来自内罗毕的律师、唯一一名非洲测试人员博鲁·戈洛(Boru Gollo)也注意到了模型的歧视性语气。他说:“有一次,我在测试这个模型时,它表现得像个白人在跟我说话。在问到某个特定群体时,它会给一个有偏见的意见,或是在回答中出现歧视。”OpenAI承认,GPT-4仍有可能表现出偏见。

“红军”的成员还从国家安全的角度对模型进行了评估,但他们对于新模型的安全性有着不同的看法。美国外交关系委员会研究员劳伦·卡恩(Lauren Kahn)表示,当她开始研究,如何将这项技术用于对军事系统的攻击时,她“没有想到模型的回答会如此详细,以至于我只需要做一些微调即可”。

不过,卡恩和其他信息安全测试者发现,随着测试时间推移,模型回答的内容逐渐变得安全。OpenAI表示,在推出GPT-4之前,曾训练过这个模型拒绝回答恶意的信息安全问题。

“红军”的许多成员表示,OpenAI在发布GPT-4之前已经进行了严格的安全评估。卡内基梅隆大学语言模型毒性专家马尔滕·萨普(Maarten Sap)说:“他们在消除这些系统中的显性毒性方面做得非常好。”萨普研究了该模型对不同性别的描述,发现模型的偏见反映的是社会差异。但他也发现,OpenAI做出了一些积极的选择来对抗偏见。

博主有钱吗

然而自推出GPT-4以来,OpenAI一直面临着广泛的批评。例如,有技术伦理组织向美国联邦贸易委员会(FTC)投诉,称GPT-4“有偏见和欺骗性,对隐私和公共安全构成风险”。

最近,该公司推出了一项名为ChatGPT插件的功能。通过该功能,Expedia、OpenTable和Insta等合作伙伴应用可以让ChatGPT访问它们的服务,允许ChatGPT代表用户下单。

“红军”的人工智能安全专家丹·亨德里克斯(Dan Hendrycks)表示,这些插件可能会让人类用户“脱离整个链路”。“如果聊天机器人可以在网上发布你的私人信息,访问你的银行账户,或者派警察到你家里去,那会怎么样?总体而言,在让人工智能掌握互联网的力量之前,我们需要更有力的安全评估。”

受访者还警告说,OpenAI不能仅仅因为其软件是在线的就停止安全测试。乔治城大学安全和新兴技术中心的希瑟·弗雷斯(Heather Frase)测试了GPT-4协助犯罪的能力。她表示,随着越来越多人使用这项技术,风险将继续扩大。她表示:“你做运行测试的原因是,一旦它们在真实环境中被使用,行为就会不同。”她认为,应该创建一个公共记录本,报告由大语言模型引发的事故。这类似于信息安全或消费者欺诈报告系统。

劳工经济学家及研究员萨拉·金斯利(Sara Kingsley)建议,最好的解决方案是清楚地宣传这方面的危害和风险,“就像食品上的营养标签”。“关键是要形成一个框架,知道经常出现的问题是什么。这样你就可以有一个安全阀。这也是为什么我认为,这项工作将会永久性的持续下去。”


返回网站首页

本文评论
世卫组织联合微软、微信及其他科技公司举办冠状病毒黑客马拉松
  3月25日消息 据外媒CNBC报道,世界卫生组织(WHO)与Facebook、微软、微信和其他几家科技公司合作举办了一场黑客马拉松,以推动软件开发,应对与冠状病毒大流行有关的挑战。...
日期:06-18
新晋诺奖得主斯万特·帕博:人类的本质
  来源:澎湃新闻  【编者按】  北京时间10月3日下午,瑞典科学家斯万特·帕博(Svante Pääbo)获得“2022年诺贝尔生理学或医学奖”,表彰他对已灭绝人种的基因组和人类进化...
日期:10-05
新面孔过半,但月涨粉千万的时代一去不复返 | 抖音10月涨粉榜_抖音新人涨粉
声明:本文来自于微信公众号卡思数据(ID:caasdata6),作者:卡思数据,授权转载发布。10月抖音涨粉榜已出,我们先来看榜:如果说,今年以来的抖音月涨粉榜持续呈现出了低迷之势,那么时间...
日期:11-23
OpenAI 首席执行官 Sam Altman 解释他为何在人工智能之外大力投资能源
7月12日消息:Oklo 公司是一家先进的裂变微型反应堆创业公司,周二宣布通过与特殊目的收购公司 AltC Acquisition Corp. 进行合并以进行上市交易。AltC 由 OpenAI 首席执行官 S...
日期:07-12
京东健康日均问诊量「“京东健康发热门诊”上线,首日咨询量较前日提升5倍」
  12月15日,京东健康推出“京东健康发热门诊”,为用户提供7×24小时的新冠病毒感染相关的问诊咨询、开具处方、购买药品、用药指导等服务,用户只需打开京东APP搜索“京东健康...
日期:12-15
中国“宁王”成功出海 宁德时代首座海外工厂投产
1月28日消息,中国电池制造商宁德时代1月26日在德国阿恩施塔特启动了其在欧洲的第一座工厂,这也是宁德时代在中国境外开设的第一家工厂。mate 40降价预计该工厂的年产量最终将...
日期:01-28
金价又“狂飙”!啥情况  金店首饰上涨至每克572元_金价降了为什么金店里的价格还贵
近日,在全球经济下行压力加大,市场避险情绪高升的背景下,黄金市场表现强劲。早在4日,现货黄金价格突破了2074.77美元/盎司,盘中一度涨至2085.4美元/盎司,距历史最高点仅一步之遥。...
日期:05-09
健康瘦身APP渐趋刚需 自律管理功能成业内最大优势(自然瘦健康管理)
  根据卫健委公布的人口比例,当前我国成年居民超重肥胖超过50%,结合第七次人口普查数据来看,有超过5.5亿人士为超重肥胖者。因此,由肥胖引起的健康问题已逐渐成为社会关注的...
日期:01-21
谷歌母公司Alphabet再次授予CEO皮查伊股权激励 但进一步与绩效挂钩
  讯 北京时间12月22日早间消息,据报道,谷歌母公司Alphabet周三表示,已经批准向首席执行官桑达尔·皮查伊(Sundar Pichai)授予新的股权激励,同时将他的薪酬更进一步地与绩效挂钩...
日期:12-22
山东国家级“双跨”工业互联网平台增至7家,总数位居全国第二「双跨 工业互联网」
通信世界网消息(CWW)近日,工业和信息化部完成2023年新增跨行业跨领域工业互联网平台公示。新黄河记者从省工业和信息化厅获悉,山东有3个平台入选,分别为国网山东省电力公司打造的...
日期:08-14
特斯拉方向盘加热设置「特斯拉新增方向盘自动加热功能 2023.2.13版本发布」
2 月 23 日讯:近日,特斯拉 2023.2.13 版本发布,新增方向盘自动加热功能,以及优化哨兵模式警示灯。干旅游挣钱吗蜜雪冰城违法案少林寺释永圣资本...
日期:02-25
高德地图发布AR智能定向找终点功能,支持北京等六城核心商圈_高德地图几十个地点智能规划路线
6月28日消息,近日,高德地图宣布升级AR步行导航,增加了“AR智能定向”找终点功能。该功能目前已在北京、上海、广州、杭州、成都、深圳六城的核心商圈率先上线。据介绍,“AR智能...
日期:06-28
华虹半导体旗下上市公司股票「华虹半导体拟筹集至多212亿元科创板上市」
集微网消息,华虹半导体7月24日发布《华虹半导体有限公司首次公开发行股票并在科创板上市发行公告》,表示其计划在上海证券交易所上市,筹集至多212亿元人民币资金。lol永恒梦魇...
日期:09-19
微软已解散仅成立四个月的工业元宇宙团队 员工均被辞退「微软解散工作室」
2月10日消息,据外媒报道,知情人士称,微软已经解散了仅成立四个月的工业元宇宙团队,该团队的约100名员工已全部被解雇。据了解,微软去年10月成立了工业元宇宙核心团队,从事搭建发电...
日期:02-13
百度技术沙龙第十七期:论剑富客户端时代的JavaScript框架
  目前,几乎所有网站都在使用JavaScript和Ajax技术,好的框架不仅可以帮助设计师和开发人员把精力集中在关键业务上,而且可以避免重复开发,打造优秀网站,最终提升用户体验。  ...
日期:07-22
真实域名被疑钓鱼 “乌龙”事件引发一场域名注册规则战_钓鱼网站犯法吗
  近日,北京市住房公积金管理中心域名被误认为是钓鱼网站的域名,并且被网民举报,起因在于:管理中心向部分住房公积金缴存人试点发放电子对账单的一条短信,短信中提供了域名为...
日期:07-22
美富豪疯狂计划:三代人“换血葆青春”「美国富豪 下载」
近日,美国一名45岁科技富豪用17岁儿子的血浆为自己换血,引发关注和争议。大众车导航语音播报有医学专家警告说“换血葆青春”不安全也不科学。也有些医学专家认为,这只是他对死...
日期:05-26
单反危!曝 iPhone 15 相机大改:搭载三层堆栈式传感器「ios15相机新功能」
据外媒报道,苹果公司正在为即将量产的iPhone 15系列手机做准备,这款手机将在今年秋季发布,相比上一代iPhone 14系列,iPhone 15系列在相机方面有了很大的升级。据悉,iPhone 15系列...
日期:05-31
真我realme官宣8·28举办「越级而上」五周年演讲
2023 年 8 月 21 日—中国 · 深圳—真我realme正式官宣将于 8 月 28 日14: 00 举办「越级而上」五周年演讲暨真我GT5 新品发布会,“五周年越级大作”真我GT5 将正式推出。作...
日期:08-21
大人的歌「李克勤新专辑《大人的童话》上线华为音乐」
5月12日消息, “情歌天王”李克勤的粤语大碟《大人的童话》上线华为音乐,全专共9首歌曲。《大人的童话》包含《弦续》《格林童话》《饥饿的毛毛虫》等粤语新歌。目前,华为音乐...
日期:05-12