您的位置:首页 > 互联网

OpenAI详细解答 将积极与各国政府接触 如何保障AI安全?

发布时间:2023-10-03 23:29:05  来源:互联网     背景:

4月6日消息,美国当地时间周三,OpenAI发帖,详细介绍了其确保AI安全的方法,包括进行安全评估、改进发布后的保障措施、保护儿童以及尊重隐私等。该公司表示,确保AI系统的构建、部署和安全使用对实现其使命至关重要。

以下是OpenAI帖子的全文:

手机号码怎样申请电子邮箱

OpenAI致力于确保强大的AI安全,让尽可能多的人受益。我们知道,我们的AI工具为当今人们提供了许多帮助。世界各地的用户向我们反馈,ChatGPT有助于提高他们的工作效率、增强他们的创造力,并提供量身定制的学习体验。但我们也认识到,与任何技术一样,这些工具也存在真正的风险。因此,我们正在努力确保在各个系统层面上的安全性。

打造更加安全的人工智能系统

在推出任何新的人工智能系统之前,我们都会进行严格的测试,征求外部专家的意见,并通过人工反馈的强化学习等技术来改善模型的表现。同时,我们还建立了广泛的安全和监控系统。

以我们最新的模型GPT-4为例,完成训练后,我们在整个公司范围内进行了长达6个月的测试,以确保其在公开发布之前更加安全可靠。

我们认为,强大的人工智能系统应该接受严格的安全评估。监管是必要的,以确保这种做法被广泛采纳。因此,我们积极与各国政府接触,探讨最佳的监管形式。

从实际使用中学习,提高保障措施

我们尽力在系统部署之前预防可预见的风险,但实验室中的学习永远有限。我们广泛研究和测试,但无法预测人们会如何使用我们的技术,或滥用它。因此,我们认为从实际使用中学习,是创建和发布越来越安全的人工智能系统的关键组成部分。

我们谨慎地将新的人工智能系统逐步发布给人群,并采取实质性的保障措施,并根据我们吸取的教训不断改进。

我们提供自己服务和API中最强大的模型,以便开发人员可以直接将技术集成到他们的应用程序中。这使我们能够监控滥用行为并采取行动,同时制定应对措施。这样,我们可以采取实际行动,而不仅仅在理论上想象如何应对。

实际使用中的经验也促使我们制定了越来越细化的政策,以应对对人们构成真正风险的行为,同时仍然允许我们的技术以更有益的方式使用。

我们认为,社会需要更多时间适应日益强大的人工智能,每个受其影响的人都应该在人工智能的进一步发展方面拥有发言权。迭代部署有助于不同利益相关者更有效地参与人工智能技术的对话中,而拥有使用这些工具的第一手经验至关重要。

保护儿童

我们的安全工作关注重点之一是保护儿童。我们要求使用我们的人工智能工具的人必须年满18岁或以上,或者在父母同意的情况下年满13岁或以上。目前,我们正在研究验证功能。

我们不允许我们的技术用于生成仇恨、骚扰、暴力或成人等内容。与GPT-3.5相比,最新的GPT-4对受限制内容请求做出响应的可能性降低了82%。我们已经建立了强大的系统来监控滥用行为。GPT-4现在可供ChatGPT Plus的订户使用,我们希望随着时间的推移能让更多人体验它。

我们已经采取重大措施,最大限度地减少我们的模型产生伤害儿童内容的可能性。例如,当用户试图将儿童安全虐待材料上传到我们的图像生成工具时,我们会阻止它并向国家失踪和受剥削儿童中心报告此事。

除了默认的安全防护,我们与非营利组织可汗学院(Khan Academy)等开发机构合作,为他们量身定制了安全措施。可汗学院已经开发了一款人工智能助手,它可以作为学生的虚拟导师,也可以作为教师的课堂助手。我们还致力于开发允许开发者为模型输出设置更严格标准的功能,以更好地支持需要此类功能的开发者和用户。

尊重隐私

我们的大型语言模型是在广泛的文本语料库上进行训练的,其中包括公开可用的内容、获得授权的内容以及由人类审核人员生成的内容。我们不利用这些数据来销售我们的服务或广告,也不用它们来建立个人档案。我们只是利用这些数据来让我们的模型更好地为人们提供帮助,例如通过与人们进行更多对话来提高ChatGPT的智能水平。

尽管我们的许多训练数据中包括可以在公共网络上获得的个人信息,但我们希望我们的模型了解的是整个世界,而不是个人。因此,我们致力于在可行的情况下从训练数据集中删除个人信息,微调模型以拒绝个人信息的查询请求,并响应个人从我们的系统中删除其个人信息的请求。这些措施将我们的模型生成包含个人信息的响应的可能性降至最低。

提高事实准确性

现今的大型语言模型,基于之前的模式和用户输入的文本,可以预测下一个可能要使用的词汇。但在某些情况下,下一个最有可能出现的词汇实际上可能存在事实性错误。

提高事实准确性是OpenAI和许多其他AI研究机构关注的重点之一,我们正在取得进展。通过利用被标记为不正确的ChatGPT输出的用户反馈作为主要数据来源,我们提高了GPT-4的事实准确性。相比于GPT-3.5,GPT-4更可能产生符合事实的内容,提高幅度达到40%。

当用户注册使用该工具时,我们努力做到尽可能透明,以避免ChatGPT可能给出错误回复。然而,我们已经认识到,要进一步降低误解的可能性,并教育公众了解这些AI工具目前的局限性,还有很多工作要做。

持续的研究和参与

我们认为,解决AI安全问题的一个切实可行方法是,投入更多的时间和资源来研究有效的缓解和校准技术,并针对现实世界可能被滥用的情况进行测试。

重要的是,我们认为提高AI的安全性和能力应该同时进行。我们迄今为止最好的安全工作来自于与我们最有能力的模型合作,因为它们更擅长遵循用户的指示,更容易驾驭或“引导”它们。

我们将越来越谨慎地创建和部署能力更强的模型,并将随着AI系统的发展而继续加强安全预防措施。

虽然我们等了6个多月才部署GPT-4,以更好地了解其功能、好处和风险,但有时可能需要更长的时间来提高AI系统的安全性。因此,政策制定者和AI开发商需要确保AI的开发和部署在全球范围内得到有效监管,这样就没有人会为了保持领先而采取捷径。这是一项艰巨的挑战,需要技术和制度创新,但我们渴望为此做出贡献。

解决AI安全问题还需要广泛的辩论、实验和参与,包括为AI系统的行为设置界限。我们已经并将继续促进利益相关者之间的合作和开放对话,以创建更安全的AI生态系统。


返回网站首页

本文评论
网速直上高速路,中国联通助力吉利百矿打造5G智能矿山_吉利百矿铝产业项目
通信世界网消息(CWW)5G网络如何在井下800米深的矿井发挥作用?如何为矿工提供具有安全、舒适、幸福感的工作环境?中国联通在广西吉利百矿东怀煤矿(以下简称“东怀煤矿”)建设的广西...
日期:06-09
品效协同的困境仅仅是数据“围墙花园”吗?丨数据围墙专题①
  “前言:随着我国法律法规对于消费者数据愈加严格的重视和保护,未来,不管是品牌广告主还是第三方数据公司,在数据层面也将会面临更多的挑战和危机,而掌握大量数据的媒体...
日期:07-16
国产Model 3/Y车型大幅降价?特斯拉回应_特斯拉y价格拉model 3
凤凰网科技讯 9月30日消息,据媒体报道,特斯拉国产车型Model 3和Model Y将大幅降价,特斯拉回应凤凰网科技称,这是“不实信息”。小米路由器穿墙京东与唯品会此前有消息称,特斯拉在...
日期:10-05
蔚来汽车开通“长城山海线”,张家口到秦皇岛沿途布局7座换电站
IT之家 7 月 19 日消息,蔚来汽车近日宣布“Power Journeys 丨长城山海线”正式贯通,连接张家口、北京、承德、唐山、秦皇岛等城市,途经雁栖湖、避暑山庄、清东陵等旅游胜地,最终...
日期:07-19
曝iPhone 15开始试产:配置、售价基本定型
据供应链消息透露,iPhone 15系列已开始试产,预计本月底正式进入量产阶段。新机整体设计相对保持一致,主要是在配置方面进行升级和微调。共享充电宝涨价原因根据苹果的规划,iPhon...
日期:08-16
提升不止于核芯,华硕灵珑III笔记本商务体验再升级(华硕 灵珑)
  自采用全新Tiger Lake架构的第11代英特尔酷睿处理器发布以来,各大笔记本厂商纷纷推出了搭载全新处理器的轻薄本,华硕也不例外,其旗下著名的华硕灵珑高端商务本迎来了巨大...
日期:07-16
华为余承东最新消息「余承东已用上华为新机 明晚正式发布」
中关村在线消息:有网友发现,目前华为常务董事余承东的“微博小尾巴”已经换成了HUAWEI Pocket S,该机将与一系列全场景新品一同于11月2日晚19:00的发布会上正式发布。这款HUAWE...
日期:11-08
美国今日三大股指涨跌幅「美股周四:三大股指连续上涨,京东涨近8%,法拉第未来跌1%」
3月31日消息,美国时间周四,美股收盘主要股指连续两天全线上涨,科技股继续领涨。美联储多位官员重申了降低通货膨胀的决心。哪吒汽车2019年销量道琼斯指数收于32859.03点,上涨141...
日期:03-31
靠脸吃饭、刷脸住店……腾讯优图黑科技亮相2019微信公开课
  不带钱,不用手机,靠脸吃饭的时代真的来了。1月9日-10日,主题为“同行 WITH US”的2019微信公开课PRO版在广州保利博览馆举行。大会不仅涵盖微信大数据、小程序等热门领域...
日期:10-28
保定数据中心——基于Python的自研视频监控自动化巡检工具
2023/2/24 10:44 保定数据中心——基于Python的自研视频监控自动化巡检工具   项目背景: 保定数据中心占地面积103亩,机房楼总建筑面积5万平方米,为保证安全生产,设有上千...
日期:05-26
7朵郁金香撑起上海武康路流量 网友:小红书的姐妹思路清奇_上海郁金香小区
近日,武康路上社交媒体爆火的郁金香打卡点,春寒料峭,但仍有众多打卡者前来,纷纷赞叹不已——看图大气雍容,验货乖乖隆地洞。只有一小小的花盆,里面7支郁金香,小小的花盆却担负起了...
日期:02-15
美股周三:三大股指全线大涨,英特尔涨超7%,小鹏涨逾9%_昨天美国三大股指
3月30日消息,美国时间周三,美股收盘主要股指全线上涨,涨幅均超1%,科技股领涨。投资者对银行业的状况和利率走势前景较为乐观,风险偏好继续改善。道琼斯指数收于32717.60点,上涨323...
日期:03-30
广西首个高铁物流基地开工建设(广西高铁项目开工)
  11 月 12 日消息,11 月 11 日上午,南宁高铁物流基地建设启动仪式在广西南宁市青秀区南宁第二动车所西侧举行,这是广西首个高铁物流基地,也是全国第二个开工建设的高铁物流...
日期:07-17
微软紧急召回Outlook问题补丁 360安全卫士可一键修复(Outlook修复)
  近日,微软官方网站发布公告指出,12月漏洞修复中存在一个可能导致Outlook 2007出现故障的补丁程序,并建议已安装该补丁的用户尽快将其卸载,并通过官方产品博客向受影响的用...
日期:07-25
iphone 11 pro max改12「大调整!iPhone 15 Pro Max或改名为iPhone 15 Ultra」
【手机中国新闻】前不久,苹果发布了最新一代iPhone 14系列,目前新机已经开售,其Pro系列凭借“灵动岛”的设计俘获了一众果粉的心而大卖。从iPhone 11到14系列,苹果手机的Pro Max...
日期:09-24
只卖生鲜的电商是个伪命题(生鲜电商的问题)
每日优鲜崩盘的新闻热度已经过去,我们还是做了一期节目,探讨它所处的生鲜电商行业。   这个行业在十余年间吸引了数十亿美元的融资、在最近几年享受了疫情带来的“红利”,越...
日期:08-21
“非洲之王”发力桌面市场!传音或将推出迷你主机MegaMini_传音进入非洲市场
在诸多国产手机厂商中,主攻非洲市场,被称为非洲之王”的传音,绝对是其中最特殊的一个。快科技9月1日消息,近日,根据91Mobile消息,传音计划在手机业务之外,开始乏力桌面市场,推出迷你...
日期:09-02
网易云音乐黑胶打碟功能上线,支持Remix混音改编制作任何歌曲_网易云有黑胶唱片
  IT之家9月23日消息,据网易云音乐官方消息,黑胶打碟功能已于iOS全量上线,安卓端即将上线。opporeno6天玑900值得入手吗iPhone14售价极米家用智能投影Z6X  官方表示,网易云...
日期:09-26
暴雪国服1月24日正式停服 网易发布致玩家的告别信「暴雪凉了?」
凤凰网科技讯 1月23日消息,网易今日发布《网易致暴雪国服玩家的告别信:感谢相伴14年》公告,正式宣告暴雪游戏停服。2023年1月24日0时,由网之易代理的《魔兽世界》、《炉石传说》...
日期:01-24
比亚迪宋pro dm 价格一栏表「比亚迪宋Pro DM-i冠军版上市 售价13.58万元-15.98万元」
【网易科技5月25日报道】比亚迪宋Pro DM-i冠军版正式上市,官方指导价13.58万元—15.98万元。宋Pro DM-i冠军版作为中期改款,本次共推出4款车型,两款71KM和两款110KM纯电续航版...
日期:05-25