您的位置:首页 > 互联网

中国发布《生成式AI安全基本要求》,涵盖训练数据、生成内容等_生成式模型有哪些

发布时间:2024-06-03 11:56:30  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

全国网络安全标准化技术委员会在官网发布了,国家标准《网络安全技术 生成式人工智能服务安全基本要求》征求意见稿。

该意见稿一共分为《网络安全技术 生成式人工智能服务安全基本要求-标准文本》、意见汇总处理表和编制说明三大块。

其中,标准文本涵盖训练数据安全要求、模型安全要求等,主要是为了加强生成式人工智能的开发、应用落地的安全性。如果你对该标准有任何意见,可以在2024年7月22日前反馈给国家网安标委秘书处。

生成式模型有哪些

2023年7月,国家网信办等七部门发布了《生成式人工智能服务管理暂行办法》,从政策法规层面为我国生成式人工智能健康发展保驾护航,为有序开展相关管理工作明确了方向。

而本次发布的标准要求是对《办法》中的安全要求进行细化,规定了生成式人工智能服务在安全方面的基本要求,针对当前生成式人工智能服务研发过程中的网络安全、数据安全、个人信息保护,以及面向服务过程中的应用场景安全风险、软硬件环境安全风险、生成内容安全风险、权益保障安全风险等方面,提出细化安全要求。

生成式设计

下面AIGC开放社区将为大家介绍该标准的主要内容

数据来源安全

对服务提供者的要求如下。

a)采集来源管理:

1)面向特定数据来源进行采集前,应对该来源数据进行安全评估,数据内容中含违法不良信息超过5%的,不应采集该来源数据;

RTX 4090显卡或将上市

2)面向特定数据来源进行采集后,应对所采集的该来源数据进行核验,含违法不良信息情况超过5%的,不应使用该来源数据进行训练。

b)不同来源训练数据搭配:

1)应提高训练数据来源的多样性,对每一种语言的训练数据,如中文、英文等,以及每一种类型的训练数据,如文本、图片、音频、视频等,均应有多个训练数据来源;

2)如需使用境外来源训练数据,应与境内来源训练数据进行合理搭配。

c)训练数据来源可追溯:

1)使用开源训练数据时,应具有该数据来源的开源许可协议或相关授权文件;

谷歌在创业初期,因何能够洞察到市场发展的动向?

2)使用自采训练数据时,应具有采集记录,不应采集他人已明确不可采集的数据;不可采集的网页数据,或个人已拒绝授权采集的个人信息等。

3)使用商业训练数据时:

应有具备法律效力的交易合同、合作协议等;

交易方或合作方不能提供数据来源、质量、安全等方面的承诺以及相关证明材料时,不应使用该训练数据;

应对交易方或合作方所提供训练数据、承诺、材料进行审核。

4)将使用者输入信息当作训练数据时,应具有使用者授权记录。

数据内容安全

a)训练数据内容过滤:对于每一种类型的训练数据,如文本、图片、音频、视频等,应在将数据用于训练前,对全部训练数据进行过滤,过滤方法包括但不限于关键词、分类模型、人工抽检等,去除数据中的违法不良信息。

b)知识产权:

1)应有训练数据知识产权管理策略,并明确负责人;

科学研究能力和创新能力

2)数据用于训练前,应对数据中的主要知识产权侵权风险进行识别,发现存在知识产权侵权等问题的,服务提供者不应使用相关数据进行训练;

注:训练数据中包含文学、艺术、科学作品的,需要重点识别训练数据以及生成内容中著作权侵权问题。

3)应建立针对知识产权问题的投诉举报渠道;

4)应在用户服务协议中,向使用者告知使用生成内容的知识产权相关风险,并与使用者约定相

关责任与义务;

5)应及时根据国家政策以及第三方投诉情况更新知识产权相关策略;

6)宜具备以下知识产权措施:

公开训练数据中涉及知识产权部分的摘要信息;在投诉举报渠道中支持第三方就训练数据使用情况以及相关知识产权情况进行查询。

c)个人信息方面:

1)在使用包含个人信息的训练数据前,应取得对应个人同意或者符合法律、行政法规规定的其他情形;

2)在使用包含敏感个人信息的训练数据前,应取得对应个人单独同意或者符合法律、行政法规规定的其他情形。

模型安全要求

对服务提供者的要求如下。

a)模型训练方面:

1)在训练过程中,应将生成内容安全性作为评价生成结果优劣的主要考虑指标之一;

注:模型生成内容是指模型直接输出的、未经其他处理的原生内容。

2)应定期对所使用的开发框架、代码等进行安全审计,关注开源框架安全及漏洞相关问题,识别和修复安全漏洞。

b)模型输出方面:

1)生成内容准确性方面,应采取技术措施提高生成内容响应使用者输入意图的能力,提高生成内容中数据及表述与科学常识及主流认知的符合程度,减少其中的错误内容;

2)生成内容可靠性方面,应采取技术措施提高生成内容格式框架的合理性以及有效内容的含量,提高生成内容对使用者的帮助作用;

3)问题拒答方面,对明显偏激以及明显诱导生成违法不良信息的问题,应拒绝回答;对其他问题,应均能正常回答;

4)图片、视频等生成内容标识方面,应满足国家相关规定以及标准文件要求。

c)模型监测方面:

1)应对模型输入内容持续监测,防范恶意输入攻击,例如注入攻击、后门攻击、数据窃取、对抗攻击等;

2)应建立常态化监测测评手段以及模型应急管理措施,对监测测评发现的提供服务过程中的安全问题,及时处置并通过针对性的指令微调、强化学习等方式优化模型。

d)模型更新、升级方面:

1)应制定在模型更新、升级时的安全管理策略;

2)应形成管理机制,在模型重要更新、升级后,再次自行组织安全评估。

e)软硬件环境方面:

1)模型训练、推理所采用的计算系统方面:

应评估系统所采用芯片、软件、工具、算力等方面的供应链安全,侧重评估供应持续性、稳定性等方面;

生成式模型有哪些

所采用芯片宜支持基于硬件的安全启动、可信启动流程及安全性验证。

2)应将模型训练环境与推理环境隔离,避免数据泄露、不当访问等安全事件,隔离方式包括物理隔离与逻辑隔离。

上面只是部分内容,整个安全标准书是非常详细的,有兴趣的可以去官网查看全部内容。

我国也是全球为数不多在生成式人工智能领域连续出台安全管理条例的国家,一方面展示了国家对创新变革技术的重视程度,另外保证了生成式人工智能的场景化落地和应用安全。


返回网站首页

本文评论
女子旅游与牛群合影被顶飞 景区提醒:不要穿裙子近距离和牛接触
9月19日消息,不要小看食草动物,它们同样很暴躁,一样有可能伤人。据报道,9月17日在新疆阿勒泰喀纳斯景区,一女子站在牛群旁拍照打卡,下秒被牛一角顶飞并摔倒在地。回过神来,女子快速...
日期:09-20
科普博主无穷小亮谈“鼠头鸭脖”事件:没作假,就是老鼠头
近日,一段视频在网络上引发了广泛的讨论,该视频中的食品被质疑为老鼠头,引发了公众的担忧和恐慌。尽管该视频发布者表示食品是鸭脖,科普博主无穷小亮认为视频中的食品确实是老鼠...
日期:06-08
兔兔被抓起强吻吓得嗷嗷大叫 主人:刚出生 怕生_兔子被亲
安徽一男子近日上演了一出温馨又有趣的养兔日常。这位男子心血来潮,轻轻抓起了自己养的一只小兔子,想要给它一个亲密的吻。然而,出乎他意料的是,这只出生仅 20 多天的小兔子,由于...
日期:04-26
一度因黑客攻击被迫停服:狼人杀游戏《鹅鸭杀》服务器重新上线
近日,早在2021年就上架的狼人杀题材游戏《鹅鸭杀》突然在国内爆火,成为了各大主播直播时的宠儿”。元宇宙概念头部企业首次覆盖vr激增的人气虽然让游戏获得了不低的知名度,但也...
日期:01-13
Meta 更新帮助资源中心:加入「生成式 AI 数据主体权利」表单
8月31日消息:Facebook 用户现在可以删除一些个人信息,这些信息可能会被公司用于训练生成式人工智能模型。苹果13直降500Meta 本周在其网站上更新了 Facebook 帮助中心资源部...
日期:08-31
打破版权桎梏 斗鱼二季度重回盈利轨道(斗鱼盈利能力)
8月15日,斗鱼发布了2022年第二季度财报。报告期内,斗鱼实现营收18.33亿元,非美国通用会计准则下的净利润为2350万元,同比扭亏为盈。   对斗鱼而言,二季度的财务表现至关重要,面...
日期:08-18
2023年第一季度全球PC出货量下降三分之一 苹果最惨_全球pc出货量排名
4月11日 消息:在疫情的头两年出现强劲增长后,全球 PC 出货量连续第四个季度下降。分析公司IDC 的最新数据显示,第一季度比去年同期下降了29%。Canalys 的数据则暂时,一季度整整...
日期:04-11
快手电商“宝藏好物降临夜”年货节专场直播观看人数超5070万 GMV达3400万
1月4日 消息:近日,快手电商联合中央广播电视总台《中国国宝大会》节目,共同打造了一场“宝藏好物降临夜”年货节专场直播,在快手直播间为用户带来30多款品质大牌年货。据悉,本场...
日期:01-04
炬芯持续发力TWS耳机市场 全新升级芯片方案ATS3015(炬芯 ATS3015)
  如果要问当前耳机市场最热门的产品种类是什么?估计很多人都会说是TWS耳机。自从2016年Apple 发布AirPods以来,耳机便进入了真无线时代。TWS耳机凭借时尚轻薄的外观造型...
日期:07-15
索尼上调 2023 财年业绩预期,PS5 预计销售 2500 万台「索尼ps5最新消息新闻」
8月9日 消息:日本索尼集团(SONY.US)在周三发布了截至2023财年第一季度(截至6月30日)的业绩报告。报告显示,由于电影和金融业务的不佳表现,该集团的第一季度营业利润大幅下降。尽管...
日期:08-09
天猫超市明日将放量2万瓶1499元飞天茅台_40万瓶!1499元飞天茅台!天猫超市明天起陆续上架
1月12日 消息:据天猫超市消息,本周将放量30000瓶1499元的飞天茅台,这也是在农历新年前期最大的一次放量。据介绍,1月10日晚上8点放出10000瓶,1月13日晚上8点放出20000瓶,两次放量...
日期:01-12
老人捡钱不愿归还女孩崩溃下跪 女孩:那是我的生活费_老人捡到钱包归还失主
3月13日消息,据速看视界报道,广东广州一老太太在路边捡到女孩掉的200元,因不肯归还,女孩下跪恳求。salesforce员工人数美团市值跌视频中女孩一直大哭都快急死了,双方各执一词争吵...
日期:03-13
极米投影仪RS家族再迎新成员:极米RS10 、RS10Pro_极米rs pro评测
5月13日,极米科技推出两款RS系列新品——RS10Pro和RS10,这是继年初推出RS10Ultra和RS10mini之后,极米再度推出的两款护眼三色激光投影新品。近年来,极米科技把持续创新和全球化...
日期:05-30
支付宝大额存款需3年提取?不实「支付宝定期存款可以取出来吗」
  个人账户的高风险操作行为可能影响账户正常使用。为规避风险,用户须规范使用自己的账户,不要轻易与不明账户交易,不要把个人账户出借给他人使用,也不要进行网络刷单、跑分、...
日期:10-11
赣锋锂业 利润「赣锋锂业:预计2022年净利润180亿-220亿元」
1月29日消息,赣锋锂业在港交所发布公告,预计2022年归属于上市公司股东的净利润为180亿-220亿元,同比增长244.27%-320.78%;扣除非经常性损益后的净利润区间预计为174亿-214亿元,同...
日期:01-30
苹果推出Find My Friends好友追踪iOS应用(ios查找我的朋友)
  10月13日早间消息,据美国科技资讯网站CNET报道,在正式推出iOS 5之前,苹果率先推出了Find My Friends和Airport Utility应用,该应用可以分别用于追踪用户iOS设备好友和管理...
日期:07-23
三星、传音、小米前三-Canalys,Q1东南亚智能手机市场同比增长12%至2350万部
5 月 24 日消息,市调机构 Canalys 最新数据显示,2024 年第一季度,东南亚地区智能手机市场同比增长 12% 至 2350 万部,出货量仍远低于 2023 年之前的水平。附各品牌份额:三星出货...
日期:05-24
淘宝双11数据直播「淘宝全球购双11将聚焦短视频和直播内容化」
9月29日消息,淘宝直播发文称,淘宝全球购近日举办商家主播买手大会,面向消费者、商家买手、主播/机构等群体宣讲淘宝全球购的双11玩法和重点利好政策,同步解读了未来半年的重点策...
日期:09-30
高德上线高考考点地图 将在近3000个考点提示车辆“请勿鸣笛”_高德地图助力高考
6月6日消息,2023年高考将在本周三至周五进行。高德地图上线高考考点地图,聚合全国近3000个考点及周边信息,方便考生和家长查询,以合理安排出行计划。高考考点地图覆盖了全国140...
日期:06-06
理光数码「理光数码相机」
公司是一家专业从事数码影像设备、办公设备、健康医疗设备以及工业产品的制造商。公司成立于1936年,总部位于日本东京都新宿区。今天,公司已经成为全球顶尖的数码影像设备制造...
日期:05-29