您的位置:首页 > 互联网

研究发现大型 AI 数据集包含虐待儿童图像:该数据集已用于构建流行的人工智能图像生成器,包括 Stable Diffusion

发布时间:2023-12-21 15:30:35  来源:互联网     背景:

12 月 21 日消息:根据斯坦福互联网观察站周三发布的一项新研究,流行的人工智能(AI)图像生成器的基础数据库中隐藏着数千张儿童性虐待图片(CSAM)。作为对这一研究的回应,一些最大和最常用的图像数据库的运营商关闭了对它们的访问权限。

斯坦福大学的这个监督团队与加拿大儿童保护中心以及其他反虐待慈善机构合作,在巨大的 AI 数据库 LAION 中发现了超过 3200 张涉嫌儿童性虐待的图片,并向执法部门报告了原始照片链接。其中 1000 多张涉嫌图片被确认为儿童性虐待材料。

研究者们写道:我们发现即使在 2023 年晚些时候,拥有 LAION-5B 数据集也意味着拥有数千张非法图片。

对此,LAION 在斯坦福互联网观察站报告发布前夕做出了迅速反应,宣布暂时撤下其数据集。LAION(代表非营利性的大规模人工智能开放网络)在一份声明中表示,我们对非法内容采取零容忍政策,出于谨慎考虑,我们已撤下 LAION 数据集,以确保在重新发布之前它们是安全的。

尽管这些图片只占 LAION 约 58 亿张图片指数的一小部分,斯坦福团队表示,这可能影响 AI 工具生成有害输出的能力,并加剧对多次出现的实际受害者的先前虐待。

arch amd显卡驱动

研究人员表示,这些图片还使 AI 系统更容易生成虚假儿童的逼真和明确的图像,以及将社交媒体上完全穿着衣服的真实青少年的照片转换为裸体照片,这让全世界的学校和执法部门感到震惊。直到最近,反虐待研究人员认为,一些未经检查的 AI 工具产生虐待儿童的图像的唯一方式是通过结合两类在线图片——成人色情和对孩子的无害照片。

斯坦福互联网观察站呼吁采取更为激进的措施。其中之一是要求所有基于 LAION-5B(包含超过 50 亿张图像文本对)构建训练集的人删除它们或与中间商合作清理材料。另一个措施是实际上让去年推出的 Stable Diffusion 的旧版本从互联网上最黑暗的角落消失。

斯坦福互联网观察站的首席技术官 David Thiel 表示:合法平台可以停止提供它的下载,特别是如果它们经常用于生成虐待图像并且没有阻止它们的保障措施。

解决这个问题并不容易,可以追溯到许多生成性 AI 项目实际上被匆忙地推向市场并且由于该领域竞争激烈而广泛可用,Thiel 说。

将整个互联网的抓取数据集用于训练模型本应该限于研究操作,如果有的话,而不是在没有更多严格关注的情况下开源,Thiel 在接受采访时说。

影响 LAION 数据集开发的一个主要 LAION 用户是总部位于伦敦的初创公司 Stability AI,该公司制作了 Stable Diffusion 文本到图像模型。根据斯坦福报告,Stable Diffusion 的新版本已大大降低了生成有害内容的可能性,但去年推出的旧版本(Stability AI 表示它没有发布)仍然嵌入到其他应用程序和工具中,并且仍然是生成明确图像的最受欢迎的模型。

我们无法撤回这一模型。这个模型已经在许多人的本地机器上被人们所拥有,加拿大儿童保护中心信息技术主任 Lloyd Richardson 说。该中心运营着加拿大网络性剥削举报热线。

Stability AI 周三表示,它只托管过滤后的 Stable Diffusion 版本,并且自从接管 Stable Diffusion 的独家开发以来,Stability AI 已采取积极措施来减少滥用风险。

这些过滤器阻止了不安全内容到达模型,该公司在一份准备好的声明中说。通过在内容到达模型之前将其移除,我们可以帮助防止模型生成不安全内容。

LAION 本周表示,它开发了严格的过滤器来检测和移除非法内容,然后才发布其数据集,并仍在努力改进这些过滤器。斯坦福报告承认,LAION 的开发者试图过滤掉未成年的露骨内容,但如果他们早些时候与儿童安全专家协商,可能会做得更好。

许多文本到图像生成器都以某种方式从 LAION 数据库派生而来,尽管并不总是清楚是哪些生成器。Dall-E 和 ChatGPT 的开发商 OpenAI 表示,它没有使用 LAION,并对其模型进行了微调,以拒绝涉及未成年人的色情内容的请求。

Google 基于 LAION 数据集构建了其文本到图像 Imagen 模型,但在 2022 年决定不公开发布,原因是对数据库进行的审计发现了大量不当内容,包括色情图像、种族主义辱骂和有害的社会刻板印象。

LAION 的创始人是德国研究员和教师 Christoph Schuhmann,他今年早些时候表示,公开提供如此庞大的视觉数据库的部分原因是为了确保 AI 发展的未来不受少数强大公司的控制。


返回网站首页

本文评论
传谷歌将收购美国视频网站Next New Networks_美国政府起诉谷歌
  北京时间2月11日早间消息,知情人士透露,谷歌与美国视频网站Next New Networks之间的收购谈判已经进入到尾声,该交易有望在下周公布。   由于增长放缓迫使互联网公司加紧...
日期:07-26
Buddy Compiler打通LLaMA 2端到端推理
要点:vivo X80 ProLLaMA2端到端推理打通!结合 MLIR 和 PyTorch 的编译生态,中国团队展示了 Buddy Compiler 的前端部分实现,可以覆盖 LLaMA 计算图,进行 MLIR 转换和部分优化。...
日期:11-23
酷米看网站_酷米网:百度应用开放平台360度展示品牌
  互联网作为汇聚4.57亿网民群体的新媒体渠道,越来越受到动漫人的重视,同时也悄然改变着传统文化创意产业的固有游戏规则。4月12日,百度正式宣布其应用开放平台全面开放,向业...
日期:07-27
幸福是奋斗出来的,明基激光电视升级有福之家
  当天空的颜色擦黑,路上的灯光亮起,人们开始纷纷走向回家的路。家就像是城市大海中的灯塔指引着人们,夜深了,回家了,安心了。但对于很多处在事业奋斗期的人来说,也许会有迷雾...
日期:07-16
Zoom将裁减1300人约员工总数的15% CEO减薪并放弃奖金「美国zoom公司薪水高吗」
2月8日消息:据彭博报道,提供视频会议服务的Zoom将裁减1300名员工,相当于员工总数的15%,成为最新一家进行裁员的科技公司。一加7pro蓝宝石镜片Zoom在新冠疫情期间快速增长,当时企...
日期:02-10
集度汽车于武汉成立集度科技公司 注册资本1亿美元_集度汽车股东
11月28日消息,天眼查App显示,近日,集度科技(武汉)有限公司成立,法定代表人为夏一平,注册资本1亿美元,经营范围包括互联网信息服务;餐饮服务;充电桩销售;电动汽车充电基础设施运营;新...
日期:12-02
iPhone 14 Plus遇冷Pro卖爆:价格差1000元 你觉得值吗「iphone 12 pro涨价」
10月7日,iPhone 14 Plus迎来首销,至此,iPhone 14全系机型已全部发售。与iPhone 14 Pro系列热火朝天的销售情况不同,iPhone 14、iPhone 14 Plus遭遇了前所未有的市场寒意,后者首发...
日期:10-15
网飞三体电影「《三体》影视化,网飞能拍好吗?」
  [环球时报特约记者 吕克]备受关注的《三体》剧集(网飞版)24日发布首个幕后花絮。花絮中,制片人和主演纷纷现身,首季场景和人设曝光,为广大科幻迷揭开该剧神秘面纱的同时,也让...
日期:09-28
挑战千元旗舰耳机!真我Buds Air5 Pro行业首发50dB降噪_真我air budspro怎么样
快科技5月8日消息,今天真我realme官方宣布,即将推出的真我Buds Air5 Pro无线耳机,将在降噪方面做出新突破。据悉,该耳机将支持深海降噪2.0技术,为行业内首款50dB深度主动降噪的耳...
日期:05-08
网龙网络公司受邀参加第18届联合国卫塞节 并开发“联合国卫塞节元宇宙”
6 月 1 日~ 2 日,第 18 届联合国卫塞节在泰国联合国国际会议中心、摩诃朱拉隆功大学举行,联合国秘书长古特雷斯、泰国僧王颂德帕摩诃穆尼翁、联合国教科文组织总干事奥德蕾·...
日期:06-06
一图了解鲲鹏应用创新大赛2021“鹏飞计划”(鲲鹏应用开发者大赛)
苹果或于9月15日发布iPhone13微软Surface Go1摩托罗拉edge s pro对比小米11谷歌galaxy nexus 松下lx5画质怎么样adobe商业模式 三星Galaxy Z Flip3 5G折叠屏手机 VERTU手...
日期:01-02
iPhone 15系列将包括四款具有重大升级的型号_苹果15有哪些更新
即将推出的iPhone 15系列预计将包括四款型号:iPhone 15、iPhone 15 Plus、iPhone 15 Pro和iPhone 15 Pro Max。pro和pro max机型将有重大升级,包括延续窄边框的全面屏设计,采用...
日期:05-08
环卫管理数字化升级 几米智能车辆称重系统助力监管
  目前,大数据、云计算、物联网、AI等科技前沿数字技术正日渐步入绿色生态领域,体现了相关部门推进治理信息化和智能化的发展趋势。通过接入智能车载称重系统,环卫工作人员...
日期:11-17
木马“冲刺”高考百家高校网站被黑
  6月7日消息,今天是2011年高考第一天,正当考生和家长们进入高考冲刺时,黑客也伺机而动,在大批高校网站“埋伏”了木马病毒。根据360安全中心监测数据,近期高校网站挂马量相比...
日期:07-28
马斯克狂喜!曝推特曾向一名举报人支付700万美元_马斯克推特回复
【CNMO新闻】马斯克和推特之间持续好几个月的收购案还没结束。9月9日消息,有知情人士透露,推特今年6月份曾向举报人皮特·扎特科(Peiter Zatko)支付约700万美元,后者曾担任推特的...
日期:09-20
谷歌宣布人工智能驱动的隐私平台 Checks:简化应用隐私合规并节省时间
5月4日消息:作为 Area 120 孵化器计划的一部分,Google Checks 于 2022 年 2 月推出,旨在帮助日益关注隐私权和数据收集的应用程序开发人员。它通过让开发人员访问易于使用的工...
日期:05-04
小米产品经理预热小米13 仅有小米13和小米13 Pro「小米13怎么样」
中关村在线消息:近日,小米的产品经理魏思琪在线为网友预热小米13的最新的消息。今日头条中老年人居多小米13依旧和上一代一样,小米13和小米13 Pro的大小并不一致,小米13依旧主打...
日期:12-02
高德正式上线Apple产品订购服务 「回家顺路取个“苹果”」_高德地图苹果授权店是真的吗
【】8月31日消息,据高德地图官微消息,高德地图与全国4000多家Apple授权经销商达成合作,推出Apple产品“随手买、顺路取”服务。华为无线充电最高多少w即日起,用户通过高德地图搜...
日期:09-16
北大最新研究称LK-99不是超导体!韩国作者爆料:一家科技巨头已入局研发
声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:金磊,授权转载发布。家人们,“顶流”室温超导又惊现反转。北京大学量子材料科学中心(ICQM)和国科大等单位发布的一篇论文表明:...
日期:08-08
Safari份额20.5%位居第二-全球6月浏览器大战,Chrome份额62.55%排第一_2020浏览器份额
7 月 1 日消息,研究机构 statcounter 发布了 2023 年 7 月报告,揭示了有关浏览器的最新统计数据。在此附上战报如下:百度创新产品在所有平台:Chrome 在 6 月凭借 62.55% 的全球...
日期:09-22