您的位置:首页 > 互联网

千万人围观烧焦婴儿图片!伯克利教授辟谣:AI图片检测器无用

发布时间:2023-10-16 18:29:39  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:桃子 润,授权转载发布。

【新智元导读】AI无法打败AI,不是没有道理。近来,上千万人围观的婴儿死亡照片,AI检测工具竟无法给出一致答案。

AI图片检测器又被冲了!

最近,外网爆出大量中东地区冲突的照片,向世人展示了生命在这种极端条件下是何等的脆弱和无助。

其中,一张烧焦婴儿的照片,由于太过于残忍,让人难以置信。

于是,有人把照片放到了AI图片检测器中,来检测这些照片是否为AI生成。

果然,这张照片被AI检测器——Optic,认定为AI生成。

而在4chan上,甚至还出现了原图,原本尸体的位置其实是一只狗狗。

于是网友愤怒地去发布者推文下方留言,攻击他利用AI生成的照片来散播虚假的末日恐慌。

这条认为照片是由AI生成的推文,2天不到的时间已经有2100万的阅读。

但是很快网友们发现,他们把照片放到了同样的AI检测器上,检测结果几乎是随机的,既有AI,也有人类。

有人发现,只要把同一张图片裁剪一下,或者背景色变成黑白,这个检测器就会认为图片是由人类拍摄的。

甚至有时候检测器抛硬币的时候,硬币还会立起来...

iphone 15 pro最新爆料

那到底这张图是不是由AI生成的呢?

最后,AI检测器官方也针对这个事件发推,认为他们的没有办法确定图片是否由AI生成,希望大家理性讨论。

AI图片检测器,到底有多不靠谱?

UC Berkeley教授、世界顶尖的数字图像处理专家之一Hany Farid表示,这张图像没有任何迹象表明它是由AI生成的。

AI图像生成器最大的问题之一是高度结构化的形状和直线,Farid说。如果你看到桌腿和螺丝,一切看起来都很完美,那么图片就几乎不可能是由AI生成的。

比如这张著名的海绵宝宝制造了9/1的图片,窗外的双子塔线条都不直,飞机上的仪表盘都相互扭曲到一起了,这看起来就是A里A气的。

我们在那张照片中能够看到物体的结构很准确、阴影也很准确、没有伪影——这让我相信这张照片应该完全是真实的法里德说。

Farid还通过他自己的其他AI图像检测器识别了这幅图,另外四种AI图像检测工具也都认为图像不是AI生成的。

Farid说,AI检测器是一个工具,但它只是工具包的一部分。用户需要对整个图像进行进行一系列的测试,不可能只按一个按钮就得到答案。

而AI检测工具Optic确实也没有给出自己的检测技术的具体细节。

Optic网站也声明,AI检测器可能会产生不准确的结果。

AI图像检测技术

Farid教授在去年曾经撰写过一篇论文,介绍了如何判断AI生图工具图像的一致性。

通过判断图像上的一致性,可以帮助判断出图像是否由AI生成。

论文链接:https://arxiv.org/abs/2206.14617?ref=404media.co

教授首先概述三种相关的基于物理的分析方式,每种分析都利用了图像形成过程固有的相同的基础透视几何原理。

消失点

  • 平行后退线汇聚于一个消失点。

  • 瓷砖之间的线图1(a)是平行的。成像时,这些线全部汇聚在一个消失点。如果场景中的平行线在深度上远离镜头,那么就会存在消失点,尽管它可能落在图像之外。

    如果场景中的平行线在深度上不后退,也就是说,如果它们完全平行于镜头传感器(在任何距离),则平行线将被成像为平行线,出于实际目的,可以考虑消失点处于无穷远。这种几何学源于透视投影的基础知识。

    在透视投影下,场景中的点 (X, Y, Z) 被成像到点 (f X/Z, f Y /Z),其中f是镜头焦距。

    由于图像中点的位置与距离Z成反比,因此投影点会作为距离的函数进行压缩,从而导致图像中的线会聚;

    2. 平行平面上的平行线会聚到同一个消失点

    远处的盒子在图1(b) 与地板上的瓷砖对齐,使得盒子的边缘与瓷砖之间的线平行。因为平行平面上的平行线共享一个消失点,所以盒子侧面和瓷砖地板的消失点是相同的;

    3. 平面上所有直线的消失点都位于消失线上。

    许多组平行线,每组平行线会聚到不同的消失点,如图1(c) 所示。如果平行线组跨越场景中的同一平面,则它们的消失点将位于消失线上。消失线的方向由镜头相对于平行线所跨越的平面的旋转来确定

    阴影

    有点令人惊讶的是,消失点背后的相同几何形状也适用于投射阴影。

    上图显示的是连接盒子上的点及其在投射阴影上的对应点的三条光线。扩展图像边界后发现,这三条光线相交于一个点,该点对应的是照亮场景的光源的投影。

    无论光源在附近(台灯)还是在远处(太阳),这种与阴影、物体和光相关的几何约束都成立,并且无论阴影投射到的表面的位置和方向如何,该几何约束都成立。

    当然,该分析假设场景由单个主光源照明,从每个对象仅存在单个投射阴影可以明显看出这一点。

    在上面的示例中,照亮场景的光源位于镜头前面,因此光源的投影位于图像平面的上半部分。

    然而,如果光线位于镜头后面,则光源的投影将位于图像平面的下半部分。由于这种反转,对象约束的阴影也必须反转。

    因此,图像的投射阴影分析必须考虑三种可能性:

    (1) 光线位于镜头前面,光源的投影位于图像平面的上半部分,约束锚定在投射阴影上并包围对象;

    (二) 光线在镜头后面,光源的投影在图像平面的下半部分,约束锚定在物体上并包围投射的阴影;

    (三) 光线位于镜头中心的正上方或正下方,光源的投影位于无穷远,约束将在无穷远相交。如果这些情况中的任何一种导致所有约束的共同交集,则投射阴影在物理上是合理的。

    反射

    驿舒达酒店预订服务(上海)有限公司

    下图2所示的场景是三个盒子反射在平面镜中。

    这个图的下半部分显示了真实盒子和虚拟盒子之间的几何关系。

    橙色线代表镜子,位于两组盒子之间的中点。黄线连接真实和虚拟盒子上的对应点。这些线彼此平行并垂直于镜子。

    现在考虑一下这些平行线叠加在场景上时如何出现。从镜子平面观察时平行的线不再平行。相反,由于透视投影,这些平行线会聚到一个点,就像世界中的平行线会聚到一个消失点一样。

    由于连接场景中对应点及其反射的线始终是平行的,因此这些线必须在图像中具有共同的交点才能在物理上合理。

    实例分析

    上图3显示了AI合成图像的三个代表性示例,并对地板和柜台顶部的几何透视一致性进行了分析。

    每张图像(在几个像素内)准确地捕捉了瓷砖地板的透视几何形状,作为一致的消失点(以蓝色呈现)的证据。然而,平行台面(以青色呈现)的消失点在几何上与台面的消失点不一致。

    相应的对齐图块。即使台面与瓷砖不平行,青色消失点也应位于由瓷砖地板消失点定义的消失线(以红色呈现)上。请注意,对于图3右上角的图像,瓷砖地板上的水平线几乎是平行的,因此相应的消失点位于无穷远,因此不会相交。

    虽然这些图像中消失点局部事一致的,但并不是全局一致的。在25张合成的厨房图像中,每张都发现了相同的模式。

    上图是用提示词生成的方块图片,在阴影处就明显地出现了不一致性。

    上图8所示是将几何分析应用于由AI生成的包含了看上去相当准确的反射的图像结果。

    尽管这些反射在视觉上是合理的,但在几何上并不一致。

    与前几节中的投射阴影和几何结构不同,DALL·E-2很难合成合理的反射,大概是因为此类反射在其训练图像数据集中不太常见。

    基于这些对于AI生成图片局限性的了解,通过对于图片一致性的检测,能非常有助于判断图片是否由AI合成。

    图像识别难,AI打败AI

    AI图像生成器,正不断进化。

    上半年,Midjourney爆火,能够生成足够逼真的图片,却愚弄了很多人。

    86岁教皇头顶白色小瓜帽、一身喇叭口的白色羽绒服,金属制的十字架项链外露,外加一本正经的表情。

    当时,这张照片一经发布,在社交媒体上骗过了所有人,被许多网友疯狂转发,甚至有人直呼教皇太潮了。

    在大家都信以为真时,突然有人点出这是AI生成的,许多人瞬间傻眼了。

    这仅是其中的一个栗子,还有马斯克新女友GM的首席执行官Barra等各种虚假流传的图片,已经达完全到以假乱真的程度。

    这一事件,直接引发了马斯克、苹果联合创始人Stephen Wozniak等科技领导人呼吁暂停AI的研发。

    虽然AI生成有趣、便利,但它给整个行业带来了风险。

    一不小,就会被别有用心的人用其传播虚假信息、侵犯知识产权,或利用生成果照等等。

    禾赛科技激光雷达介绍

    接下来几个月,Midjourney将会发布最新的V6版本,目前V5版本已经在图片生成的真实度上做的非常完善。

    而其他AI图像生成器也在快速迭代。前段时间,OpenAI刚刚发布了DALL·E3,与此同时微软必应图像生成也用上了DALL·E3。

    当然了,研究人员也在努力构建可以辨别图像的工具,关键是如何追赶上AI图像生成器不断换代的步伐?

    AI检测工具竞争赛

    现在,已经有十几家公司提供工具来识别图片是否是由AI生成的,它们的名字包括Sensity AI(深度伪造检测)、Fictitious.AI(抄袭检测)、Originality.AI等等。

    人工智能信任与安全公司Optic推出了一个AI or Not的网站。

    京东买手机降价

    在这个网站上,你可以上传照片或粘贴图片网址,网站会自动判断,照片是否是由AI生成的。上传的图片数量没有限制。

    另外,你也可以在Optic的推特账户@optic_xyz上发布或转发一张图片,或者加上#aiornot,便会得到一条回复,包括图片的置信度百分比。

    这家公司的首席执行官Andrey Doronichev表示,Optic的AI工具可以检查每张图像中人眼不可见的伪影,例如图像中亮度和颜色的变化。

    让人惊喜的是,该工具的准确率为95%。

    但是随着Midjourney等AI图像生成工具的升级迭代,AI or Not的准确率下降到了88.9%。

    比如,教皇这张图片,AI认为87%的概率是由人类做的。

    教皇穿着白色羽绒服的形象在Optic更新前被愚弄

    其实有网友表示,仔细去看这张图,就会发现有人工智能生成的明显迹象,包括几个明显模糊的细节区域:

    - 看似不完整的手正试图抓住一个不太像咖啡杯的东西,旁边还有污迹

    - 教皇佩戴的十字架也不是直角形状,上面还刻着一个像是用黏土雕刻而且坐着的耶稣

    - 眼镜与脸部的阴影不一致

    这几点都表明这是由人工智能生成的。它仅了解现实的表面,但不了解支配物理对象是如何相互作用的基本规则。

    除了Optic家的工具,为内容添加标签的人工智能公司Hive近来,也更新了自家的免费AI生成的内容检测器。

    这个AI工具在DALL-E、Stable Diffusion、Midjourney的数百万张图像上进行了训练。

    Hive预计,它能准确检测到大约95%的AI生成的图像,尤其在网上疯传的共享图像,往往比其他图像识别效果更好。

    CEO Kevin Guo称,当人们分享人工智能图像时,他们会选择最逼真的假图,所以人们很辨别什么是真的。

    左图是AI生成的图像,可以从两个手指和奇怪的击掌辨别,而在普通iStock照片中真实的样子如右图。

    与Optic一样,Hive在检测必应Image Creator的图像时,也失败了。

    不过,这些检测工具并非止步不前,随着AI图像整成模型的迭代,它们也会更新升级。

    其实,AI图像辨别不能仅仅依靠行业中的检测工具完成,更应该在模型训练时,设好护栏。

    许多人工智能图像生成器,也被限定了一些内容能否被生成的黑名单。

    比如,必应Image Creator会标记和阻止要求其创建知名公众人物图像的用户提示。

    Midjourney有human moderators,并正在推出一种用算法来调节用户请求的方法。

    还有DALL·E3技术报告中介绍道,当你让ChatGPT生成一些果图、或者涉及黑白人等图片时,输入的prompt直接被改写。

    给AI加水印,大厂在做了

    此外,数字水印也是目前增强生成式AI安全的重要手段之一,微软、谷歌等科技巨头已经在产品中使用。

    微软曾在9月Surface大会上,介绍了DALL·E3加持下的必应生成图像的能力。

    与此同时,为了确保图像不被滥用,微软团队使用加密方法为为每一张图像生成不可见的水印,包括创建时间和日期。

    任何人可以点开每张图片,轻易识别出是否是AI生成的。

    Meta还开源了Stable Signature,可将数字水印直接嵌入到AI自动生成的图片中。

    论文地址:https://arxiv.org/pdf/2303.15435.pdf

    值得一提的是,Stable Signature生成的数字水印不受裁剪、压缩、改变颜色等破坏性操作影响,能追溯到图片的初始来源。

    它可应用于扩散、GAN等模型,比如Stable Diffusion。

    还有谷歌在Google Cloud Next上,也发布了为AI生成的图像打上水印并进行检测和识别的SynthID。

    SynthID使用两个深度学习模型,分别用于水印和识别。它们可以在一组不同的图像上一起训练。

    组合模型针对一系列目标进行了优化,包括正确识别带水印的内容,并通过直观地将水印与原始内容对齐来提高水印的隐蔽性。

    SynthID生成的数字水印是直接嵌入到图像的像素中的,人眼无法察觉。但SynthID可以检测并识别它们。

    SynthID可以帮助评估图像由Imagen创建的可能性

    加州大学河滨分校电气和计算机工程教授Amit Roy-Chowdhury表示,仔细观察图像背景,我们可以用自己的眼睛更好检测假图像。

    不过,在AI模型加速迭代当下,想要有火眼金睛太难了。


    返回网站首页

    本文评论
    美媒:Pro级产品将成苹果秋季发布会最耀眼明星_mac pro新品发布会
    9月5日消息,苹果即将于美国当地时间9月7日举办2022年秋季新品发布会,预计其将发布旗舰级智能手机、智能手表以及耳机等新品。不过,苹果资深分析师马克·古尔曼(Mark Gurman)认为,...
    日期:10-31
    平均订单金额33.5万超宝马3系!极氪001九月交付8276台
      10月1日,极氪汽车官方消息,9月交付8,276台,创单月交付新高,其3季度交付20,464台,环比增长90%,累计交付45,481台。华为mate10通用钢化膜  同时,极氪001作为高端电动车,其订单平...
    日期:10-02
    带你穿越清明上河图!DragNUWA惊艳亮相:一拖一拽让静图秒变视频「《清明上河图》完整图视频」
    声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】微软提出文本图像轨迹条件视频生成模型DragNUWA,支持手绘轨迹驱动图像动态化,实现复杂运...
    日期:09-06
    二季度中国学习平板出货增长36.6%」-百度市场份额居首 「IDC
    【】8月8日消息,IDC学习平板季度跟踪报告显示,2023年第二季度,中国学习平板市场出货量约103万台,同比上升36.6%;上半年出货量约220万台,同比上升37.2%。vivo后置方形摄像头苹果屏...
    日期:09-18
    stable diffusion关键提示词怎么写? 一文读懂风格、艺术家、主题提示词
    如果您希望使用Stable Diffusion生成令人惊叹的图像,那么来对地方了。在本指南中,我们将探索制作优质提示的艺术,这些提示将在使用AI图像生成器中发挥最佳作用。废话少说,一起来...
    日期:04-26
    优酷2011年Q2财报:净收入增178% 毛利率连续为正(优酷2019年度财务报告)
      北京时间8月9日,中国第一视频网站优酷(NYSE:YOKU)公布了截至2011年6月30日未经审计的2011年第二季度财务报告,财报显示:2011年第二季度,优酷收入持续高速增长,净收入为人民币1...
    日期:07-22
    广东汕尾海滩突现大量生蚝!官方回应:建议尽量不要吃
    5月30日消息,对广大吃货来说,喝啤酒、吃烧烤是夏天的绝配了,而烤生蚝基本上就是桌桌必点的食物之一。华为,云端近日,一段广东汕尾市海丰县大湖沙滩捡生蚝的视频在网上爆火,话题疑...
    日期:05-31
    自拍照发到公司群「女生误将自拍发工作群:2分钟极速撤回50张 结果大型社死」
    相信不少人都有把个人隐私照片、资料发到公司群的尴尬境遇。微信、QQ虽然提供了撤回功能,但如果一次发出去太多美国 拜登 芯片9月22日,河南郑州。一女生在和闺蜜讨论要把拍的...
    日期:09-25
    苹果赢得《堡垒之夜》开发商应用商店垄断案上诉:并非垄断者「堡垒之夜apple」
    4月25日消息,当地时间周一,美国第九巡回上诉法院宣布维持一名联邦法官在2021年做出的一项裁决,该裁决主要支持苹果的应用商店政策,反对《堡垒之夜》开发商Epic Games发起的反垄...
    日期:04-25
    华为手机再一次出击全球!P60 Pro将在多个海外市场发布_华为发布p60系列
    快科技5月10日消息,日前,华为海外发布会在德国慕尼黑举行,面向海外推出了年度影像旗舰华为P60 Pro,以及华为折叠屏旗舰Mate X3。另外,5月10日至5月11日,华为还将在中东非迪拜、亚...
    日期:05-10
    OpenAI:ChatGPT等AI聊天技术可能会对美国19%工作岗位产生重大影响「美国聊天工具」
    3月21日消息,据外媒报道,美国人工智能研究公司OpenAI的一项新研究估计,像ChatGPT这样的人工智能(AI)聊天技术可能会对美国19%的工作岗位产生重大影响。OpenAI于2022年11月30日推...
    日期:03-24
    TCL征服足球王国,只因更“懂球”_TCL足球
      6月28日, 2019巴西美洲杯1/4淘汰赛拉开了序幕。作为2019年巴西美洲杯官方合作伙伴及巴西男子国家足球队官方合作伙伴,TCL不仅在美洲杯赛场高调“霸屏”,一场以“打破边界...
    日期:06-10
    小游戏重回买量主场
    声明:本文来自于微信公众号游戏价值论(ID:gamewower),作者:李亚捷,授权转载发布。本月初吉比特的临时股东大会上,董事长兼总经理卢竑岩在讨论环节发表了这样一个观点,“根据以往的趋...
    日期:09-28
    受网购影响,Bose决定关闭北美、欧洲、日本等共119家零售店
      1月16日消息 据外媒报道,目前越来越多的消费者进行在线购物,Bose公司计划在未来几个月关闭其在北美、欧洲、日本和澳大利亚的119家零售商店。   the verge报道称,Bose...
    日期:04-19
    荣耀畅玩20手机上市「荣耀畅玩40 Plus曝光:千元机新品 明晚发布!」
    10月13日19:30,荣耀X40 GT新品发布会即将召开,届时将推出一款主打游戏性能的LCD中端机——荣耀X40 GT。而根据数码博主的最新爆料,在此次发布会上,除了荣耀 X40 GT,荣耀还将推出...
    日期:10-17
    LG展示ARTCOOL Gallery画廊空调:自带27英寸大屏
    你见过与显示器二合一的空调么?近日,LG电子宣布,将在CES 2023上推出新的ARTCOOL Gallery画廊空调,这款产品在设计上与传统的空调有相当巨大的差异。据悉,这款空调搭载一块27英寸...
    日期:12-19
    华为云ModelArts2.0发布,让AI开发至简和自动化(华为人工智能开发框架)
      近日,德勤发布的《全球人工智能发展白皮书》预测,2025年世界人工智能市场规模将超过6万亿美元。得益于人工智能技术在最近十年的进展迅速,当前人工智能技术已步入全方位商...
    日期:12-19
    5分钟5000元,五一挤到天上了_五分钟到一分钱
    声明:本文来自于微信公众号开菠萝财经(kaiboluocaijing),作者 | 金玙璠,编辑 | 艾小佳,授权转载发布。“五一出行,怎么才能避开人山人海?”陈琳很早就开始琢磨。她最终决定,“飞到...
    日期:05-04
    百度推出AI入门必修课系列 7日打卡拿下强化学习(百度AI课程)
      风靡一时的《Flappy Bird》也算是虐遍人类玩家。游戏规则很简单,玩家在游戏时只需保持小鸟的飞行状态,并时刻躲避障碍物防止撞到即可。这个似乎“有些傻瓜”的游戏却让全...
    日期:07-14
    私域流量营销体系_打通营销“任督二脉”,让私域流量在中小企业流行起来
      “这个看似热闹的风口上,大多数中小企业要么沦为看客,要么落入‘微商’的窠臼。”随着春节临近,各大企业、品牌也开始了集中营销的热潮,私域流量再度成为企业营销的关键法...
    日期:12-09