您的位置:首页 > 互联网

从马赛克到高清图,AI生图能力变强了,但如何取得美感与失真的平衡?

发布时间:2023-10-10 01:52:53  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。

让图像看起来更好的 AI 工具,往往会导致图像失真,而让图像看起来更真实时,往往会缺少美感,这一问题该如何权衡?

chinajoy三星展台

在悬疑和科幻作品中,我们经常能看到这样的场景:计算机屏幕上显示出一张模糊的照片,然后调查人员要求增强图像,然后图像就神奇的变得清晰,揭示出重要线索。

这看起来很棒,但其实几十年来这一直是完全虚构的情节。即使在 AI 生成能力开始增长的一段时间内也很难做到:如果你只是单纯地将图像放大,它会变得模糊。确实会有很多细节,但都是错误的,英伟达应用深度学习研究副总裁 Bryan Catanzaro 说道。

不过,研究人员最近开始将 AI 算法融入图像增强工具,使这一过程变得更加简便和强大,但从任何图像中检索的数据仍然存在限制。但随着研究人员不断推动增强算法的发展,他们正在寻找应对这些限制的新方法,甚至找到了克服这些限制的方法。

过去十年,研究人员开始使用生成对抗网络(GAN)模型来增强图像,这种模型能够生成详细而令人印象深刻的图片。

以色列特奥尼恩理工学院的电气工程师 Tomer Michaeli 表示:图像突然变得好看多了。但他同时惊讶地发现,由 GAN 生成的图像显示出很高的失真水平,失真水平衡量了增强图像与所显示的底层现实之间的接近程度。GAN 生成的图像看起来漂亮自然,但实际上它们在虚构或幻想那些不准确的细节,这导致了高度的失真。

Michaeli 观察到照片修复领域分为两大类:一种展示了漂亮的图片,其中许多是由 GAN 生成的。另一种展示了数据,但没有展示很多图片,因为看起来不好看。

2017年,Michaeli 和他的研究生 Yochai Blau 更正式地探究了各种图像增强算法在失真与感知质量上的表现,使用了与人类主观判断相关的感知质量已知度量。正如 Michaeli 所预期的,一些算法的视觉质量非常高,而其他一些算法非常准确,失真很低。但是没有一个同时具备这两种优势,你必须选择其中之一。这被称为感知失真权衡。

Michaeli 还向其他研究人员发起挑战,要求他们提出能够在给定失真水平下产生最佳图像质量的算法,以便在漂亮图片算法和良好统计数据算法之间进行公平比较。从那时起,数百名 AI 研究人员提出了他们的算法的失真和感知质量,并引用了描述这种权衡的 Michaeli 和 Blau 的论文。

2018苹果手表

有时感知失真权衡的影响并不可怕。例如,英伟达发现高清屏幕不能很好地渲染一些低清视觉内容,因此在2023年2月份推出了一款使用深度学习来提升流媒体视频画质的工具。在这种情况下,英伟达的工程师选择了感知质量而不是准确性,他们接受了这样一个事实,即当算法提升视频分辨率时,它会生成一些原始视频中没有的视觉细节。

模型是在进行幻想。这完全是猜测,Catanzaro 说道。超分辨率模型大部分时间猜错都没关系,只要是一致的就行。

小鼠大脑血流的视图(左)以及使用 AI 工具提高图像质量和准确性后得到的相同视图。图源:杜克大学 Junjie Yao、Xiaoyi Zhu 。

特别是,研究和医学领域的应用会要求更高的准确性。AI 技术在成像方面取得了重大进展,但杜克大学的生物医学工程师 Junjie Yao 表示:它有时会带来不希望的副作用,比如过度拟合或添加虚假特征,因此需要极其谨慎地对待。

去年,他在论文中描述了如何利用 AI 工具改进现有的大脑血流和新陈代谢测量方法,同时在感知失真权衡的准确一侧安全运行。

绕过从图像中提取多少数据的限制的一种方法是简单地合并来自更多图像的数据。此前,通过卫星图像研究环境的研究人员已经在整合不同来源的视觉数据方面取得了一些进展:在2021年,中国和英国的研究人员将来自两种不同类型卫星的数据融合在一起,以更好地观察刚果盆地的森林砍伐情况。刚果盆地是世界上第二大热带雨林,也是生物多样性最丰富的地区之一。研究人员获取了两颗 Landsat 卫星的数据,这些卫星数十年来一直在测量森林砍伐情况,并使用深度学习技术将图像的分辨率从30米提高到10米。然后,他们将这组图像与两颗 Sentinel-2卫星的数据融合在一起,这些卫星具有稍有不同的探测器阵列。他们的实验表明这种综合图像使得比单独使用 Sentinel-2或 Landsat-7/8图像时能够检测到11% 至21% 更多的受干扰区域。

如果不能直接突破,Michaeli 提出了另一种硬性限制信息可获取性的方法。与其就如何增强低质量图像寻求确定的答案,不如让模型展示对原始图像的多种不同解释。在论文《Explorable Super Resolution》中,他展示了图像增强工具如何向用户提供多个建议。一个模糊的、低分辨率的穿着似乎是灰色衬衫的人的图像可以被重建成更高分辨率的图像,在这个图像中,衬衫可以是黑白垂直条纹、水平条纹或格子,所有这些都同样合理。

在另一个例子中,Michaeli 拍摄了一张低质量的车牌照片,并使用 AI 图像增强处理,结果显示车牌上的数字1最像是0。但当图像经过 Michaeli 设计的不同的、更加开放式的算法处理时,这个数字看起来同样有可能是0、1或8。这种方法可以帮助排除其他数字,而不会错误地得出这个数字是0的结论。

我们可以减轻这些幻觉,但是那个强大的、解决犯罪的增强按钮仍是一个梦想。

2018年3月,国产手机出货量2699.5

在不同的领域中,各种学科以各自的方式在感知失真权衡方面进行探讨,从 AI 图像中能够提取多少信息,以及能够信任这些图像的程度仍然是核心问题。

我们应该牢记,为了输出这些漂亮的图像,算法只是编造了细节,Michaeli 说道。

原文链接:https://www.quantamagazine.org/the-ai-tools-making-images-look-better-20230823/


返回网站首页

本文评论
小米河南第一家门店「里程碑!河南小米之家第1000家店开业」
据快科技7月15日报道,小米公司的官方直营零售体验店——小米之家,不仅提供最新款产品的销售,还提供小米员工的操作指导和玩机技巧等服务。日前,小米公司河南省分公司总经理王腾...
日期:07-15
被骗好久!国人最爱 长期喝粥伤胃危害大?专家:会使消化能力变差
对于不少国人来说,喝粥一定是躲不开的,但是偶尔喝还可以,长期就要有问题。近日,长期喝粥伤胃危害大”上了热搜,不少网友因为这个论调也是吵翻,有人觉得没有问题,也有人觉得确实是危...
日期:10-05
网易云音乐大变局 迎来新任CEO 创始高管悉数离场「网易云音乐董事长」
  |四大金刚  2013年夏秋之交的北京,五道口。  网易北京总部还没搬去西北旺的后厂村,仍在“宇宙中心”的清华科技园办公,5年后将担任网易云音乐内容运营副总裁的丁博和同...
日期:10-05
“云加速”来了  搜狗高速浏览器更快、更聪明_极速浏览器是什么
  浏览器又有了重大的技术突破,日前,搜狗高速浏览器重磅推出了“云加速”技术,让网页浏览更快、更聪明,并且无论使用哪个版本,都拥有强大的“自学习”能力,享受浏览的极速体验...
日期:07-29
曝华为nova 11系列本月发:把P60上的卫星通信功能下放了_华为卫星通信手机
快科技4月8日消息,博主厂长是关同学透露,华为nova 11系列会在本月发布,传闻发布时间是4月17日。本次发布会将会推出nova 11、nova 11 Pro等机型,根据曝光的渲染图,nova 11系列采...
日期:04-09
小米mix alpha环绕屏概念手机「小米MIX Alpha续作要来了?小米环形曲面屏手机专利获批」
小米公司最近一项手机外观设计专利获批公布,该专利的设计与之前推出的小米MIX Alpha非常相似。这款专利的手机外观采用环形曲面屏幕设计,整机几乎全是屏幕。同时,它的前后摄像...
日期:06-20
外媒制作iPhone 12 Pro高清渲染图:5G/小刘海、重回iPhone 4边框(iPhone 13 Pro概念渲染)
  近日,iPhone 12的消息频频曝光,作为苹果首款5G iPhone,其外形变化备受关注。结合已知靠谱爆料,外媒PhoneArena制作了一组iPhone 12 Pro的高清渲染图,一起来感受下。   据...
日期:09-12
特斯拉以600多万美元和解集体诉讼 屋顶太阳能安装引纠纷_特斯拉房屋太阳能
北京时间7月12日早间消息,据报道,特斯拉同意支付600多万美元和解一宗集体诉讼案,该案由Solar Roof客户发起。2021年客户已经同意让特斯拉安装太阳能系统Solar Roof,但Solar Roof...
日期:09-21
马斯克向推特员工发“最后通牒”:要么高强度工作 要么走人
11月17日消息,据国外媒体报道,美国当地时间周三,推特新老板马斯克要求员工签署一份备忘录,要么承诺留在公司帮助打造新推特,要么就拿遣散费走人。据悉,马斯克深夜向员工发送一封内...
日期:11-19
倍思D05头戴式游戏耳机评测:听声辨位让玩家快速赢得战斗
  游戏玩家对于音质的体验是苛刻的,他们已经无法满足普通的耳机那种沉闷的听音感受。随着技术的发展进步,现在市场上已经出现了一些专门为游戏玩家而打造的游戏耳机。不过,...
日期:11-24
智能吉他有用吗「拿火发布 LAVA ME play,智能吉他打穿两千元市场!」
时隔一年半,拿火再发新品智能吉他 LAVA ME play 和重量级系统更新 HILAVA 2.0 Beta。这次拿火大幅增强了系统功能,又将智能吉他的价格门槛打到 1,999 元!这也许是拿火的 model...
日期:04-19
每日优鲜美股盘前跌20%「每日优鲜 美股」
  财联社9月29日电,每日优鲜美股盘前跌20%,每日优鲜两公司被执行130万;浙江公司注销,原因为决议解散。苹果是必需品吗...
日期:10-04
小鹏高管炮轰理想榜单造假 曾经的“苦逼三兄弟”反目了?_小鹏和理想是一家吗
 文 | 新浪科技 张俊 2020年,小鹏汽车创始人在微博晒出了一张与理想汽车创始人李想、蔚来汽车创始人李斌的合影,并配文道:“三个苦逼,在忆苦思变。” 如今,造车三兄弟可能已经...
日期:09-21
支付宝2023集五福活动正式开启 请收下这份集福卡最全攻略_支付宝集五福活动2021年开启时间几点
1月10日 消息:今天早晨,“集五福”相关话题登上热搜榜,引发网友热议。支付宝的“集五福”活动已于今日凌晨0时正式启动,今年是该活动的第八个年头。mate30pro后盖是什么材质完...
日期:01-10
小米平板6曝光:骁龙8+芯片 OLED屏「小米电视6 oled面板」
今天下午,小米代码库中出现了小米平板6和小米平板6 Pro的身影,有消息称新机将在1月正式发布。京东和申通的关系小米平板6代号pipa(琵琶),型号M82,处理器升级到了骁龙870,小米平板6...
日期:12-19
B站粉丝最多的人!罗翔回应连续3年入选百大:愧不敢当_罗翔b站号为什么这么多
日前,B站公布了2022年百大UP主,罗翔说刑法”再次入选。此前罗翔已经连续两届荣获了2020百大UP主、2021百大UP主两大荣誉。对于三连冠”,罗翔老师表示,感恩同学们的鼓励。再次入...
日期:01-15
S23 Ultra将首发2亿像素HP2传感器 影像大升级_三星Galaxy
据此前多方透露,三星将于2月1日(北京时间2023年2月2日凌晨2点)举行Galaxy Unpacked活动,届时旗下新一代年度旗舰Galaxy S23系列将正式与大家见面。随着发布会的日益临近,官方关于...
日期:09-20
网易严选推出“月汐桂语”中秋主题系列商品
  近年来,国风国潮元素接连火爆,融入了当下时尚精神与中国传统文化的创新设计俨然成为了当下的顶级流量。今年中秋,网易旗下自营生活家居品牌网易严选推出了 “月汐桂语”...
日期:07-25
AVG通过VB100的Linux测试
  近日,Virus Bulletin公布了最新的2011年2月通过VB100的杀毒软件名单。AVG等厂商顺利通过Ubuntu Linux Server 版本下的测试,由于此次测试是在Linux环境下进行的,多数杀毒...
日期:07-26
中共中央网信办「最新13条要求!中央网信办加强“自媒体”管理」
通信世界网消息(CWW)日前,中央网信办发布了关于加强“自媒体”管理的通知,要求各地网信部门开展对资讯、社交、直播、短视频、知识问答、论坛社区等类型网站平台的督导检查,总计...
日期:07-11