您的位置:首页 > 互联网

谷歌DeepMind新方法Gecko,为测试AI图像生成器引入严格新标准_谷歌 deep mind

发布时间:2024-04-30 16:17:47  来源:互联网     背景:

划重点:

⭐ 谷歌 DeepMind 发布了新的基准 Gecko,揭示了当前文本到图像 AI 评估方法的缺陷,并引入了一个包含超过10万份人类评分的严格新标准。

deepl 谷歌

apple ipod 的好处

搜狗安卓浏览器

⭐ “Gecko” 基准通过2000个文本提示对文本到图像模型全面评估,同时提供了增强的自动评估指标,揭示了先前未被发现的模型优和劣势。

⭐ 研究人员希望通过 “Gecko” 基准的引入,能够更准确地评估和诊模型的能力,促进 AI 技术的进一步发展。

4月30日 消息:谷歌 DeepMind 最近的研究示了当前我们对文本到图像 AI 模型性能评估的隐藏局限性。在其发布在预印本服务器 ariv 上的研究中,他们引入了一种全新的方法称为 “Gecko”,承诺提供一个更全和可靠的基准,以评估这一蓬勃发展的技术。

研究团队在其题为 “用 Gecko 审视文本到图像评估:对度量、提示和人类评分” 的论文中警告称:“虽然文到图像生成模型已经变得无处不在,但它们并不一定生成与给定提示相一致的图。” 他们指出,目前主要用于评估 DALL-E、Midjourney 和 Stable Diffusion 等模型能力数据集和自动度量并不能全面反映实际情况。

iphone哪几款系列最值得入手

iphone6s参数配置详细

小规模的人类评估提供了有限的解,而自动度量可能会忽略重要细微之处,甚至与人类评委产生分歧。 为了揭示这些问题,研究人员开发了 “Gecko”—— 一个新的基准套件,它为文本到图模型提供了更高难度的测试。Gecko基准通过2000个文本提示对模型进行全面考核,探究各种技能和复杂程度。它将这些提示分成具体的子技能,超越模糊的类,以准确找出限制模型的确切弱点。

研究人员还收集了对数个领先模型生成的图像进行的超过10万份人类评分。这一基准可以揭示模型性能差距是源自模型真正的局限性、模糊的提示,还是评估方法的不一致。

“Gecko” 基准还采用了一个基于问的增强自动评估指标,与人类判断更为相关。当用于比较新基准下的最先进模型时,这一组合揭示了先前未被发现的模型优势和劣势。 研究人员希望他的工作能够证明使用多样的基准和评估方法来真正了解文本到图像 AI 在实际部署前能做什么,不能做什么的重要性。他们计划免费公开 “Gecko” 代码和数据,推动进一步的进展。 因此,尽管那些看似令人印象深刻的作品可能乍一看令人印象深刻,但我们仍然需要严格的测试来区分真假。Gecko为我们展示了如何做到这一。

谷歌旗下公司deepmind连续六年亏损,因为ai人才太贵了

论文:https://arxiv.org/pdf/2404.16820


返回网站首页

本文评论
一场直播卖出7个亿,广东夫妇是怎么做到的「一场直播卖出7个亿,广东夫妇是怎么做到的」
声明:本文来自于微信公众号 电商头条(ID:ecxinwen),作者:李松月,授权转载发布。广东夫妇单场带货GMV破7亿今年双十一,罗永浩、俞敏洪、刘畊宏等抖音“顶流”相继宣布前往淘宝直播...
日期:11-08
工控电脑主机回收「工控电脑主机」
是针对工业领域专门设计的计算机主机,其主要应用于各种工控系统,如固定式工控设备、机器人控制系统、物流控制系统等。相比普通计算机主机,具有更高的实时性、稳定性和可靠性。...
日期:05-29
我在跨境电商仓库,当了一天黑五打工人_跨境电商中心仓
声明:本文来自于微信公众号字母榜(ID:wujicaijing),作者:马舒叶,授权转载发布。红色的圣诞帽、亮色的圣诞彩灯、亮晶晶的首饰,一经扫码便被投掷向所属的9个分拣筐之一,站在货架前“播...
日期:12-05
抖音严打虚假摆拍,伪造故事误导公众将被无限期封禁「抖音上虚假」
3月30日消息,近期,网上部分剧情演绎类视频作品网络传播过程中,因为前后语境缺失,被误以为是真实事件,造成了不良影响。此外,还有极个别创作者试图利用虚假人设、情节等编造不实信...
日期:03-30
苹果发布iphone13优惠「iPhone14预售价现身:加价卖,6699元起,新增Plus型号」
  苹果已宣布将于北京时间9月8日凌晨1点举办“超前瞻”特别活动。据微博博主;@李昂昂昂啊;等晒出的图片显示,一些线下店开启了iPhone14系列的预售,不出意外就是前期的黄牛价...
日期:09-06
腾讯的视频号有收入吗「腾讯日赚4亿重燃电商梦,视频号带货大变局终于要来了」
声明:本文来自于微信公众号 亿邦动力(ID:iebrun),作者:董金鹏,授权转载发布。2023年,腾讯日赚4.3亿元,视频号终于扛起“全村的希望”。一月底,马化腾在腾讯年会上称,视频号不负众望,...
日期:03-22
中国移动咪咕助力打造《敦煌奇境》XR沉浸互动空间
通信世界网消息(CWW)近日,由2023年中国金鸡百花电影节执委会主办,中国移动通信集团福建有限公司、中国移动咪咕公司、厦门电影节有限公司承办,德化文旅集团有限公司独家战略合作...
日期:11-11
旧金山将对马斯克改造推特总部事件展开新调查
 5月22日早间消息,据报道,因六名前员工对推特公司和埃隆·马斯克提起诉讼,推特总部所在的美国旧金山市决定对马斯克改造总部的计划展开新调查。微软teams验证的耳机 此前,这六...
日期:09-27
为什么懂行人宁愿买二手iPhone 14 Pro,也不买全新iPhone 15?_为什么不买二手苹果手机
俗话说战报会骗人,但是战线不会。如何评价iPhone 15值不值得买,二手市场可以找到最真的答案。目前的二手手机市场,形成了一种微妙的平衡:iPhone 14 Pro 256GB版本,95新大概是6100...
日期:10-12
苹果今年或推出低价AirPods 率先在印度工厂组装_苹果20w印度制造
4月2日 消息:据最新消息,苹果即将在今年晚些时候推出一款价格更为亲民的AirPods耳机,这一消息来自于供应链分析师Jeff Pu的透露。这款新耳机将由富士康的子公司负责制造,并率先...
日期:04-02
全国人大代表、河南移动总经理楼向平:  加强人工智能可信治理,以新质生产力推动高质量发展
通信世界网消息(CWW)3月5日,十四届全国人大二次会议在北京人民大会堂开幕。国务院总理李强在政府工作报告中提出,大力推进现代化产业体系建设,加快发展新质生产力。深化大数据、...
日期:03-06
开源android系统「官宣:Android 13正式开源 源代码公开!华为等随便用」
  新酷产品第一时间免费试玩,还有众多优质达人分享独到生活经验,快来新浪众测,体验各领域最前沿、最有趣、最好玩的产品吧~!下载客户端还能获得专享福利哦!工业恒温系统  And...
日期:10-27
悦达起亚被曝管理岗轮休 一休就一年!官方回应_悦达起亚国企
日前,有媒体报道,一份江苏悦达起亚有限公司内部通知显示,为实现电动化转型,业务及人员结构需要整合。该公司安排管理岗员工分批次轮休,第一批轮休时间长达一年,从2023年6月1日至20...
日期:05-10
诺兰首获金球奖最佳导演 第81届金球奖公布:《奥本海默》包揽多项大奖
近日,第81届美国电影电视金球奖获奖名单正式揭晓。备受瞩目的电影《奥本海默》成为当晚的最大赢家,横扫多项大奖。在本次金球奖中,《奥本海默》共荣获5项大奖,包括最佳影片、最...
日期:01-08
特斯拉添加手机钥匙视频「特斯拉APP升级:无卡片钥匙也可以匹配手机钥匙了」
快科技4月24日消息,特斯拉APP迎来4.20.69更新,现在,没有卡片钥匙也可以匹配手机钥匙了。操作只要两步:1、打开Tesla App,靠近车辆时,在主页面点击启用被动式进入和远程控制”;2、...
日期:04-24
播放时长最长内容竟是高等数学 年轻人爱上用B站学习?
5月12日消息,年轻人的生活方式中,刷B站已经成为离不开的一部分,在日前举行的上海网络视听内容创作者大会上,哔哩哔哩董事长兼CEO陈睿表示,在B站上播放时长最长的内容是高等数学。...
日期:09-29
青葱手机官网_青葱论坛
是中国移动旗下的一款移动智能终端,作为中国移动推出的品牌,青葱手机在国内手机市场已经拥有一定的用户基础,具有实力和品牌保证,也因此备受消费者的信赖。下文将就的相关信息进...
日期:05-30
Steam冬促已过一半!三款史低热销3A大作耕升RTX 40显卡全面测试!
Steam冬促已经开启有一段时间,作为全年中折扣力度最 大的一回,相信许多玩家已经满载而归。但也有部分小伙伴可能因为电脑配置等问题还在犹豫,今天耕升就为大家带来三款Steam冬...
日期:12-29
微软希望招募Android开发者参与WP研发_加入微软开发者
北京时间6月12日,据国外媒体报道,微软正在试图招募Android应用开发者来帮助研发Windows Phone应用程序。公司已经发布了一款Windows Phone API绘画工具来帮助Android开发者在...
日期:07-30
能源行业刮起“数智风” 数字化转型助推构建新型电力系统(打造面向未来的电力企业:数字化转型的成功之路)
本报记者;向炎涛;见习记者;贺王娟   “双碳”目标背景下,构建以新能源为主体的新型电力系统已经成为电力行业转型发展方向。多位接受《证券日报》记者采访的业内人士认为,随...
日期:08-20