您的位置:首页 > 互联网

商汤科技提出FouriScale 实现生成图像尺寸、分辨率自由_图像识别认准商汤科技产品

发布时间:2024-04-08 20:56:38  来源:互联网     背景:

4月8日 消息:近日,来自香港中文大学 - 商汤科技联合实验室等机构的研究者们提出了 FouriScale,旨在通过一种全新方法实现生成图像的尺寸和分辨率自由。

10月微信视频号全面开放了吗

扩散模型因其卓越的性能,已逐渐超越GAN和自回归模型,成为生成式模型的主流选择。这些模型通常在特定分辨率下进行训练,以确保在现有硬件上实现高效处理和稳定的模型训练。然而,当这些预训练的扩散模型在超出训练分辨率时生成图像,常会出现模式重复和人工伪影问题。

图文识别商汤科技咨询

项目地址:https://top.aibase.com/tool/fouriscale

论文地址:https://arxiv.org/abs/2403.12963

宝马5系价格和奥迪a7l哪个好

为了解决这一问题,研究者们深入研究了扩散模型中常用的UNet结构的卷积层,并从频域分析的角度提出了FouriScale。

该方法通过引入空洞卷积操作和低通滤波操作来替换预训练扩散模型中的原始卷积层,旨在实现不同分辨率下的结构和尺度一致性。配合“填充然后裁剪”策略,FouriScale能够灵活生成不同尺寸和长宽比的图像。此外,该方法无需任何离线预计算,具有良好的兼容性和可扩展性。

FouriScale的核心在于空洞卷积和低通滤波的结合。空洞卷积保证了跨分辨率下的结构一致性,而低通滤波则确保了尺度一致性,过滤掉高频分量,去除空间下采样后的频率混叠问题。

此外,FouriScale还能够适应于任意尺寸的图像生成,通过“填充然后裁剪”的方式,以及将FouriScale作为引导,保证了图像质量。

快团团 母婴

实验结果表明,FouriScale在利用预训练扩散模型生成高分辨率图像方面取得了显著提升。作者测试了三个文生图模型(包括SD1.5,SD2.1和 SDXL1.0),生成四种更高分辨率的图像。

在Laion-5B上随机采样的图文对测试结果显示,他们的方法在各个预训练模型,不同分辨率下都获得了最优的结果。定性试验结果也显示,该方法能够保证图像生成质量与一致的结构。

FouriScale的提出,为增强预训练扩散模型生成高分辨率图像的能力提供了新的思路。通过空洞卷积和低通滤波操作改善了不同分辨率下的结构和尺度一致性,解决了重复模式和结构失真等关键挑战。

图文识别商汤科技咨询

采用“填充然后裁剪”策略并利用FouriScale作为指导,增强了文本到图像生成的灵活性和生成质量,同时适应了不同的长宽比生成。定量和定性的实验对比表明,FouriScale能够在不同预训练模型,不同分辨率下都能够保证更高的图像生成质量。

凡客最后怎么了


返回网站首页

本文评论
搜索算法大升级,微软Windows 10 20H1慢速预览版19025推送
  11月21日消息 上周,微软发布了新的Windows 10 20H1快速预览版19025。据悉在该20H1版本系统中官方优化了Windows Search indexer功能并修复了其他的错误。   现在微软...
日期:04-04
一月裁员8万多人!全球科技行业裁员名单公布,公司越大裁的越多,X一次性裁掉一半员工!
新智元报道编辑:润【新智元导读】经济寒冬加剧全球科技行业裁员潮,各大企业裁员人数名单汇总。巨头裁员人数触目惊心,全行业无一能够幸免。今年的科技行业的大裁员仍在持续!2023...
日期:08-19
小米2024年度机皇!曝小米14 Ultra最快2月亮相_小米14多少钱
快科技1月24日消息,博主数码闲聊站暗示,小米14Ultra最快会在2月底登场,这将是小米今年最强悍的影像旗舰。据悉,小米14Ultra后置5000万主摄、5000万直立长焦、5000万潜望长焦以及...
日期:01-25
特斯拉德国柏林工厂突发火灾,什么原因?_特斯拉储能电站火灾
德国当地时间9月26日凌晨3时许,特斯拉柏林超级工厂突发火灾。事故发生后,特斯拉自己的12名消防员先进行了抢险,但意识到已经无法控制火势后便通知了消防部门。蔚来电池升级100k...
日期:10-05
一加Ace Pro《原神》限定版手机上架 24日开售_一加原神礼盒
今天一加正式官宣,将在10月24日晚召开发布会,会中将会正式带来一加Ace Pro的《原神》限定版,作为目前手游中对手机性能要求最高的游戏,《原神》和一加的官方限定款手机非常值得...
日期:10-24
支付宝2023年“集五福”来了 网友:两块钱的大项目「支付宝集五福2020多少亿」
还有十来天就要过年了,一年一度的支付宝集五福”活动还是来了。支付宝宣布,集五福”活动将于2023年1月10日0点正式开启,届时在支付宝搜索集五福”即可收集五福卡片。活动时间为...
日期:01-09
淘特上线两款智能新品“微店铺”和“心动搜索”_「淘特品牌店」
11月16日消息,淘特宣布上线两款智能产品:淘特“微店铺”和“心动搜索”。据介绍,淘特“微店铺”和“心动搜索”基于淘特搜索逻辑研发出的体验新功能,通过商业创新和交互创新,提升...
日期:11-26
年终政企采购季来了 苏宁大客户中标中车集团2020年办公集采项目
  12月14日,苏宁大客户以综合排名第一的成绩成功中标中车集团2020年的办公用品集采项目。通过易企购商城对接,为中车集团总部及遍布全国的46个一级子公司提供办公电脑、电...
日期:11-03
美团一季度拟招1万人 显著高于去年同期_美团校招人数
凤凰网科技讯 2月7日消息 美团正式启动2023年第一波社会招聘。此次招聘将提供包括技术、商业分析、产品、供应链等类型,开放了超2200个具体岗位,工作地遍布北京、上海、深圳、...
日期:02-07
三星在最新的One UI 5.0测试版中复制了iOS 16的锁屏定制功能_三星one ui使用技巧
iOS 16的最主要功能之一是锁屏定制功能。该功能与iPhone 14 Pro上的"灵动岛"相结合,为用户如何定制锁屏和创造真正属于自己的个性化内容提供了新的思路,从一开始推出就收到认...
日期:09-28
前小米9号员工打造!全球首款安卓桌面机器人接入讯飞星火GPT:中文流畅对话
快科技6月26日消息,前不久,前小米第9号初创成员李明创业成立的乐天派公司,发布全球首款Android桌面机器人乐天派桌面机器人。日前,李明表示,乐天派桌面机器人首次接入讯飞星火GPT...
日期:06-26
网易云音乐TV版发福利!150小时电视端会员听歌时长免费领
1月17日消息,今日,网易云音乐官方宣布推出春节福利会员免费领”,参与设备为TV端。小鹏汽车港股估值2020美国硅谷大裁员据介绍,1月17日至2月17日,首次登录网易云音乐TV版,即可免费...
日期:01-17
助力年轻开发者共享5G+云+AI红利,华为云DevRun Summit:Login 2020开启报名(华为云开发者大会)
  近两年,5G、云计算和AI成为各行各业高频出现的词汇。伴随着这些新技术的兴起,世界正进入万物互联的智能时代。新技术的相互融合,将会产生类似核裂变的效应、释放出巨大的...
日期:05-25
vue哪年开始广泛使用的_为什么 Vue 更符合这个时代的大势所趋
  不久前,尤雨溪发布了 Vue 3.0 Beta 版本。   发布之后我们对社区里的前端开发者做了一次调查沟通,大家普遍认为 Vue 已经具备了商业项目开发的必备条件,如语法精炼、优...
日期:07-14
中兴通讯与中国联通携手成立绿色节能创新实验室_中兴通讯 创新
通信世界网消息(CWW)近日,中兴通讯与中国联通联合创办的绿色节能创新实验室在中兴通讯上海研发中心正式揭牌成立。中兴通讯副总裁施嵘、中国联通智网创新中心总经理张陶冶共同...
日期:11-01
中国移动实现双工技术突破_移动通信技术中采用了哪些双工技术
近日,中国移动在中兴通讯基站设备上完成了全球首次UDD(Unified time and frequency Division Duplex)技术组网验证,迈出了该技术从理论研究到应用落地的坚实一步。UDD是移动通信...
日期:03-19
realme真我gt5g骁龙888「2999元起!真我GT5发布:骁龙8 Gen2超窄边框直屏 240W/150W快充」
真我GT5正式发布,售价方面分为两个版本。150W闪充版本拥有12GB 256GB和16GB 512GB两种配置,售价分别为2999元和3299元。而240W闪充版本则是24GB 1TB配置,售价为3799元。作为安...
日期:08-28
塌房再反转,销售额暴涨10倍,淀粉肠还是一门好生意吗?_网红淀粉肠
声明:本文来自于微信公众号 新榜(ID:newrankcn,作者:松露,授权转载发布。淀粉肠“塌房”,一波三折。自3月15日被曝光淀粉肠里含有“人不能吃”的鸡骨泥后,这个顶流网红小吃在5天...
日期:03-21
希沃连续四年助力酒泉市“互联网+教学创新”活动(希沃 课堂活动)
  教育信息化的发展进入2.0时代,对教师教学能力提出了新的要求。《教育信息化2.0行动》中提出,要大力提升教师信息素养,推动教师主动适应信息化、人工智能等新技术变革,积极...
日期:08-09
联想联萌看见计划升级:持续打造绿水青山 共创公益消费新范式
为积极践行国家生态文明建设的发展目标,做绿水青山就是金山银山理念的传播者和践行者。 2023 年 8 月 19 日,由联想中国客户管理中心发起的“联萌看见计划 共创美好” 828 公...
日期:08-22