您的位置:首页 > 互联网

图片质量媲美Midjourney、SDXL?PixArt训练成本减少90%_picsart照片( picsart photo studio)

发布时间:2023-11-10 13:13:05  来源:互联网     背景:

要点:

  • PixArt-α是一款基于Transformer的文本到图像生成模型,具有竞争力的图像生成质量,且训练成本明显低于现有大规模文本到图像模型。

  • PixArt-α采用了三项核心设计:训练策略分解,高效的T2I Transformer,以及使用高信息密度的数据进行训练,从而实现高分辨率图像合成,并在训练成本上取得显著节约。

  • PixArt-α不仅能够生成高分辨率图像,而且在复杂文本提示下表现出色,与现有系统如Stable Diffusion XL、Imagen和DALL-E2相比,既能匹敌其质量,又更加高效。

11月10日 消息:PixArt是一款基于Transformer的文本到图像生成模型,其图像生成质量可与最先进的图像生成器(例如Imagen、SDXL,甚至Midjourney)竞争,达到接近商业应用的标准。这种新模型使用Transformer扩散模型,可以比使用UNet模型训练便宜90%。它还支持高达1024px 分辨率的高分辨率图像合成,且训练成本较低。

picsart照片( picsart photo studio)

picsart照片( picsart photo studio)

项目地址:

https://huggingface.co/docs/diffusers/main/en/api/pipelines/pixart?utm_source=talkingdev.uwl.me

该模型通过三项核心设计实现了高分辨率图像的合成,同时显著降低了训练成本。首先,采用训练策略分解,将训练过程分为三个步骤,分别优化像素依赖性、文本-图像对齐和图像审美质量。其次,引入了高效的T2I Transformer,通过在Diffusion Transformer中加入交叉注意力模块,注入文本条件并简化计算密集型的类别条件分支。最后,利用高信息密度的数据进行训练,强调文本-图像对中概念密度的重要性,并借助大型视觉语言模型自动标注密集伪标题,助力文本-图像对齐学习。

PixArt不仅在高分辨率图像合成上表现出色,还能有效遵循复杂文本提示,使其在图像生成领域具有广泛的应用前景。与现有系统相比,如Stable Diffusion XL、Imagen和DALL-E2,PixArt-α不仅匹敌其生成质量,而且在训练效率上更为高效。

实验证明,PixArt的训练速度仅占Stable Diffusion v1.5训练时间的10.8%(675vs.6,250A100GPU天),节省近30万美元和减少90%的CO2排放。与更大的SOTA模型RAPHAEL相比,训练成本仅为1%。总体而言,PixArt-α在图像质量、艺术性和语义控制方面都表现卓越,为AIGC社区和初创公司提供了加速从零开始构建高质量低成本生成模型的新视角。

一加11pro配置详细

在使用PixArt时,可以通过设定不同的尺寸范围来获得最佳结果,作者推荐了一些尺寸范围。此外,PixArt支持高分辨率图像合成,最高可达1024像素,且训练成本较低。因此,PixArt不仅在技术上取得了显著进展,而且在实际应用中具有巨大的潜力。


返回网站首页

本文评论
小米平板5骁龙860「升级USB 3.0!小米平板6系列配置确认:骁龙870/8 双芯 全系升级分辨率」
近日,小米官方正式宣布将于4月18日19点发布全新的小米平板6系列。最新爆料显示,小米平板6系列全系定位升级,标准版采用金属机身和更高的分辨率,搭载骁龙870处理器。而小米平板6...
日期:04-14
日本汽船「日本载近3000辆汽车货轮在荷兰海域起火:多车企回应」
快科技7月29日消息,近日,一艘载有约3000辆汽车的货船在荷兰海域起火,目前已导致一人死亡、多人受伤。2019tcl电视65寸什么型号的好据称,该货轮隶属日本正荣汽船株式会社,在巴拿马...
日期:07-29
"一个破坏性的行为" 「特斯拉Model」-3焕新版转向灯按钮遭吐槽_特斯拉model3转向灯怎么一直开
9月6日消息,特斯拉最近推出了其广受欢迎的Model 3焕新版,特斯拉拥趸者们对这款电动轿车的新外观和更长续航里程赞叹不已。然而,也有许多人不喜欢特斯拉把转向灯移到方向盘按钮...
日期:09-11
小红书暗藏玄机「小红书秘密筹备大模型团队 此前曾上线AI绘画工具“Trik”」
5月8日 消息:据36氪今日报道,从3月份开始,小红书就成立了一个独立的大模型团队,该团队的核心员工来自广告业务的NLP技术团队。目前,该部门在内部保密,并且在员工系统中直接隐藏。...
日期:05-08
双黄蛋!胡歌大鹏获上海电影节影帝「胡歌电影节发言视频」
6月17日消息,据媒体报道,第25届上海国际电影节金爵奖颁奖典礼正式举行。胡歌、大鹏分别凭借《不虚此行》《第八个嫌疑人》中的出色表现,摘得最佳男演员的奖项。其中胡歌参演的...
日期:06-19
UCloud推出Rome全球网络加速产品,实现全球多云互联
  我们已经身处数字经济时代,数字经济要发展,自然离不开产业政策的扶持,以及产业生态的做强。不过从技术的维度来看,应用层面的“提速”才是一系列外部条件推动数字经济发展...
日期:09-11
华为:网传“华为将发射1万枚6G移动低轨卫星”纯属造谣
本文转自【华为集团官方账号】;10月23日晚,华为集团官方账号发文表示:网传“华为将发射1万枚6G移动低轨卫星”纯属造谣,造谣者毫无根据,无事生非,在多个平台、账号推送相同信息扩...
日期:10-24
百度地图宣布全球首发“隧道车道级导航”_百度地图道行
IT之家 8 月 8 日消息,据百度地图官方公众号报道,百度地图今日官宣“全球首发隧道车道级导航”,官方表示,该导航系“百度地图自研‘北斗高精’,全球首次攻破宇宙最难题,可为重庆 3...
日期:08-09
比亚迪副总李柯功劳巨大年薪960.2万 曾是广告公司销售经理如今53岁_比亚迪李巍和李柯
运营商财经网 实习生王鑫垚/文前不久,比亚迪汽车官方宣布,将与巴西巴伊亚州在卡马萨里市设立大型生产基地综合体。比亚迪执行副总裁李柯出席活动。运营商财经网将目光聚焦到李...
日期:08-05
用Rust开发Linux驱动?内核维护者表示愿意接受  我们曾报道过微软有意选择Rust 作为C和C++的安全替代方案,Rust是由Mozilla主导的系统编程语言,专注于安全、速度和并发,它最初是M
  我们曾报道过微软有意选择Rust 作为C和C++的安全替代方案,Rust是由Mozilla主导的系统编程语言,专注于安全、速度和并发,它最初是Mozilla的一个研究项目,用于更安全、更快速...
日期:08-15
华云数据亮相工信部网络安全产业发展中心信创解决方案成果展 用“信创云基座” 为烟草等传统行业转型提供新契机
        2021年5月14日,由工业和信息化部网络安全产业发展中心组织的2020信息技术应用创新解决方案征集工作成果展在北京经开区国家信创园正式启动。华云数据作为2020...
日期:10-28
小威logo智能设计_小威智能让“人人都是设计师”
  只要30秒便可获得无限量、高品质的专业LOGO设计创意方案,设计就是一键生成的事。小威智能让人人都是设计师!   5月24日,一品威客AI实验室研发的小威智能推出全新品牌...
日期:09-17
12位行业大咖倾囊相授!2021GrowingIO增长大会「私域营销专场」干货在这里!
  2021年5月20日,GrowingIO与蓝标传媒联合举办的GrowingIO第六届增长大会「私域营销专场」在上海环球港凯悦酒店圆满落幕。 地方范德萨范德萨发二十   数字化浪潮加速...
日期:04-17
当卷烟滤棒遇上百度AI,看烟草行业如何迈出质检智能化的“一小步”
  自《中国制造2025》战略发布以来,“推进生产过程智能化,培育新型生产方式”已经成为工业制造厂商们进行智能化升级的必经之路。而如何将技术更高效地融入到工业生产与质...
日期:11-21
退出印度芯片制造了?富士康最新回应是真的吗「退出印度芯片制造了?富士康最新回应」
凤凰网科技讯 北京时间7月11日消息,在周一宣布退出价值195亿美元的印度芯片制造合资项目后,富士康在印度的布局备受关注。富士康周二发表声明,再次进行了解释。华为手机mate 50...
日期:07-12
董明珠格力职位「董明珠称格力研发人员全部来自中国高校」
10月9日消息,格力电器董事长董明珠近日在接受媒体采访时谈到研发团队,她表示,格力是非常特殊的一个企业,没有外资、没有外国所谓的国际人才,格力所有的一万几千个研发人员全部来...
日期:10-13
法国亿万富翁 Xavier Niel 将投资 2 亿欧元发展人工智能:与 OpenAI 等公司竞争
9月27日消息:法国亿万富翁 Xavier Niel 正在向人工智能领域投资 2 亿欧元(约合 2. 12 亿美元),主要用于在巴黎建立一个未来研究实验室、利用英伟达(Nvidia)公司硬件提供云超级计...
日期:09-27
北京高端购物中心王府中环:新店悄然上新,为潮流时尚注入新鲜活力
位于王府井商圈的王府中环在这个秋季悄然上新,Mulberry、单农、TASAKI塔思琦、Solar lab北京首店、WHITE CROW白鸦眼镜等相继开业亮相,让更多年轻消费者感受到潮流文化的底蕴...
日期:10-16
领跑国产AI大模型!讯飞星火APP新版上线_讯飞兴智
快科技8月2日消息,讯飞星火App新版本已于8月1日升级完毕,用户可前往各主流应用商城下载或升级体验。此外,讯飞星火认知大模型V2.0升级发布会将于8月15日举办,届时会发布多模态生...
日期:08-02
将配超大异形外屏 「三星Galaxy」-Z Flip5渲染图曝光_三星z flip 5g屏幕
去年8月,三星在国内发布了第四代折叠屏手机——三星Galaxy Z Flip4和三星Galaxy Z Fold4,其中三星Galaxy Z Flip4凭借经典的“翻盖”掌心折叠设计、多样的1.9英寸外屏功能等获...
日期:09-17