您的位置:首页 > 互联网

AI实时绘画系统StreamMultiDiffusion 支持局部涂抹+提示生成图片

发布时间:2024-03-15 19:27:39  来源:互联网     背景:

3月15日 消息:近期,一篇名为"StreamMultiDiffusion"的论文提出了一种新颖的实时、交互式的文本到图像生成系统。这种系统能够根据用户提供的手绘区域和相应的语义文本提示来生成图像,为专业图像创作者提供了一个强大的工具,可以用于快速原型设计和创意探索。

xy苹果助手iphone

苹果9月11号发布会

项目地址:https://github.com/ironjr/StreamMultiDiffusion

小米5s指纹识别

扩散模型在文本到图像合成领域取得了巨大成功,成为了图像生成和编辑的有前途的候选者。然而,将这些模型用于实际应用仍面临两大挑战:一是需要更快的推理速度,二是需要更智能的模型控制。这两个目标需要同时满足,才能在实际应用中发挥作用。为了解决这些挑战,作者提出了StreamMultiDiffusion框架。

该框架是第一个实时基于区域的文本到图像生成框架。通过稳定快速推理技术并重构模型为新提出的多提示流批处理架构,实现了比现有解决方案更快的全景图生成速度,并在单个RTX2080Ti GPU上实现了基于区域的文本到图像合成的1.57FPS生成速度。

该框架引入了几种关键技术。首先是Latent Pre-Averaging,在推理的每个步骤中,先对中间潜在表示进行平均,以适应快速推理算法。其次是Mask-Centering Bootstrapping,在生成过程的前几步中,将每个遮罩的中心点对齐到图像中心,以确保对象不会被遮罩边缘切断。再次是Quantized Masks,通过量化遮罩来控制提示遮罩的紧密度,从而在不同噪声水平下平滑地融合生成区域。

此外,StreamMultiDiffusion还引入了一个名为Semantic Palette的新概念,这是一种交互式图像生成范式,允许用户通过手绘区域和文本提示实时生成高质量图像。这种方法类似于使用画笔在画布上绘制,但使用的是文本提示和遮罩。例如,用户可以在红色区域生成人物,在耳朵和尾巴区域标记为狗,系统会根据涂抹的区域生成长着狗狗耳朵和尾巴的人物。

论文中的实验结果表明,StreamMultiDiffusion在全景图生成和基于区域的文本到图像合成方面,相比于现有的MultiDiffusion方法,实现了显著的速度提升,同时保持了图像质量。这证明了该系统在实际应用中的巨大潜力和价值。


返回网站首页

本文评论
微软和谷歌的AI领域投资经验:花钱才能赚钱「谷歌与微软合作」
7月26日 消息:微软和谷歌表示,人工智能将为它们带来巨大回报,但在实现盈利之前,它们需要更深入的投资。微软表示,随着建设新的数据中心以支持人工智能,成本大幅上升,资本支出将继...
日期:07-26
微信读书iOS版大升级:阅读数据全面升级 适配iPhone 14_微信读书改版
日前,微信读书iOS版更新到7.1.1版本,不但针对iPhone 14系列机型进行了适配,阅读数据也有了全面升级。诞生于2015年的微信读书APP,是微信团队推出的第一款基于微信关系链的官方阅...
日期:11-25
金立智能手机报价_金立手机最新款的价格
金立智能手机是一款性能稳定的智能手机品牌,其产品涵盖普通手机和智能手机。金立公司曾经是中国智能手机领域的一股强劲力量,拥有独特的产品设计和强大的性能配置,备受国内消费...
日期:05-31
二三四五2018业绩亮眼 人才布局先行一步_二三四五业绩预告
  虽然互联网行业去年遭遇资本寒冬,但这一行业仍然具有很强的生命力。从招聘数据来看,高科技公司、IT互联网企业、新兴创业公司的热情不减,仍然不断的发出招聘需求,而它...
日期:11-10
故宫回应家长带娃随地小便 如果属实将按规定处罚_故宫带孩子用买票么
故宫是中国历史文化的象征,也是世界文化遗产的宝藏。每年都有数百万游客慕名前来,感受中华文明的魅力。然而,在这个神圣的地方,最近却发生了一起令人震惊的事件。有网友在社交平...
日期:07-06
双子座流星雨是几点到几点「一起来看双子座流星雨:凌晨3点迎极大期 肉眼可见」
快科技12月14日消息,今晚对于观星爱好者来说堪比春晚”,因为年度三大流星雨之一的双子座流星雨即将迎来极大期。据悉,我国各地今年最佳观测时间是12月14日22时至次日天亮前,其中...
日期:12-14
父亲辞世后宗馥莉首次公开亮相:称自己是接过企业经营接力棒的新将
3月7日消息,据国内多家媒体报道,娃哈哈集团总经理宗馥莉在上海出席活动并演讲,这是她在父亲宗庆后2月25日病逝后首次在公众场合露面。宗馥莉在活动上提到,自己既是一名在行业摸...
日期:03-07
卢伟冰的公司「卢伟冰今天去工地开会:讨论新品」
中关村在线消息:今天,Redmi品牌总经理卢伟冰在微博向大家分享了它的日程,卢总今天去了小米智慧产业基地(昌平一期)开会,并晒出了工地的图片。本次卢总前去开会,很有可能是在讨论在...
日期:10-26
“Arm 全面设计”借助生态系统之力,拥抱 Arm 定制芯片时代_arm技术
通信世界网消息(CWW)Arm 今日宣布推出“Arm® 全面设计 (Arm Total Design)”生态系统,致力于流畅交付基于 Neoverse™ 计算子系统 (CSS) 的定制系统级芯片 (SoC)。Arm 全...
日期:12-01
特斯拉广告策略扩张,开始在 X 平台投放付费广告_特斯拉做广告
IT之家 2 月 7 日消息,特斯拉在社交媒体平台 X 启动专项广告活动,标志着其 CEO 埃隆・马斯克去年提出的“小规模”广告策略正式扩张。IT之家注意到,长期以来,特斯拉一直抵制传统...
日期:02-07
何小鹏余承东“和解”!何小鹏:“有时候误会后更容易成为好朋友”_
11月9日消息,何小鹏与余承东的AEB隔空掐架一事迎来“和解”。11月9日上午,小鹏汽车CEO、董事长何小鹏在其个人微博上发文称,今早与老余一起讨论了一下技术路线,我相信这种技术的...
日期:11-09
滴滴app司机「“有司机收入超690亿”?滴滴官方回应:假的,图片为PS伪造!」
11月28日消息,有网友称滴滴“某司机收入超690亿元”,并晒出一张账户余额截图。此外,有报道称滴滴部分司机开始提现,司机称怕系统出问题自己账号出问题被注销。希澈电动牙刷对此,...
日期:11-28
OPPO下一代Find旗舰产品将支持卫星通信技术,拓展通信体验边界_oppo还会出find系列手机吗?
通信世界网消息(CWW)2023年11月10日,OPPO宣布下一代Find旗舰产品将支持卫星通信技术,为用户带来更加安心、便捷、无忧的通信体验。即便在无信号区域,也能使用卫星通信技术连接外...
日期:11-10
中国联通携手新华三完成SAVNET试验网验证测试,共筑网络安全新防线
通信世界网消息(CWW)近日,中国联通研究院与北京联通携手紫光股份旗下新华三集团,顺利完成实验室环境下SAVNET(域内域间源地址验证架构协议)方案验证,各项关键功能均取得预期成果。...
日期:12-27
2016-2022年中国数字经济年均复合增长14.2%-中国信通院《全球数字经济白皮书》
【】7月5日消息,在 “2023全球数字经济大会”主论坛上,中国信息通信研究院余晓晖院长发布《全球数字经济白皮书》,并对全球数字经济发展最新态势进行了解读。白皮书显示,主要国...
日期:09-21
马斯克小胜一步?法官要求推特提供评估虚假账户高管信息
记者 杨阳   指责推特隐瞒关键证人一周后,马斯克终于获得了一位推特前高管的信息。 字节跳动的创新点达尔优机械合金版机械键盘东风小康风光s560马斯克ipad有多厚   当地...
日期:08-16
知了好学发布公告:针对中专网搬运平台数据已起诉立案
  近期,记者发现,知了好学就中专网抄袭数据一事在官方微信发布公告。文中表示:“知了好学已就中专网的搬运行为起诉,现法院已立案并进行首次庭前谈话,案件正在审理中”。   ...
日期:09-05
试戴金戒指动了活扣需要赔钱吗「女子试戴金戒指断两半遭索赔 网友:什么黄金这么脆」
2月20日,广州,有网友陈女士报料称,她去购买金饰,试戴金戒指时发生了断裂。店员提出两种赔偿方案:一是按戒指2235元原价的30%赔偿,二是按以旧换新的标准购买其他款式。小米11pro可...
日期:03-01
清华 文科生「Sora文生视频火爆出圈!清华大学公布文生视频专利」
快科技2月20日消息,2月16日,OpenAI发布其首款文生视频大模型Sora。Sora可根据文字提示生成60秒视频,输出视频堪比影视CG,一经发布火爆出圈。据国家知识产权局网站显示,2月2日,清华...
日期:02-20
英伟达向台积电追加 1 万片晶圆订单 生成式,AI 爆火_英伟达 台积电7nm
IT之家 5 月 13 日消息,伴随着生成式 AI 的爆火,对 GPU 的需求也水涨船高,因此英伟达向台积电追加订单,加速生产 GPU。用友智能财务华为p60pro能今年年底上市吗方向盘锁死了咋整...
日期:09-29