您的位置:首页 > 互联网

英特尔团队提出L-MAGIC新技术 通过结合语言模型让图像扩散模型生成高质量360度场景

发布时间:2024-06-11 18:54:02  来源:互联网     背景:

6月11日 消息:在CVPR2024上,美国英特尔研究院的蔡志鹏博士及其团队提出了一种名为L-MAGIC(Language Model Assisted Generation of Images with Coherence)的新技术。这项技术通过结合语言模型和图像扩散模型,实现了高质量、多模态、零样本泛化的360度场景生成。

核心特点:

  • 结合语言模型和扩散模型:L-MAGIC利用自然图像连接不同模态的输入,并通过条件扩散模型如ControlNet从各种模态输入生成自然图像。

  • 迭代变形和填充:在获得自然图像后,L-MAGIC通过迭代变形(warping)和填充(inpainting)生成360度场景的多个视角,使用基于扩散的图像填充模型(如Stable Diffusion v2)生成缺失像素。

  • 语言模型控制:L-MAGIC使用语言模型自动控制扩散模型,根据每个视角需要生成的场景内容,有效保持语言及扩散模型的泛化性。

  • 多样化场景生成:L-MAGIC能够生成多样化的全局场景结构,无需微调,从而实现多样化场景的高质量生成。

  • 多模态输入:除了自然图像,L-MAGIC还能接受文字、手绘草图、深度图等多种模态的输入。

实验结果表明:

L-MAGIC在图像到360度场景生成及文字到360度场景生成任务中均达到了SOTA(State of the Art)。

能够生成具有多样化360度场景结构的全景图,并且能够平滑地完成360度闭环。

除了文字和自然图像,L-MAGIC还能够使用ControlNet接受多样化的输入,如深度图、设计草图等。

技术应用:

L-MAGIC还能够利用深度估计模型生成场景的沉浸式视频和三维点云,为场景理解和可视化提供了更多可能性。

项目主页:https://zhipengcai.github.io/MMPano/

频繁收到诈骗电话


返回网站首页

本文评论
Android 14更新缩短至一个月 4G芯片已完成升级_手机升级14.6
紫光展锐宣布,其5G移动平台T820、T770、T760、T750以及4G平台T619、T616、T612、T606和SC9863A已完成Android 14的同步升级。紫光展锐简化了OEM和ODM厂商向最新版Android操作...
日期:10-08
openai公司上市了吗「OpenAI宣布收购Global Illumination 并将整个团队纳入麾下」
8月17日消息,据外媒报道,当地时间周三,OpenAI宣布,它已收购初创企业Global Illumination。OpenAI在声明中没有透露收购的具体条款,但表示Global Illumination的“整个团队”已经...
日期:08-17
首发用户赚了!一年前的iPhone 13 Pro渠道价上涨:接近首发价「iphone 13 pro定价」
今日消息,手机店主测评小铺晒出了iPhone 13 Pro线下渠道报价,全新机价格明显上涨,已经接近首发价格了。如表格所示,iPhone 13 Pro 256GB远峰蓝渠道报价是8800元,比官网首发价格贵...
日期:11-27
红星美凯龙战略合作品牌_星星相映,共赢未来! 三星携手红星美凯龙品牌严选活动启动
  8月3日,“星星相映·共赢未来”三星电子与红星美凯龙联合战略推广活动正式启动,拉开了三星布局红星美凯龙等建材渠道的序幕。作为已经连续15年蝉联全球电视行业领导者地...
日期:11-21
华为Mate X5和Mate60 Pro 上架官网 几乎秒光
9月8日上午10点08分,华为在其官网上再次上架了两款手机,分别是华为Mate X5折叠屏手机和华为Mate60 Pro+。需要注意的是,这两款手机的上架是华为“先锋计划”的一部分,并非正式开...
日期:09-09
深圳一公司发布年薪50万岗位:优先录用李一桐粉丝
5月6日消息,深圳一公司发布招聘岗位,岗位提到月薪40000元,13薪招聘社媒运营专员”,岗位要求是负责公司官方新媒体及社交网络的运营工作,包括编写粉丝向文案,制作粉丝向传播物料,了...
日期:05-07
老客户假冒新客套取外卖平台返利 6人“薅羊毛”被刑拘
12月13日 消息:据上海网警消息,在今年“净网2022”专项行动中,普陀分局网安支队在市公安局网安总队的指导下,成功侦破一起恶意套取平台补贴犯罪案件。警方对相关线索进行梳理,发...
日期:12-13
脸书旗下WhatsApp泄露海外近5亿用户的电话号码_脸书收购whatsapp
11月25日 消息:Cybernews发现某黑客在论坛上公开出售84个国家的4.87亿 WhatsApp 用户的电话号码。vertu手机 性能为什么说vivo x fold折叠屏不简单王传福商业理论realme9a是...
日期:11-28
号称碾压AirPods Pro!怒喵CYBERBLADE耳机宣布降价
快科技5月21日消息,去年8月,国产外设品牌AngryMiao(怒喵科技)公布了旗下首款TWS耳机CyberBlade,号称能够击败苹果的AirPod Pro,售价高达2200元。近日,怒喵科技宣布,CYBERBLADE标准版...
日期:05-22
小米之家4月活动「曝小米14加单40% 小米之家开始展车摆放确认工作」
今年10月下旬,小米2023年度新品发布会正式到来,小米14系列正式发布。随着这一代旗舰的正式发布亮相,不少用户也在关注其实际的销售表现。今天,科创板日报的一份最新报道显示:“据...
日期:12-06
Fortinet 2023上半年全球威胁态势研究报告发布
通信世界网消息(CWW)近日,专注于推动网络与安全融合的全球网络安全领导者Fortinet®,发布了《2023上半年全球威胁态势研究报告》。报告显示,2023年上半年勒索软件检出数量继续下...
日期:09-28
软水机的树脂使用寿命「软水机树脂几年换一次?软水机品牌哪个比较好?」
软水机树脂的更换周期并不是固定的,它受到多种因素的影响。一般来说,这个周期可能会因水质、树脂品质、使用频率以及是否正确维护等因素而有所变化。本文就来讲一下,影响软水机...
日期:06-06
鸿蒙智行,华为要给车圈打造新样本_华为鸿蒙合作车企
新造车观察5min read鸿蒙智行,华为要给车圈打造新样本siqi2023/11/13摘要云计算和AI是如何赋能华为汽车业务的?由华为和奇瑞汽车联合打造的纯电车型智界S7,自11月9日晚发布预售...
日期:11-14
微博动漫启动“超元星计划” 见证新虚拟偶像诞生与成长(超次元新星微博)
8月3日,微博动漫宣布启动“超元星计划”,将对招募的虚拟偶像提供全方位扶持,并与业界合作孵化更多虚拟偶像IP,打造行业头部标杆案例。微博将推动虚拟偶像借助社交媒体平台与上亿...
日期:08-04
一加3型号「一加13外观设计大改!还要和小米抢骁龙8 Gen4首发」
快科技3月5日消息,今天,数码博主数码闲聊站”曝光了一加13手机的部分信息。三星flip z 5g评测该博主表示,一加13最新手板是2K大屏堆料向,已经基本确定换设计了,去掉了家族式合页...
日期:03-06
g490 联想「联想g490i5参数」
G490是联想推出的一款笔记本电脑,其采用15.6英寸的LED高清屏幕,搭载英特尔酷睿i3/i5/i7处理器,支持显卡独立切换,可以实现高效处理和流畅的图像呈现。它还拥有8GB/16GB内存和500...
日期:06-03
约36.4厘米长!福建发现恐爪龙类足迹 可能为全球最大_福建恐龙足迹群
快科技5月6日消息,据福建发布”公众号,今日,全球最大的恐爪龙足迹福建足迹”新闻发布会在福建博物院举行。会上,科学家团队宣布,在福建龙岩上杭龙翔恐龙足迹群发现的大型恐爪龙类...
日期:05-07
艾媒咨询《2020中国K12在线教育行业报告》发布:作业帮获客效率、教学服务水平双领先
  近日,艾媒咨询发布《2020中国K12在线教育行业研究报告》。报告显示,2020年,在“停课不停学”的政策扶持下,在线教育市场规模达4858亿元,而2019年国内K12在校生达2.4亿人,K12...
日期:01-06
第二款骁龙780g「性能直逼骁龙8+! 第二代骁龙7+成中高端新神U?」
   3 月 17 日,高通正式推出了全新第二代骁龙7+移动平台。首先从命名上来看,这款芯片就十分与众不同,它并未遵循骁龙平台一贯的命名习惯,相当于直接跳过了两代。从性能上来看,...
日期:04-06
中国科学院院士王怀民:中国人工智能的开源创新关键在于搭建平台_
5月26日消息,在中关村论坛人工智能开放生态建设论坛上,中国科学院院士、CCF开源发展委员会主任王怀民做《开源创新的启示》主旨演讲,他和大家共同探讨三个问题,一是开源创新优势...
日期:05-27