您的位置:首页 > 互联网

Google DeepMind提出DRaFT算法以高效优化扩散模型

发布时间:2023-10-09 20:37:08  来源:互联网     背景:

要点:

1、Google DeepMind提出了直接奖励微调(DRaFT)的概念,可以高效微调扩散模型以最大化可微的奖励函数。

2、引入DRaFT-K和DRaFT-LV算法,限制反向传播步数,提高效率。实验证明优于全反向传播。

3、在Stable Diffusion1.4上应用DRaFT,结果显示其效率远超基于强化学习的微调基线。DRaFT-LV效率最高。

功夫熊猫秘籍上没有字

chat it

10月9日 消息:扩散模型已经革新了各类数据的生成建模。但是在实际应用中,如根据文本描述生成美观图像,仍需要微调模型。目前文本到图像的扩散模型采用无分类器指导和精心设计的数据集如LAION美学数据集来提升图像质量和模型对齐性能。

论文地址:https://arxiv.org/abs/2309.17400

影驰ddr5什么时候上市

在研究中,Google DeepMind提出了一种直接而高效的基于梯度的奖励微调方法,其核心是将扩散采样过程微分化。他们提出了直接奖励微调(DRaFT)的概念,其本质是反向传播整个采样链,通常表示为具有50步长度的展开计算图。为有效管理内存和计算成本,他们采用梯度检查点技术,优化LoRA权重而不是修改全部模型参数。

此外,Google DeepMind还提出了DRaFT方法的改进,以提升其效率和性能。首先是DRaFT-K,其限制采样时仅反向传播最后K步时的梯度计算。实验结果显示,与全反向传播相比,这种截断梯度方法的性能明显更好,因为全反向传播会导致梯度爆炸问题。

另外,研究人员提出了DRaFT-LV,其平均多个噪声样本来计算更低方差的梯度估计,进一步提高方法效率。

氢能源自行车

研究人员在Stable Diffusion1.4上应用DRaFT,使用各种奖励函数和提示进行评估。他们的梯度方法相比基于强化学习的微调基线,效率优势明显。例如,在最大化LAION美学分类器分数时,与强化学习算法相比取得了200倍的加速。

他们提出的变体DRaFT-LV展现出卓越的效率,学习速度约为先前梯度微调方法ReFL的两倍。此外,他们证明了DRaFT可以与预训练模型组合或插值,通过混合或缩放LoRA权重来实现。

总之,直接在可微奖励上微调扩散模型是一个提升生成建模技术的有前景的方向。其效率、通用性和有效性使其成为机器学习和生成建模领域研究者和从业者的有价值工具。


返回网站首页

本文评论
小红书启动「恰好计划」 主攻2023食品饮料营销
1月12日 消息:昨日,小红书在广州启动食品饮料行业营销中国行活动 ——「恰好计划」,并首次发布《灵感「补给站」· 小红书零食行业用户洞察报告》。据介绍,小红书「恰好计划」...
日期:01-12
被集市收割、被买家嫌弃,“摆摊后浪”有点惨「集市摆摊骗局」
声明:本文来自于微信公众号锌刻度(ID:znkedu),作者:星晚,授权转载发布。近段时间,深圳、北京、上海等城市先后给出相关政策,解禁路边摊。有人表示,大城市里的人间烟火气又回来了,白...
日期:05-19
尼泊尔飞机坠毁前发动机已失去推力:找到幸存者概率为零「印尼飞机坠毁有幸存者吗」
当地时间1月15日上午,一架由尼泊尔首都加德满都飞往西部博克拉市的客机在降落前坠毁。这是尼泊尔30年来最严重的飞机事故之一。据央视新闻援引外媒报道称,尼泊尔雪人航空公司...
日期:02-10
数据和生成式人工智能将改变世界-F5 CTO林耕
【】5月26日消息,全球领先的应用交付和应用安全厂商F5近期举行了科技趋势峰会,F5全球执行副总裁兼首席技术官、首席华裔科学家林耕向中国媒体分享了最新的应用技术及策略趋势...
日期:09-26
每日优鲜被约谈 电商预付风险预警_每日优鲜拖欠供应商货款,深陷官司泥潭
来源:北京商报   预付违约在电商领域上演。8月9日,北京市消费者协会(以下简称“市消协”)官网发布消息,要求每日优鲜务必妥善处理消费者投诉【进入黑猫投诉】,及时公布退费方案...
日期:08-11
雷军卸任小米影业公司董事长_雷军卸任小米影业公司董事长了吗
凤凰网科技讯 1月9日消息,天眼查App显示,近日,小米影业有限责任公司发生工商变更,雷军卸任董事长、洪锋卸任董事,新增曾学忠为执行董事,同时主要人员新增孙谦。比亚迪nfc车钥匙支...
日期:01-09
施耐德电气SSI计划进程过半 可持续影响力收入占比增至73%
(原标题:施耐德电气SSI计划进程过半 可持续影响力收入占比增至73%) 近日,全球能源管理和自动化领域的数字化转型专家施耐德电气...
日期:08-16
女子偷偷卖掉所有黄金首饰帮老公还账 网友:他们一定非常爱彼此
5月31日消息,陕西西安,丈夫做生意亏了钱,妻子偷偷卖掉自己所有黄金首饰,帮丈夫还债。网友表示:爱都是双向的,能同甘共苦的女人,希望他东山再起能加倍补偿她。京东会接下苏宁足球队...
日期:05-31
网易发布未成年人限玩日历:共14个小时「网易未成年一天的游戏时间」
中关村在线消息:1月10日,网易游戏发布《关于春节假期未成年人游戏限时的通知》,自1月13日至2月5日这段时间内未成年人共有14天可在20时-21时钟登录、体验游戏,请各位玩家合理安...
日期:01-11
是路“漫漫”还是路“曼曼”?网友吵翻 又学错了吗:众专家科普可通用
故天将降大任于斯人也”,还是故天将降大任于是人也”的事情刚吵完,现在又来新的,大家感受下。最近,杭州一位初三语文老师在备课时,语文课本里的一句诗路曼曼其修远兮,吾将上下而求...
日期:11-04
金山云服务事故致360等软件大面积异常仍未修复
  12日开始出现的系统ani 金山毒霸云服务事故,导致大量用户电脑出现卡、慢以及系统或第三方软件崩溃等问题,虽然金山官方声称该问题已于第二天得到解决,但其后仍有不少网友...
日期:07-24
米哈游 星穹「米哈游收入创新高:《崩坏:星穹铁道》取代《原神》?」
转自:中国经营网本报记者 许心怡 吴可仲 北京报道随着新游《崩坏:星穹铁道》的推出,游戏圈的黑马公司米哈游再创单月收入新高。5月,《崩坏:星穹铁道》取代《原神》成为米哈游的招...
日期:06-19
微软Edge浏览器现已支持通过二维码分享网页(edge浏览器打开显示二维码)
  12月19日消息 在1月份正式发布之前,微软一直在努力为Edge浏览器添加新功能,最新的一个功能是允许用户通过自定义二维码分享网页,目前Canary用户已经可以使用该功能。  ...
日期:03-15
g代码下载「GPT-Engineer一夜爆火!一个提示生成整个代码库,GitHub狂飙19k星」
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:桃子 好困,授权转载发布。【新智元导读】动嘴写代码指日可待!AI代码生成明星项目GPT-Engineer一夜爆火,短短几天狂揽19k星。A...
日期:06-21
从生活娱乐到买房相亲,快手直播的想象力有多大?「快手主播真挣钱买房又买车」
声明:本文来自于微信公众号 新播场(ID:New_bc),作者:阿力古,授权转载发布。11月22日,快手发布了2022年第三季度财报。第三季度,快手取得了喜人的业绩:总营收达231.3亿元,国内经营利...
日期:11-25
电商平台用ChatGPT为用户提供购物辅助服务成趋势
4月27日 消息:在 OpenAI 的 ChatGPT 爆火之后,越来越多电商平台尝试使用该工具来提供购物辅助,包括记忆对话内容和话语能力,提供更加个性化和人性化的体验。在用例方面,包括日本...
日期:04-27
蔚来隐私膜「蔚来NIOPhone手机发布:SkyUI操作系统 隐私保护功能」
今天上午,蔚来在NIO IN 2023蔚来创新科技日活动中正式发布了NIOPhone手机。据悉,该手机搭载SkyUI操作系统,采用了全场景抗老化引擎和全链路安全隐私保护技术。李斌表示,NIOPhone...
日期:09-22
狗狗嫌天热自己坐电梯回家 主人:找了好半天_狗狗在电梯里会恐惧
6月17日消息,因天气太热,安徽阜阳一只法斗遛弯时抛下主人,跑进电梯自己回家,邻居看到后热心帮忙按了电梯。美国三大股指上周涨跌主人表示:狗狗是阴阳脸”,小区里大家都认识,找了好...
日期:06-19
稳居第三大手机系统!华为鸿蒙OS 4即将发布:余承东出席或宣布最新装机量
快科技7月31日消息,华为开发者大会2023(HDC.Together)将于8月4日至8月6日在东莞松山湖召开,全新鸿蒙OS4将在大会上重磅发布。目前,华为已在官网公布了今年开发者大会日历,包括鸿蒙...
日期:07-31
微信音频是指什么「微信的“音频”野心」
声明:本文来自于微信公众号新熵(微信号ID:baoliaohui),作者: 白芨,授权转载发布。以免费听周杰伦为切入点,微信音乐完成了一次成功的破圈。4月20日,微信在8.0.36版本更新中测试了...
日期:04-26