您的位置:首页 > 互联网

HuggingFace diffusers轻量快速推理引擎stable-fast上线

发布时间:2023-10-19 13:30:12  来源:互联网     背景:

10月19日 消息:不久前,HuggingFace 的 diffusers 轻量快速推理引擎已经在GitHub上发布。这个引擎通过一系列小幅改进,已经实现了显著提高推理速度的目标,宣称每秒可达到60步,较之前的23步有了显著提升。在自然语言处理任务中,这一引擎表现出色,赢得了众多开发者的青睐。

华为大战美国

目前,stable-fast处于测试阶段,可能存在一些问题,但它承诺为深度学习爱好者带来颠覆性的变革。

新浪微博控股公司

项目地址:https://github.com/chengzeyi/stable-fast

企业为什么要创建电子商务网站

stable-fast的设计目标是优化HuggingFace Diffusers在NVIDIA GPU上的推理。它利用一组强大的技术来确保高效的性能。其中一个显著特点是CUDNN卷积融合,它能够实现卷积、偏差、加法和激活计算模式的无缝融合。这确保了您的模型运行尽可能高效。

另一个显著特点是实现了低精度和融合的GEMM。通过在计算时使用fp16精度,同时在fp16下读写,stable-fast超越了PyTorch的默认性能。该库还擅长实现NHWC和融合GroupNorm,借助OpenAI的triton,提供了高度优化的融合NHWC GroupNorm + GELU操作符,消除了内存格式排列操作的需求,进一步提高了效率。

图源备注:图片由AI生成,图片授权服务商Midjourney

此外,stable-fast引入了完全跟踪模型的概念。它改进了torch.jit.trace接口,以使其更适合跟踪复杂模型。几乎可以跟踪和转换StableDiffusionPipeline的每个部分为TorchScript。它比torch.compile更稳定,CPU开销明显更低,并支持ControlNet和LoRA。

它还引入了融合多头注意力,使其与TorchScript兼容。与其他加速库相比,stable-fast的卓越速度是其独特之处,尤其在针对HuggingFace Diffusers进行优化时。此性能比较显示了其卓越的性能。作为PyTorch的极简主义插件框架,它无缝集成了现有的PyTorch功能和基础设施,同时支持各种加速和微调技术。总之,stable-fast准备为深度学习从业者的推理优化带来革命性的速度和效率。


返回网站首页

本文评论
moto折叠屏手机多少钱「小折叠全能选手,全新moto razr 40 Ultra斩获京东手机榜TOP1」
6 月以来,各大手机厂商的促销活动让不少消费者蠢蠢欲动。联想就在近日发布了moto razr 40 Ultra与moto razr40 两款重磅小折叠新品。凭借超强产品力和轻巧好用的特性,两者一经...
日期:06-06
静观其变-纳德拉回应暴雪收购案是否绕过英国市场
5 月 17 日消息,微软正努力推动 690 亿美元收购动视暴雪落地,公司首席执行官萨蒂亚・纳德拉(Satya Nadella)在近日接受采访,在被问及是否绕过英国等某些市场时,表示“静观其变”。...
日期:09-28
快递业停运「国家要求快递业1月8日停业?真相来了 没有停业打算」
12月20日 消息:近日,有网络传言称“因受疫情影响,国家要求快递业1月8日左右陆续停业”,引发网友关注,上海辟谣平台也收到不少留言,其中有一张全国物流春节放假停运时间表(预测)。酷...
日期:12-20
小米线下能12期免息吗「小米12S立减600 3000出头分期还免息」
国庆已经过完,但手机市场的促销仍在继续,现在小米12S手机立减600元,现在到手只要3399元了,还有分期免息,赠品等活动,强劲的性能配合MIUI 13不错的调校,强强联手打造的小米12S手机有...
日期:10-17
AI加持的Microsoft Teams落地中国 推出五大场景应用
【】4月18日消息,微软宣布由世纪互联运营的Microsoft Teams推出一系列创新功能,围绕企业数字核心能力,赋能数字化协作空间、智能化协作体验、整合生产力工具和工作流、安全合...
日期:10-02
刘德华戴1000度眼镜拍《流浪地球2》:看一切都是模糊的
今日消息,导演郭帆分享刘德华拍摄细节:为了塑造角色,实戴1000度眼镜,戴上看一切都是模糊的。刘德华能以最快的速度进入角色,现场拍摄时看到华哥还是会哇喔”。据悉,刘德华在新作品...
日期:01-24
胡厚昆华为「华为胡厚崑:以ChatGPT为代表的新的人工智能时代已到来」
IT之家 6 月 17 日消息,2023 年 APEC 工商领导人中国论坛在北京举行,华为轮值董事长胡厚崑表示,以 ChatGPT 为代表的新的人工智能时代已到来,“我们可以大胆地预测,所有的个人、...
日期:06-19
iPhone 15 Pro过热问题曝光:软件更新解决_苹果ios15发烫
苹果公司承认iPhone 15 Pro和iPhone 15 Pro Max存在过热问题,并计划在即将推出的iOS 17软件更新中解决这个问题。苹果公司将通过合作与第三方应用程序的开发商解决这个问题。...
日期:10-02
今年五一档票房冠军电影猜测「中国影史第三!今年五一档电影总票房超15亿元」
统计数据显示,截至北京时间5月3日24时,2023年五一档”电影总票房超15亿元人民币,跻身中国影史五一档”票房第三位,观影总人次3743.4万,总场次229.9万。近20部新片的涌入,令这个五...
日期:05-04
广电总局治理电视“套娃”收费 年底压减收费包40%_广播电视套餐
在国务院新闻办公室举行的新闻发布会上,国家广电总局副局长杨国瑞介绍了广电总局针对电视“套娃”收费问题采取的措施。电视“套娃”收费问题是指由于不同市场主体参与电视的...
日期:09-28
携程上线火车卧铺女性拼团 每人收费10元「携程卧铺怎么选座位」
7月25日 消息:近日,携程推出了一项新服务,在用户预定部分卧铺火车票时,增加了“全网拼团女性房间”功能,并收取10元/人的费用。该服务承诺在拼团成功出票时,同房间的乘客均为女性...
日期:07-25
年货节玩法大盘点,电商平台今年给用户带来了哪些惊喜?「每到购物节,各大电商平台」
声明:本文来自于微信公众号 营销看克(ID:yingxiaokanke),作者:雨过炊烟,授权转载发布。年货节来临后,各大电商平台紧锣密鼓的促销动作亦接踵而至。但消费者面对各大平台眼花缭乱...
日期:01-17
谷歌 DeepMind 推出无需监督即可自学的人工智能机器人_人工智能google机器人
6月26日消息:机器人正迅速成为我们日常生活的一部分,但它们通常只被编程来完成特定的任务。尽管利用人工智能的最新进展可能会导致机器人在更多方面发挥帮助作用,但构建通用机...
日期:06-26
Epic Games要求美国法院对苹果的一项裁决生效「美国epic公司」
7月28日 消息:Epic Games周四要求美国最高法院允许一个下级法院对苹果公司(AAPL.O)的裁决生效,这可能会迫使这家iPhone制造商改变其App Store的支付做法。Epic是流行视频游戏“...
日期:07-28
董宇辉称没想过取代俞敏洪:他的生活质量太差_董宇超个人简历
8月24日消息,董宇辉最近在采访中被问到是否有取代俞敏洪的想法,他笑着摇头否认,并表示:没有,他的生活质量太差。”2018款macbook air值得买吗ipad air上市董宇辉直言不讳的表示,老...
日期:08-25
复联6推迟上映!现用手机能看《复联5》「复联6推迟上映!现用手机能看《复联5》嘛」
中关村在线消息:10月12日,漫威新片《复仇者联盟6》宣布档期推迟,从原定的2025年11月7日变为2026年5月1日北美上映,晚了半年,离现在还有近4年。《复联6》的编剧为《洛基》《奇异博...
日期:10-18
三星s4价格「三星s4价格表」
三星S4是一款经典的智能手机,在其推出后很久依然备受消费者喜爱。三星S4价格在现在已经有所变化,我们来了解一下。首先,三星S4曾经被认为是一款高端智能手机,在推出时价格也相应...
日期:05-31
抖音带货火到海外,已有人月入百万
声明:本文来自于微信公众号 电商头条(ID:ecxinwen),作者:风清,授权转载发布。网红带货在海外火了要说国内的文化输出,可能没什么能比得上TikTok了。2018不要押金的共享汽车作为抖...
日期:08-22
百度ai技术到底是什么_百度:如何将AI进行到底?
  每家持续优秀的企业都有一个好的愿景,这个愿景将贯穿企业生命周期的始终,比如:阿里的愿景始终都是让天下没有难做的生意;迪士尼则围绕“使人们过得快活”以穿越不同技术和...
日期:02-01
翼风模型店新址_60年老品牌难敌租金飞涨 中国第一家模型店“翼风”关门
  一架折了机翼的飞机模型放在“翼风”模型店前,这家中国首个模型店已于4月6日关闭。早报见习记者 杨一 图又一家老店黯然离开南京路,逼走它的,是不断上涨的租金、便利又便...
日期:07-27