您的位置:首页 > 互联网

阿里云全面升级GPU云服务:AI大模型推理性能可提升100%_阿里gpu云服务器 价格对比

发布时间:2024-07-19 18:01:39  来源:互联网     背景:

快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。

针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。

随着AI大模型的体量变大、应用变广,单GPU已难以承载推理应用的全部需求,多GPU推理时代已经到来,如何在GPU资源紧缺的当下,实现GPU高效互联,是提升多GPU推理性能的关键。

阿里云通过进一步优化底层的AI通信加速库DeepNCCL,让GPU云服务在推理场景下有更好的性能表现:在同等硬件环境下,Token输出吞吐至少提升14%,首Token时延降低15%。

通过深度优化,推理加速性能也提升显著,Token处理能力提升100%,相同的资源可以支持2倍的业务需求,用Kubernetes容器集群技术调用GPU算力,已成为运行AI大模型任务的主流选择。

ACK容器服务可提供自动化编排及GPU高效管理和调度的能力,让模型部署、扩展变得更简单。

为进一步提升AI应用运维效率,阿里云推出ACK云原生AI套件,可实现Kubernetes在GPU调度和细粒度共享、AI任务调度、训练数据加载以及大模型推理服务启动等关键领域的能力增强和加速,相较开源均有大幅能力提升。

比如,针对AI任务频繁加载远程存储数据的需求,ACK云原生AI套件可提升训练数据读取性能30%以上,降低大模型推理服务冷启动时延70%以上。

在全球累计超过1000万活跃用户的国产AI绘画工具海艺AI,就是通过ACK调用阿里云GPU云服务的先行者。

阿里云 cgpu

阿里gpu云服务器

九分米等于多少平方厘米

此前,用户通过海艺AI生成一张图片平均耗时20秒,遇到队列等待延迟可上升至分钟级;采用阿里云GPU云算力及ACK容器服务后,海艺AI的模型切换完全无感,推理耗时降低至3.95秒,整体性能提升至少50%以上。

在最新的Forrester 全球AI基础设施解决方案研究报告中,阿里云综合产品能力指标位居全球第二,已成为中国AI大模型的公共底座。

零一万物、百川智能、智谱AI、昆仑万维、vivo、复旦大学、巨人网络等大批企业和机构在阿里云上训练大模型,并通过阿里云对外提供服务。

小鹏汽车、联想、德勤、微博、完美世界、喜马拉雅等已接入阿里云通义大模型,在阿里云上为消费者和客户提供丰富的AI应用服务。


返回网站首页

本文评论
浙江康勒:ActiveReports 是工厂信息化建设过程中不可或缺的报表工具
  2019年11月15日,一场别开生面的“报表控件应用场景和衍生技术研讨会”在浙江康勒科技有限公司(以下简称:浙江康勒)成功举办。西安葡萄城信息技术有限公司(以下简称:葡萄城...
日期:03-09
洗涤剂智能添加 西门子WJ45UM100W洗烘一体机国美首发_西门子洗烘一体wj45ul080w
  用户对于品质生活的追求日益强烈,这也推动着家电技术创新的日新月异,产品的升级换代也越来越快。日前,西门子洗衣机悠享系列洗烘一体机WJ45UM100W在国美美店正式首发,...
日期:07-15
100条玩法总结,颗粒级复盘直播起号细节「直播完复盘」
声明:本文来自于微信公众号 尹晨带货实录(ID:yinchen8810),作者:尹晨,授权转载发布。今天的算法系列,来拆解主题“动态指数的考核均衡”,我写文章习惯结构化叙述,阅读此文的用户,建...
日期:10-12
退出印度芯片制造了?富士康最新回应是真的吗「退出印度芯片制造了?富士康最新回应」
凤凰网科技讯 北京时间7月11日消息,在周一宣布退出价值195亿美元的印度芯片制造合资项目后,富士康在印度的布局备受关注。富士康周二发表声明,再次进行了解释。华为手机mate 50...
日期:07-12
15式轻型主战数据「未来作战“急先锋”,15式轻坦成新一届利剑」
出品|网易新闻导语:能适用于多种作战环境,技术指标世界先进的15式轻型坦克目前已经批量列装。15式轻型坦克各方面都能抗衡主战坦克,其综合作战能力不逊于改进的T-72,已经成为我...
日期:03-03
蚂蚁保险科技获ECCV2022五项,蝉联遮挡视频实例分割比赛
11月15日消息,在欧洲计算机视觉会议ECCV2022中,蚂蚁集团保险科技团队获得计算机视觉领域五项竞赛冠军,包括遮挡视频实例分割(OVIS)、归纳先验实例分割(VIPriors)、背景虚化效果渲...
日期:11-18
笔记本营销战 迁移社会化网络媒体
  传统PC,尤其是笔记本业务,近几年接连遭遇上网本、iPad等的侵袭和竞争,产品越来越难卖,营销越来越难做。固守传统终端卖场、地铁、户外LED和楼宇广告等营销手段,已经难以有效...
日期:07-25
中国信通院联合发布《5G消息搜索服务研究报告(2023年)》_5g消息应用最新新闻
随着新技术的发展,信息传播内容和渠道日渐多元化、碎片化,作为人们获取信息的重要入口,移动搜索的边界不断延展,由工具向服务转型,流量入口的价值逐步增加,成为互联网商业生态下市...
日期:06-07
年内发布首款新能源硬派越野SUV 比亚迪F品牌正式官宣定名“方程豹”
【】6月9日消息,比亚迪今日官宣,旗下的全新F品牌正式定名“方程豹”。根据官方描述,“方程豹”来自“方程”和“豹”的组合,意指“用探索数字世界的专业智慧和精神,求解汽车与用...
日期:09-24
蔚来回应实习员工自称遭性侵犯 正对其实习留用流程进行调查_蔚来汽车工作人员
凤凰网科技讯 3月4日消息,近日,有网友称,自己入职蔚来的第一个月,被男同事试图强奸。目前该男同事已因强奸罪入狱。该网友表示,蔚来目前反馈不会留用自己。网友称被HR反馈:“她是...
日期:03-04
安卓万元机皇!三星Galaxy S24 Ultra工业设计出炉:回归直屏
快科技9月30日消息,爆料人士Onleaks曝光了三星Galaxy S24Ultra渲染图。对比上代,Galaxy S24Ultra最大的变化是回归直屏方案。其屏幕尺寸是6.8英寸,分辨率是2K ,屏幕刷新率是120H...
日期:09-30
OpenAI以860亿美元估值融资,是利好老员工还是有其他目的?_open ai公司
界面新闻记者 | 李京亚10月19日消息,据媒体报道,有知情人士透露,OpenAI正在洽谈以860亿美元的估值出售现有员工股份,但OpenAI尚未确定分配方案,条款仍有可能发生变化。新买的ipad...
日期:10-20
大批明星艺人“退出”直播间_哪个明星退出
声明:本文来自于微信公众号 三言Pro(微信号:sycaijing),作者:三言,授权转载发布。今日,“大批艺人已停播”相关话题登上微博热搜,阅读量超过5亿,引起广泛关注。明星直播带货最火的...
日期:11-17
乐视经典商标被拍卖?官方辟谣:卖的是“LE”,而非“Le”「乐视网商标拍卖」
之前,有消息称,北京一中院定于今年10月10日至10月11日在京东网络司法拍卖平台,对乐视控股(北京)有限公司名下包括经典的“Le”、乐视手机“LeMobile”、乐视超级电视“UMax120”...
日期:09-29
乔布斯“原味”凉鞋拍出154万元!拍卖行:上面有脚印
中关村在线消息:据外媒报导,有一名拍卖者以21.8万美元(折合人民币约154万元)的价格拍下了已故苹果创始人史蒂夫?乔布斯穿过的一双Birkenstock凉鞋,这也创下了凉鞋拍卖史上的最高...
日期:11-16
华为MatePad Pro 13.2英寸典藏版商务人士首选 京东1月18日开售
12 月 26 日,华为冬季全场景发布会如期而至,发布会上华为MatePad Pro 13. 2 英寸典藏版、MatePad Pro 13. 2 英寸星闪套装、MatePad Pro11 英寸星闪套装震撼登场,并且同步带来...
日期:12-27
马斯克推特最新新闻「马斯克必须向三名被解雇的推特高管支付逾2亿美元」
DoNews10 月 28 日消息(郭睿琦)据界面新闻报道,在Twitter与马斯克麾下X Holdings的合并中,Twitter首席执行官Parag Agrawal、首席财务官Ned Segal和法务政策主管Vijaya Gadde获...
日期:10-29
特斯拉第500万台汽车下线:不到40秒就能造出一台车「特斯拉2800亿」
快科技9月17日消息,今天上午,特斯拉官方表示,本周,特斯拉第500万台汽车已经下线。感谢特斯拉车主一直以来的支持。据了解,特斯拉从400万台到500万台,仅仅用了6个月的时间,平均每天...
日期:09-17
探索性能新上限,讯景凤凰涅槃系列AMD RX 7000系列_amd凤凰os
拥有次时代RDNA3架构、FSR3.0技术的AMD RX7000系列显卡,向来是众多DIY发烧玩家追求超高游戏性能的优质选择。讯景作为AMD显卡核心AIB之一,致力于为用户提供性能卓越、设计创新...
日期:05-27
理想汽车最新财报「全年营收增长173.5%!李想:理想汽车2023年实现历史最佳财务表现」
快科技2月26日消息,今天,理想汽车公布了2023年第四季度及全年财报,2023全年实现营收1238.5亿元,同比增长173.5%。ipad产量利润方面,2023年理想汽车的净利润为118.1亿元,而2022年净...
日期:02-26