您的位置:首页 > 互联网

构建智算基础设施底座,彩讯股份推出AI原生云计算解决方案Rich AICloud

发布时间:2024-10-14 18:44:22  来源:互联网     背景:

通信世界网消息(CWW)2024年10月11日,第12届中国移动全球合作伙伴大会在广州盛大开幕,彩讯股份AI原生云计算解决方案Rich AICloud在大会亮相,Rich AICloud致力于为大模型应用开发构建坚实的智算基础设施底座。

算力是大模型构建不可或缺的基石,算力直接关乎大模型训练的效率和成果。大模型的计算特性为:大数据、大计算,例如GPT4、Meta Llama3的训练都是基于几万卡GPU集群,然而当前国内智算集群的建设仍面临一定的困境:第一,算力可靠性几何式降低:一个任务在数十、数百台机器中运行,单台可靠性是99%,百台机器是99%^100=36.6%,GPU规模越大,则整体可靠性就越低;第二,系统优化配置复杂:构建稳定高效的大模型系统,需要对网络、框架、模型诸多参数进行调优;第三,工具少,生态弱:国外厂商封锁算力集群建设及优化技术,国内GPU厂商的软件生态尚在建设中,万卡集群建设仍面临一定的挑战。

如何控制算力成本,提升集群规模,高效管理集群,提升大模型训练推理速度,是各大企业及算力提供商面临的难题。

智算基础设施底座——Rich AICloud

针对当前算力的挑战,彩讯股份推出了AI原生(AI-Native)云计算解决方案,该方案是集合了下一代AI原生云计算网络架构、超大规模算力集群管理平台、高性能大模型训推平台的AI算力构建及大模型运营一体化解决方案,旨在帮助企业快速构建大规模算力集群、部署运营专属大模型,赋能智能化转型。

Rich AICloud分为三层:其底层是RichNet下一代AI原生云计算架构,中间层是可实现万卡集群管理的RichMoss超大规模算力集群管理平台,顶层是针对大语言模型/文生图/视频的RichBoost高性能大模型训推平台。通过将AICloud平台部署到 GPU算力集群硬件服务器上,可以低成本、高效率构建起高可用、高性能的 AI 算力集群。

RichNet下一代AI原生云计算架构

AI大模型对网络性能需求:大带宽、高负载、零丢包的无损网络。随着技术的发展,现在数据中心内的高性能网络传输机制,已经从TCP/IP逐步切换到RDMA,即远程直接内存访问。RoCE(RDMA over Converged Ethernet),是一种能在以太网上进行RDMA的集群网络通信协议,它可以大大降低以太网通信的延迟,提高带宽的利用率。

RichNet的RoCE网络交换机,聚焦于下一代高性能网络,提供先进的RoCE网络整体解决方案,提供端到端RDMA计算通信互联系统,基于RoCE以太网络带宽利用率可达到IB网络90-96%,All-Reduce基准测试稳定性提升20%+,AI-to-AI基准测试吞吐量提升20%+。

RichNet具备多重领先优势,在千卡集群中,方案可为客户节省超过一千五百万元的成本开支;方案通用性高,支持快速交付与响应,传统IB交货周期需要数月,而RichNet RoCE交货周期仅需数周;通过自研系统与算法,保证了较高的稳定性(传输抖动程度)和高性能(链路利用率)。

RichMoss超大规模算力集群管理平台

RichMoss超大规模算力集群管理平台,支持云原生、容器化的部署方式,支持异构GPU设备。通过计算抽象能力+高级调度功能,连接AI工作负载与底层计算资源,并通过高效、灵活的调度机制和策略,优化地运行各种AI负载,最大化资源利用。

先进的 AI 计算集群调度器,提供运行大规模工作负载所需的高级调度功能,支持根据业务目标灵活定义和设置调度策略;异构GPU调度,池化 GPU 等各种计算资源,支持不同厂商GPU,支持集群规模的动态扩展;弹性分配工作负载,自动回收闲置资源,优化现有计算资源利用率,允许在同一硬件上运行更多计算;灵活扩展的工作流系统,能够把复杂的计算步骤灵活地组合在一起,进行统一管理和调度,在集群中实现复杂大规模计算工作流自动化,支撑企业级、复杂、大规模的 AI 工作负载;全面可视化的监控能力,可视化的界面提供 CPU、Memory、GPU、网络、存储等硬件资源监控,达到对平台计算任务的全面观测和管理。

RichBoost高性能大模型训推平台

麦肯齐·贝佐斯离婚后或成世界第三女富豪

彩讯提供高性能的大语言模型推理引擎RichLLM及高性能文生图/视频推理引擎RichDiff,从底层深度优化加速。

RichLLM是一款高效、易用、可扩展的大语言模型推理引擎,旨在为用户提供开箱即用的推理加速能力,大幅降低模型的部署成本。得益于底层的深度优化、高效的推理框架、创新的通信机制、深度优化的模型,平台加速比可达5倍以上,执行效率、显存利用效率、分布式通信效率得到充分优化。在各种推理场景中,最高效率可达同类开源产品的10倍;同时,经过对模型、机制、框架、算子等联合优化,可实现SOTA推理效率;平台也支持一键启动高效LLM推理服务。

RichDiff是一款高性能多模态推理加速引擎,专为图片和视频生成的推理加速设计。它凭借出色的性能,能实现高达基准引擎3倍的图像生成速度,同时保持图像质量与原生PyTorch一致。RichDiff具有灵活的对接能力,兼容多种深度学习引擎和前端应用框架,满足多样化需求。即插即用,无需做模型转换;加速模型的保存与加载耗时仅需几秒。RichDiff使SDXL端到端推理速度最快提升3倍, SVD端到端推理速度最快提升3倍 。

 

140米等于多少平方米?

彩讯Rich AICloud AI原生(AI-Native)云计算解决方案目前已在多个千亿参数级别的大模型训练、大模型推理、AI工具加速等方面成功落地,大幅降低模型训推成本,加速AI产品的落地。面向未来,彩讯股份将持续深化AI智算领域技术和方案研究,推动AI技术的持续进步与革新,不断携手更多合作伙伴,赋能千行百业智能化变革。


返回网站首页

本文评论
摩根大通CEO抨击“危险的”比特币是“去中心化的庞氏骗局 ”_比特币就是庞氏骗局
杰米·戴蒙于当地时间周三加倍强调了他对加密货币的长期敌视,这位摩根大通的CEO告诉美国立法者,他认为比特币和其他数字货币都是“危险的”--并把它们比作是“去中心化的庞氏...
日期:09-27
网易云立体音效「国内首家!网易云音乐PC端支持杜比全景声」
近日,网易云音乐最新PC客户端已支持杜比全景声,成为国内首家PC端支持杜比全景声的在线音乐平台。用户可通过支持杜比全景声功能的Windows设备在网易云音乐客户端体验。据悉,网...
日期:11-20
在生成式AI面前,创作者能否保护自己的作品免受侵害?「基于ai的生成器」
引言:随着生成式人工智能艺术的风靡,一些人怀疑它是否应该被视为艺术。这项技术仍在不断发展中,如Midjourney 和 Stable Diffusion 等生成式人工智能工具正在产生越来越令人...
日期:07-26
不信命的年轻人,却靠占卜求未来:无处不在的“玄学”,背后全是生意经
声明:本文来自于微信公众号 快刀财经(ID:kuaidaocaijing),作者:朱末,授权转载发布。当代年轻人,在上班和上学之间选择上香;在求人和求己之间选择求佛;最后在算数和算法之中选择了...
日期:11-10
黄仁勋是哪里人「黄仁勋,挖来Meta一员AI芯片大将」
芯东西(公众号:aichip001)编译 | 李水青编辑 | Panken芯东西11月9日消息,据外媒The Information报道,前Meta基础架构副总裁亚历克西斯·布莱克·博乔林(Alexis Black Bjorlin)近日...
日期:11-09
传感器产品技术-工业级加速度传感器解析_加速度传感器构造
  传感器是获得精准有效数据的第一触点;它们在将原始物理量转换为便于测量计算的数据量的过程中,发挥着重要作用。伴随着电力、船舶、航空、航天等多种工程技术的迅猛发展...
日期:07-16
小米系统下载_小米设置下载
是指用户可以从官方渠道或第三方渠道下载小米手机或小米平板电脑的操作系统,即MIUI系统。MIUI是小米公司所开发的Android操作系统,具有开放、个性化、精致等特点,深受广大用户...
日期:05-29
消息称苹果iPhone 14 Pro/Pro Max手机256GB存储起步「iphone 13 pro max 256G」
IT之家 8 月 11 日消息,今天早些时候,分析师郭明錤声称苹果 iPhone 14 Pro 机型将比 iPhone 13 Pro 机型更贵。郭明錤没有透露确切的售价,但他表示所有四款 iPhone 14 机型平均...
日期:09-18
上汽总经理:上汽的混动技术 已领先日系车两代_上汽新能源混动
快科技2月26日消息,据国内媒体报道,近日,上汽国际党委书记、副总经理赵爱民在上汽集团海外经营沟通会上透露,上汽MG3 hybrid将在日内瓦车展亮相,从而开启该车海外销售新篇章。off...
日期:02-26
vivotws耳机单独配一只「单耳机仅重3.6g,半入耳设计:vivo TWS Air2正式发布」
单耳机仅重3.6g,半入耳设计:vivo TWS Air2正式发布 通信产业网|2023-10-30 15:45:35作者:通文来源:通信产业网2023年10月30日,“好轻,好听”vivo TWS Air2正式发布,官方售价149元,预...
日期:11-01
谷歌副总裁 Sissie Hsiao:Gemini AI 演示视频完全真实,尽管谷歌为了简洁而缩短了部分内容
12 月 12 日消息:在日益激烈的生成型 AI 市场竞争中,谷歌近期推出了其大型语言模型 Gemini 的预告视频。然而,有关该视频真实性的争议随后引发了广泛关注。谷歌发布的演示视频...
日期:12-12
快速接入不同视频会议软件 少不了罗技Swytch_快捷视频会议
  视频会议这样一种沟通形式,自它诞生之日起,就给现代商业社会带来了极大的便利性。依托音视频设备,以及网络,分隔两地的人们可以突破空间上的限制,实现高效率的交流。而随着...
日期:10-07
获中国电信“生态合作卓越奖”:真我realme亮相2023数字科技生态大会
获中国电信“生态合作卓越奖”:真我realme亮相2023数字科技生态大会 通信产业网|2023-11-10 11:05:56作者:通文来源:通信产业网11月10日,2023数字科技生态大会在广州市广交会展...
日期:11-13
Check Point 在Forrester 最新零信任平台提供商报告中被评为领导者_零信任架构及解决方案
Check Point在“市场占有率”类别中排名第一,并在13项标准中荣获最高分2023年9月,全球领先的网络安全解决方案提供商Check Point®软件技术有限公司(纳斯达克股票代码:CHKP)在《F...
日期:09-25
TCL发布双子舱洗烘护集成机T10,4599元起
9月21日消息,TCL日前正式发布双子舱洗烘护集成机T10,售价4599元起。TCL方面表示,这款国民洗衣机采用一站式洗烘护、一体式外观设计和一体交互智控,机身厚度仅555mm,可支持超薄嵌...
日期:09-22
腾讯公益、QQ浏览器联合发起“爱心回礼·远方来信”公益直播「腾讯爱心公益活动」
1月13日,腾讯公益、QQ浏览器联合发起“爱心回礼·远方来信”公益直播。该直播围绕十封受助人的信件展开,分享受助人背后的故事,让更多捐赠人看到发生在受助人身上的点滴变化,延...
日期:01-13
外媒:被议员询问访华时华为推出新手机,美商务部长回应了_华为答应美国
关于华为推出新手机,美国商务部长雷蒙多回应了。据彭博社、路透社等多家外媒报道,雷蒙多当地时间19日在美国众议院听证会,被议员质询她访华期间华为推出新手机一事。雷蒙多回应...
日期:09-20
诺基亚与微软合作_诺基亚称与微软谈判顺利 明年大量上市WP手机
  诺基亚企业开发部门高级副总裁凯伊·奥斯塔莫(Kai Oistamo)周一表示,诺基亚与微软的交易正在如期进行,诺基亚大量采用Windows操作系统的手机将于2012年上市。奥斯塔莫表示,...
日期:07-27
全国首例“AI声音侵权案”宣判:获赔25万元_什么叫声音侵权
快科技4月24日消息,北京互联网法院昨日对全国首例AI生成声音人格权侵权案进行了一审判决。该案涉及的主要问题是自然人的声音权益是否应扩展到AI生成的声音,以及如何确定AI生...
日期:04-24
香飘飘盈利_香飘飘的营收:起起落落落落落落落落落落
三星s21 ufsskype总是被注销图片来源:视觉中国   记者 |李昱茹;编辑 |牙韩翔   曾经的国民奶茶香飘飘营收再一次下跌。   8月12日晚间发布2022上半年业绩报告,上半年香...
日期:08-17