您的位置:首页 > 互联网

GPUStack正式发布: 为大模型而生的开源GPU集群管理器_gpu集群架构

发布时间:2024-07-29 10:59:32  来源:互联网     背景:

7月26日,数澈软件Seal(以下简称“Seal”)宣布正式发布并开源最新产品GPUStack,GPUStack 是一个用于运行 LLM(大型语言模型)的开源 GPU 集群管理器。

尽管如今大语言模型作为公共的云上服务已经被广泛推广并在公有云上变得更加易于使用,但对企业来说,部署托管自己私有的 LLM 供企业和组织在私有环境使用仍然非常复杂。

首先,企业需要安装和管理复杂的集群软件,如 Kubernetes,然后还需要研究清楚如何在上层安装和管理 AI 相关的工具栈。而目前流行的能在本地环境运行 LLM 的方法,如 LMStudio 和 LocalAI,却大都只支持在单台机器上运行,而没有提供多节点复杂集群环境的支持能力。

gpu集群 搭建实施方案

Seal 联合创始人及 CTO 梁胜博士介绍道,“GPUStack 支持基于任何品牌的异构 GPU 构建统一管理的算力集群,无论目标 GPU 运行在 Apple Mac、Windows PC 还是 Linux 服务器上, GPUStack 都能统一纳管并形成统一算力集群。GPUStack 管理员可以从诸如 Hugging Face 等流行的大语言模型仓库中轻松部署任意 LLM。进而,开发人员则可以像访问 OpenAI 或 Microsoft Azure 等供应商提供的公有 LLM 服务的 API 一样,非常简便地调用 OpenAI 兼容的 API 访问部署就绪的私有 LLM。”

帮助企业简单快速地开启 LLM 创新

当前,企业如果想要在 GPU 集群上托管大模型,必须要做大量的工作来集成复杂的技术栈。通过使用 GPUStack,企业不再需要担心如何管理 GPU 集群、推理引擎和推理加速、租户和配额管理、使用和计量、性能度量、统一认证授权和访问控制,以及仪表板。

iphone14更新功能介绍

如下图所示,GPUStack 是一个构建企业私有的大模型即服务(LLMaaS)的完整平台,拥有构建大模型即服务所需的各项功能。管理员可以将模型从 Hugging Face 等模型仓库部署到 GPUStack 中,然后开发人员可以连接到 GPUStack 提供的私有大模型 API,在他们的应用中集成和使用私有大模型服务。

“随着大语言模型能力的逐渐提高,企业和组织一方面对快速进入 AI 时代充满了信心并满怀期待,希望大语言模型能尽快为自己的企业和组织带来生产效能的提高,而另一方面,对于能否有效地把如火如荼的大语言模型技术进一步与实际业务进行有机结合,是否能因此产生相应的效益,企业及团队又同时充满了疑问。我们希望通过简单易用的 GPUStack 平台,部署和运行各种开源大语言模型,提供 OpenAI 兼容的 API 接口,使得开发人员简单方便地访问任何的 LLM。”Seal 联合创始人及 CEO 秦小康介绍道,“最重要的是,我们支持 Nvidia,Intel,AMD 及众多品牌的 GPU,在支持异构 GPU 集群的同时能为企业节省更多成本。帮助企业简单快速地开启 LLM 创新是 GPUStack 团队的初心和使命。”

整合GPU资源运行大模型

组建 GPU 集群整合资源

43厘米等于多少尺子

GPUStack 可以聚合集群内的所有 GPU 资源。它旨在支持所有的 GPU 厂商,包括英伟达,苹果,AMD,英特尔,高通,华为等。GPUStack 兼容运行 MacOS、Windows 和 Linux 操作系统的笔记本电脑、台式机、工作站和服务器。

模型部署和推理

GPUStack 为在不同 GPU 上部署不同大模型选择最佳的推理引擎,支持的首个推理引擎是LLaMA.cpp,其他推理引擎(如vLLM)的支持也在路线图中。

在资源充足的情况下,GPUStack 默认将模型全部卸载到 GPU,以实现最佳性能的推理加速。如果 GPU 资源相对不足,GPUStack 会同时使用 GPU 和 CPU 进行混合推理,以最大限度地利用资源。而在没有 GPU 资源的场景下,GPUStack 也支持纯 CPU 推理。这样的设计使GPUStack 能够更广泛地适配各种边缘或资源有限的环境。

快速与现有应用集成

儿童电话手表首次使用

GPUStack 提供了与OpenAI 兼容的 API,并提供了大模型试验场。开发人员可以调试大模型并将其快速集成到自己的应用中。此外,开发人员还可以通过观测指标来了解应用对各种大模型的使用情况。这也有助于管理员有效地管理 GPU 资源利用。

surface book为什么这么贵

GPU 和 LLM 的观测指标

GPUStack 提供全面的性能、利用率和状态监控指标。对于 GPU,管理员可以使用 GPUStack实时监控资源利用率和系统状态。对于 LLM,相关指标则可以帮助开发人员评估模型的性能并优化应用。

认证和访问控制

GPUStack 为企业提供身份验证和RBAC(Role-based Access Control)功能。这保证了只有授权的管理员可以部署和管理大模型,只有授权的开发人员可以使用大模型,应用也可以通过统一的 API 认证授权访问各种大模型。

加入社区,参与开源共创

GPUStack 项目正在快速迭代,计划引入对多模态模型的支持,更多的 GPU 厂商支持,以及更多的推理引擎支持。我们十分欢迎您一起参与开源项目的贡献,也欢迎在我们的 GitHub 仓库gpustack/gpustack上点亮 Star 关注我们的最新动态。

gpu集群架构


返回网站首页

本文评论
国内首个电力物联操作系统发布_电力物联网龙头股是哪一个
通信世界网消息(CWW)10月31日,南方电网公司与开放原子开源基金会联合发布国内首个电力物联操作系统——电鸿物联操作系统(以下简称“电力鸿蒙OS”),实现一套系统覆盖不同类型、不...
日期:11-02
铁路12306应用改版:首次显示折扣信息_12306显示优惠次数还要充磁吗
快科技12月7日消息,据国内媒体报道,铁路12306 APP购票页面改版,新版在查询列车信息页面可直接选购座席等级,并且首次显示折扣信息。小米1300万像素ipad液晶显示屏是夏普英特尔10...
日期:12-07
对于马斯克和扎克伯格的论战,你更支持谁的观点?「后者不在家也不会在门口打架,马斯克想上门“约架”扎克伯格」
8 月 15 日消息,在扎克伯格表示马斯克对待他们的笼斗并不认真,是时候放弃这个想法了之后,两位科技巨头之间的笼斗计划似乎已经泡汤。但马斯克却表示他将不请自来地出现在 Meta...
日期:09-17
极客时间—完善的培训体系培养员工学习习惯(程序员培训选用极客时间好)
  人才是实施数字化转型战略的核心竞争力。企业要积极创新人才培养模式,提升员工数字素养,才能为数字化转型升级提供支撑。随着数字化转型逐渐成为主流发展趋势,企业更要快...
日期:07-16
今日股价涨超8% 美图公司预计2024上半年净利润增长不低于80%_美图股价走势
【】7月24日消息, 美图公司发布盈利公告显示,预计上半年公司拥有人应占经调整净利润同比增长不低于80%。今日港股开盘,美图公司股价开涨,截止发稿涨超8%,报2.46港元/股。苹果降级...
日期:07-25
特斯拉目标2030年销量2000万辆「特斯拉:2023年全年车辆交付同比增长38% 达到181万辆」
(原标题:特斯拉:2023年全年车辆交付同比增长38% 达到181万辆) 财联社1月2日电,特斯拉2023年第四季度汽车交付量为484,507辆,市场预...
日期:01-02
mwcs2021「近十万人参展,卷土重来的MWC2024将带来哪些惊喜」
通信世界网消息(CWW)一场全球信息通信行业的盛会即将卷土重来,规模达到近五年之最。它就是即将于下周召开的MWC巴塞罗那展会。adobe 收购“预计MWC24将成为五年来规模最大的一...
日期:02-21
丰田“加价神车”半年销量暴跌30%!雷克萨斯ES又全面涨价_雷克萨斯es什么时候涨价的
作为丰田旗下的豪华汽车品牌,雷克萨斯一直的销量都很不错,特别是雷克萨斯ES,可以说是占据了雷克萨斯的半壁江山。即便是被网友疯狂吐槽“同级别动力最弱”,但也丝毫不影响该车的...
日期:08-16
透视淘宝内乱:资源严重失衡 小卖家受挤压
  10月18日消息,昨日马云对新规做出调整,变相降低新标准并放宽期限,卖家内斗一事暂告一段落。数日来,舆论之焦点在于争论是马云不义还是卖家不对,而实际上,因为淘宝内部资源的...
日期:07-24
群晖Synology Drive重大更新:终于支持视频在线查看 可以取代网盘了「群晖rmvb」
快科技7月15日消息, Synology Drive家族最近迎来了一波大公测更新。本次更新主要集中在三个方面:分别是网页端的Drive和Office以及移动端的Drive App。想要体验的同学在【套件...
日期:07-15
高铁时代的超级赢家!合肥再添1座大站、3条350新线_合肥新建高铁规划方案
在普铁时代,合肥是个被遗忘的角落,但在高铁时代,合肥迅速翻身,成为一个区域性乃至全国性的高铁中心枢纽,规模还在不断扩大。作为京港高铁合安段、合新高铁安徽段的共用站,合肥西站...
日期:03-07
网红俄罗斯小哥「俄罗斯小哥ChatGPT找女友:聊了5239个女生,现在订婚了」
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。美国亚马逊董事长有事 AI 它是真上啊。我向一位女生求婚,ChatGPT 已经和她交流了一年。...
日期:02-06
史上最强7系芯片!高通骁龙7  Gen3真机规格曝光:大核提至2.9GHz_高通骁龙730g8核aie芯片
快科技2月27日消息,今天,数码博主数码闲聊站爆料了高通SM7675(高通骁龙7Gen3)的真机最新频率,Cortex-X4大核频率从2.8GHz提升到了2.9GHz。高通骁龙7Gen3最新频率为:1个2.9GHz X4...
日期:02-27
华为watch42mm「“捅破天”的手表!华为Watch 4定妆照出炉:旋转表冠 更像机械表了」
快科技5月8日消息,华为官方已经宣布将于5月18日召开夏季全场景新品发布会,将推出新平板、手表、笔记本等多款产品。今天下午,有博主带来了华为Watch 4官宣定妆照,图中显示该设备...
日期:05-08
awe2021 tcl「领先科技赋能智慧体验,TCL多款新品荣获AWE 2024艾普兰奖」
AWE2024举办期间,被誉为“全球智慧生活领域奥斯卡”的艾普兰奖颁奖典礼同期举行,TCL凭借在新型显示技术、工业设计、场景创新以及生态构建等方面的优势,荣获多项艾普兰奖,企业科...
日期:03-18
腾讯发布《5G车路协同创新应用白皮书》:打造车路协同一体化安全保障体系
  核心提示: 车路协同是智慧交通发展的重要趋势,这其中效率与安全成为车路协同落地实施的关键。在5月22日举行的腾讯数字生态大会首届智慧...   车路协同是智慧交通发展...
日期:02-01
世界上最富有的两个人「世界最有钱的两个人一起吃饭了,谁买单?」
凤凰网科技讯 北京时间6月17日消息,当地时间周五,世界上最有钱的两个人一起在法国巴黎共进午餐。周五,世界首富、特斯拉CEO埃隆马斯克(Elon Musk)和世界第二富豪、法国奢侈品集...
日期:06-17
3999元起,华为Mate50E正式开启预售,搭载骁龙778G+鸿蒙3.0「华为畅享205g鸿蒙」
华为的直屏旗舰华为Mate50E于10月8日上午10:08开启全款预售,预售入口已经开放。10月14日10:08新品首销。主要配置:华为Mate50E配备一颗骁龙778G处理器,搭载华为自有的超光变XMA...
日期:10-09
facebook投资了哪些公司_传Facebook获5亿美元投资 被估值500亿美元
  北京时间1月4日,据国外媒体报道,纽约时报源引参与交易的内部人士的消息称,Facebook从Goldman和俄罗斯互联网投资集团Digital Sky得到了5亿美元的投资,此项投资是在评估该社...
日期:07-25
谷歌怎么卖软件_谷歌已收购恶意软件分析工具厂商Zynamics
  据国外媒体报道,谷歌星期二宣布,它已经收购了逆向工程和分析工具厂商Zynamics。收购的金融条款没有披露。   Zynamics公司的领导人是托马斯·杜林(Thomas Dullien)。杜林...
日期:07-26