您的位置:首页 > 互联网

戴尔Precision工作站:助力客户更有效地使用GenAI大语言模型_戴尔工作站precision3630

发布时间:2024-04-02 21:51:17  来源:互联网     背景:

本实用指南将帮助用户了解,如何配置个人电脑才能更有效地使用生成式AI大语言模型

vivo和nba

生成式人工智能(GenAI)彻底改变了计算世界,戴尔科技的用户都开始考虑借助大语言模型(LLM)去开发能够提升其公司生产力、效率和创新力的新功能。戴尔科技拥有全球最丰富的AI基础设施产品组合,从云到客户端设备一应俱全[1],因此能够为用户提供满足其一切AI需求的端到端AI解决方案和服务。戴尔科技还提供专为助力AI工作负载而设计的硬件解决方案,包括工作站、高性能计算服务器、数据存储、云原生软件定义基础设施、网络交换机、数据保护、HCI和各种服务。但用户所面临的最大问题之一是:如何确定一台PC能够与特定的LLM有效配合。戴尔科技将尝试解答这个问题。

bmw病毒测试

首先应该掌握一些关于如何帮助PC处理LLM的基础知识。虽然AI例程可以在CPU或被称为NPU的新型专用AI回路中进行处理,但目前的主流仍然是在PC中使用NVIDIA RTX GPU进行AI处理,该GPU带有被称为“张量核心”(Tensor Core)的专用回路。RTX张量核心专门用于实现混合精度数学计算,而这是AI处理的核心。但进行数学运算只是需要考虑的因素之一,鉴于LLM潜在的内存占用量,还需要额外考虑可用的内存空间。要在GPU中最大程度地发挥AI性能,就必须将LLM处理加入到GPU VRAM。NVIDIA的GPU产品线在各种移动和固定工作站产品中都可以扩展,用户可以通过所提供的张量核心数量和GPU VRAM选项来轻松调整系统规模。请注意,某些固定工作站可以搭载多颗GPU来进一步扩大容量。

市场上出现的LLM数量和种类越来越多,但在确定硬件需求时,最需要考虑的因素之一是所选LLM的参数规模。以Meta AI的Llama-2LLM为例,该模型有70亿、130亿和700亿这三种不同的参数规模。一般来说,参数规模越大,LLM的准确性就越高,在一般知识应用中的适用性也就越强。

无论用户的目标是将基础模型原封不动地用于推理,还是根据具体的用例和数据进行调整,他们都需要了解LLM对机器的要求以及如何最好地管理模型。如果能够利用用户专有的数据开发和训练出针对特定用例的模型,那么用户的AI项目就能为其带来最大的创新和回报。在使用LLM开发新功能和应用时,参数规模最大的模型可能会对机器性能提出极高的要求,因此数据科学家们开发出了一些办法来帮助降低处理开销和管理LLM输出准确性。

量化就是其中的一种办法。该技术通过修改LLM内部参数(即权重)的数学精度来缩小LLM的规模。降低位精度会对LLM产生两方面的影响: 一是减少处理所占用的空间和对内存的需求, 二是影响LLM的输出准确性。量化可以看作是JPEG图像压缩,虽然压缩得越多,创建出的图像效率就越高,但在某些用例中可能会使图像变得模糊不清。

在实际应用中,如果用户想要运行量化为4位精度的Llama-2模型,可以考虑戴尔Precision3000和5000系列的多款移动工作站。

小动物简笔画图片大全

戴尔最新工作站

戴尔工作站有哪些系列

戴尔科技全新的3000和5000系列移动工作站集成了CPU,NPU,GPU多处理器组合,能够优化100多款应用中的AI性能,使其运行更快、能效更高。例如,它们可支持全新的协作体验,如AI驱动的视频会议,提供背景模糊、面部取景和视线纠正等功能。NPU能有效地卸载CPU或GPU上的任务,使功耗降低高达40% 。这意味着电池续航时间更长,用户无需频繁充电即可持续工作。此外,新款CPU还配备了速度更快的集成显卡,为更多媒体密集型AI工作负载提供卓越性能。CPU、NPU和GPU协同工作,共同打造灵活、高性能且节能的AI引擎,为用户带来绝佳体验。

dell precision 工作站

此外,全新戴尔Precision3490和3590移动工作站最高可搭载NVIDIA RTX500Ada图形处理器,提升专业用户的工作效率。Precision3591则专注于设计与创作领域,轻松应对入门级2D和3D CAD应用。而Precision5000系列移动工作站将创意应用的性能提升到了新的高度,Precision5690凭借其小巧的16英寸机身,为用户带来出色的创意应用体验。它具备广阔的视野、出色的便携性和强大的应用性能,最高可配备NVIDIA RTX5000图形处理器。同时,机身小巧但强大功能的Precision5490作为一款14英寸超便携设备,在性能和体验方面也毫不逊色。

雁门关在哪里啊

在更高精度(BF16)运行会增加对内存的需求,但戴尔科技的解决方案可以在任何精度上满足任何规模的LLM需求。戴尔Precision7960塔式工作站可支持多达四个NVIDIA 高性能GPU,其AI处理能力比上代产品高出80% 且每个GPU的VRAM高达48GB,而VRAM是处理GenAI大语言模型最关键的配置之一。

那么如何解决输出准确性所受到的影响?另一种被称为微调的技术可以通过在特定数据上重新训练LLM的参数子集来提高准确性,进而提高特定用例中的输出准确性。微调会调整某些已训练参数的权重,能够加快训练过程并提高输出准确性。通过将微调与量化相结合,就可以产生针对特定应用的小语言模型,这些模型非常适合部署到对AI处理能力要求较低的各种设备上。同样,如果开发人员想要对LLM进行微调,也可以放心地将Precision工作站作为构建GenAI解决方案过程中的沙盒。

在使用LLM时这些不同技术不会相互排斥。把它们结合在一起使用往往会带来更高的运行效率和准确性。

总之,LLM的规模以及哪些技术能够为有效使用LLM所需的计算系统配置提供最佳参考都是关键的决定因素。戴尔科技坚信无论用户在其AI旅程中想要朝哪个方向发展,戴尔科技的台式机、数据中心等解决方案都将为其提供助力。

戴尔科技集团

戴尔科技集团致力于帮助企业和个人构建数字化未来,改进他们的工作、生活和娱乐方式,为客户提供面向数据时代全面和创新的产品、技术、解决方案及服务组合。

[1] 基于戴尔科技集团的内部分析,2023年8月。


返回网站首页

本文评论
红米note2013122参数「Redmi Note 13标准版正式发布 1099元起售」
近日,Redmi Note 13标准版正式发布,售价公布如下:6GB 128GB售价为1099元,8GB 128GB售价为1199元,8GB 256GB售价为1399元,12GB 256GB售价为1599元。该机采用6.67英寸OLED直屏,支持19...
日期:09-22
老头乐刮蹭450万法拉利被索赔190元:网友热议“该不该纵容”
8月17日消息,日常生活中开车时难免会磕磕碰碰,只要买了三者险,基本上没有什么大碍,不过老头乐除外,毕竟这种代步工具,是业内出了名的毒瘤。这不,据媒体报道,近日在上海,一老人驾驶一...
日期:08-17
谷歌认真起来,就没 OpenAI 什么事了!创始人亲自组队创建“杀手级”多模态 AI 模型
声明:本文来自于微信公众号 InfoQ(ID:infoqchina),作者:冬梅、核子可乐,授权转载发布。谷歌正在计划如何利用即将推出的大型语言模型系列 Gemini 来取代 ChatGPT。截至目前,OpenA...
日期:08-19
三大运营商SIM卡硬钱包上线数字人民币:手机断网、没电也能买买买
快科技7月11日消息,今日,中国移动联合中国工商银行,中国电信、中国联通联合中国银行推出的数字人民币SIM卡硬钱包,正式在数字人民币App上线。SIM卡硬钱包是将数字人民币App钱包...
日期:07-12
一加电视将登陆中国,刘作虎:Awesome(一加电视国内发布)
  9月27日消息 昨天,一加在印度正式推出了OnePlus TV,一加CEO刘作虎今天也晒出了OnePlus TV官方照。刘作虎同时评论“Awesome”。   此次一加在印度推出的OnePlus TV产...
日期:06-25
淘宝比价功能上线,开始“套路”商家?「淘宝比价新规」
声明:本文来自微信公众号“价值星球Planet”(ID:ValuePlanet),作者:归去来,编辑:唐飞,授权转载发布。日前,有消费者在使用淘宝时发现,部分商品下方已上线“去比价”功能。比如说,在淘...
日期:04-01
华为盘古大模型是啥「华为版ChatGPT正在路上:预计7月发布,命名“盘古Chat”」
据消息称,华为将在7月7日举行的HDC.Cloud 2023开发者大会上,推出一款全新的人工智能产品——盘古Chat,这是一款与ChatGPT相媲美的多模态千亿级大模型,可以实现自然语言理解、对...
日期:06-05
旗舰质感+四年耐用,OPPO A2 Pro正式发布,1799元起
通信世界网消息(CWW)OPPO A系列新品OPPO A2 Pro 5G手机正式发布。全新升级的OPPO A2 Pro兼具旗舰质感和四年耐用,搭载120Hz旗舰级护眼双曲屏和67W超级闪充,刷新同档位设计、续航...
日期:09-15
负债超2.4万亿 恒大不再托大
7月17日晚,中国恒大终于补发了延迟已久的2021年度、2022年度及2022年中期业绩公告。根据财报,中国恒大在2021年、2022年度合计净亏损金额达到8120亿元;截至2022年末,负债总额约...
日期:07-21
分类分级是推动平台互联互通的关键一步「互联网平台分类」
  作者:陈兵;;责编:任绍敏  分类分级规范体系与新《反垄断法》结合,能提升平台经济反垄断监管效能。  8月1日起,新《反垄断法》正式施行,其在总则部分增加第9条规定“经营...
日期:09-26
宁德时代回应与福特将在美国建电池工厂:情况属实
2月14日 消息:福特汽车2月13日宣布和宁德时代一起在美国密歇根州马歇尔市附近修建一家电池工厂,投资35亿美元(约238.7亿元人民币),预计2026年投产,员工规模2500人。据中证金牛座...
日期:02-15
英特尔计划在德建厂想要100亿补贴 德财长:太多了给不起「英特尔项目」
6月12日 消息:美国英特尔公司计划在德国建立一家芯片工厂,获得了德国政府68亿欧元的补贴,但据英国《金融时报》6月11日报道,英特尔希望进一步从政府获取32亿欧元的补贴使总金额...
日期:06-12
Rivian Q4产量为1万辆环比增长36% 交付量为8054辆环比增长22%
1月4日消息,据国外媒体报道,美国电动汽车初创公司Rivian公布了创纪录的2022年第四季度和2022年全年产量和交付量数据。该公司表示,2022年第四季度,该公司生产了1.002万辆汽车,环...
日期:01-04
或为首款第二代骁龙8旗舰平板 「三星Galaxy」-Tab S9+跑分曝光
今年以来,陆续已经有小米平板6系列、vivo Pad2等几款平板与大家见面,并且处理器由去年的骁龙870进一步升级为骁龙8+旗舰平台,性能实力进入新的阶段。而此前有不少博主透露,三星...
日期:09-18
党建引领,赋能创新 中国联通智慧家庭创新产品斩获多项大奖_联通智慧党建获得了国产化认证
通信世界网消息(CWW)近日,由中国信息通信研究院、工业和信息化部新闻宣传中心、中国联合网络通信有限公司、中国信息消费推进联盟联合主办的第二届“光华杯”千兆光网应用创新...
日期:10-31
个人如何网上卖保险_个人不能在网上卖保险 保监会规范网上销售保险
  越来越多的保险公司开始考虑在网上销售一些简单的保险产品。记者昨天从保监会获悉,保监会已经公布了《互联网保险业务监管规定(征求意见稿)》,其中规定了保险从业人员不能...
日期:07-27
华为捐赠!中国移动完成1050套欧拉操作系统迁移上线「华为欧拉操作系统官网」
快科技5月28日消息,CentOS7将于明年6月30日停服,意味着用户将无法获得官方补丁安装支持和系统升级,国内使用CentOS的企业,面临巨大的安全漏洞隐患等问题。男子误把狼当哈士奇ios...
日期:05-28
揭秘国内算命网站盈利模式 称骨算命、号码测吉凶成流量密码_算命网免费算命 称骨
4月25日 消息:近日,安徽一算命网红3年非法盈利200多万引发广泛关注。算命是科学还是迷信骗人话题也引起网友讨论。网上搜索“算命网站”词条,会跳出众多相关网站链接。以“卜...
日期:04-25
慕了慕了!直播转化14%?62场直播告诉你高销售转化的秘密
随着商业化流量采买工具的成熟(流程完善、红利消失),如何提高直播间转化已经成了一个实实在在跟钱相关的问题。转化高,直播间就有更多的销售产出;转化低,那直播前期的各种投入那...
日期:08-01
vivo发飙?X27升降摄像头狠起来:比NEX还快十倍?_vivox27摄像头只能升一半
  3月19日,vivo的新机X27就要和大家见面了,这两天有关于新机的消息一直层出不穷,更快的速度(骁龙855?),更大的内存(8g),更大的储存(256g),还有更大的电池(4000mah)。   而今...
日期:05-23