您的位置:首页 > 互联网

700 亿参数 LLaMA2 训练加速 195%,基础大模型最佳实践再升级

发布时间:2023-09-04 20:59:05  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。

ChatGPT 引发的大模型热潮愈演愈烈,全球科技巨头和明星初创争相入局,打造以 AI 大模型为核心的竞争力和多样化商业使用需求。其中 LLaMA 系列模型,因良好的基础能力和开放生态,已积累了海量的用户和实际应用案例,成为无数开源模型后来者的模仿和竞争的标杆对象。

但如何降低类 LLaMA2大模型预训练成本,如何基于 LLaMA2通过继续预训练和微调,低成本构建 AI 大模型实际应用,仍是 AIGC 相关企业面临的关键瓶颈。

作为全球规模最大、最活跃的大模型开发工具与社区,Colossal-AI 再次迭代,提供开箱即用的8到512卡 LLaMA2训练、微调、推理方案,对700亿参数训练加速195%,并提供一站式云平台解决方案,极大降低大模型开发和落地应用成本。

开源地址:https://github.com/hpcaitech/ColossalAI

LLaMA2训练加速195%

Meta 开源的 LLaMA 系列大模型进一步激发了打造类 ChatGPT 的热情,并由此衍生出了诸多项目和应用。

阿忒弥斯美国登月计划

ug齿轮装配怎么约束

最新的7B~70B LLaMA2大模型,则进一步提高了语言模型的基础能力。但由于 LLaMA2的预训练预料大部分来自英文通用知识,而仅用微调能够提升和注入的领域知识和多语言能力也相对有限。此外,高质量的专业知识和数据集通常被视为各个行业和公司的核心资产,仅能以私有化形式保存。因此,以低成本预训练 / 继续预训练 / 微调 LLaMA2系列大模型,结合高质量私有化业务数据积累,帮助业务降本增效是众多行业与企业的迫切需求与瓶颈。但 LLaMA2大模型仅发布了原始模型权重与推理脚本,不支持训练 / 微调,也未提供数据集。

针对上述空白与需求,Colossal-AI 开源了针对LLaMA2的全流程方案,并具备高可扩展性,支持从70亿到700亿参数的模型,从8卡到512卡都可保持良好的性能。

在使用8卡训练 / 微调 LLaMA2-7B 时,Colossal-AI 能达到约54% 的硬件利用率(MFU),处于业界领先水平。而对于预训练任务,以使用512张 A10040GB 预训练 LLaMA2-70B为例,DeepSpeed ZeRO3策略因显存不足而无法启动,仅能通过速度衰减较大的 ZeRO3-offload 策略启动。而 Colossal-AI 则因卓越的系统优化和扩展性,仍能保持良好性能,训练提速195%。

Colossal-AI LLaMA-2训练 / 微调方案的高性能来源于新的异构内存管理系统 Gemini和高性能算子(包括 Flash attention2)等系统优化。新 Gemini 提供了高可扩展性,高鲁棒性,高易用性的接口。其 Checkpoint 格式与 HuggingFace 完全兼容,减小了使用和转换成本。其对于切分、offload 等的设置更加灵活且易用,能够覆盖更多硬件配置下的 LLaMA-2训练 / 微调任务。仅需数行代码即可使用:

    fromcolossalai.boosterimportBoosterfromcolossalai.booster.pluginimportGeminiPluginplugin=GeminiPlugin()booster=Booster(plugin=plugin)model,optimizer,train_dataloader,criterion=booster.boost(model,optimizer,train_dataloader,criterion)

    ShardFormer 多维细粒度并行

    虽然对于主流硬件条件和大多数模型,Colossal-AI 的新 Gemini 已经能够提供良好的性能。但是对于一些极端硬件条件,或者是特殊模型,可能仍然需要多维并行的细粒度优化。现有其他方案通常需要分布式系统资深专家,手动对代码进行大规模重构和调优,Colossal-AI 的 ShardFormer提供了开箱即用的多维并行和算子优化的能力,仅需数行代码即可使用,在单机 / 大规模集群上都能提供良好的性能。

      fromcolossalai.boosterimportBoosterfromcolossalai.booster.pluginimportHybridParallelPluginfromtransformers.models.llamaimportLlamaForCausalLM,LlamaConfigplugin=HybridParallelPlugin(tp_size=2,pp_size=2,num_microbatches=4,zero_stage=1)booster=Booster(plugin=plugin)model=LlamaForCausalLM(LlamaConfig())model,optimizer,train_dataloader,criterion=booster.boost(model,optimizer,train_dataloader,criterion)

      Colossal-AI ShardFormer 支持包括 LLaMA1/2、BLOOM、OPT、T5、GPT-2、BERT、GLM 在内的主流开源模型,也可以直接使用 Huggingface/transformers 模型导入,Checkpoint 格式也与 HuggingFace 完全兼容,对比 Megatron-LM 等需重写大量代码的方案,大大提升了易用性。

      对于并行策略,已支持以下多种并行方式:张量并行、流水线并行、序列并行、数据并行、Zero 数据并行等,并可将多种并行方式组合使用,只需通过简单的配置命令,即可适配各种复杂的硬件环境 / 模型。同时,其内置了各种高性能算子,免去了繁琐的兼容 / 配置过程。其中包括:

      • Flash attention2

      • Memory efficient attention (xformers)

      • Fused Normalization Layer

      • JIT kernels

      云平台大模型一站式解决

      为了进一步提升开发和部署效率,Colossal-AI 团队还将上述系统优势与算力结合,提供 Colossal-AI 云平台,提供廉价算力和开箱即用的 AI 主流应用,包括对话大模型,多模态模型,生物医药等,现已开启内测。

      通过屏蔽大模型底层的分布式并行计算、内存、通信管理与优化等,AI 开发者可以继续专注于 AI 模型与算法设计,以更低成本更快速度完成 AI 大模型助力业务降本增效。

      用户只需要上传相关数据,即可无代码训练个性化私有模型,并将训练好的模型一键部署。相关的应用都经过 Colossal-AI 团队精心优化,得益于算法和系统的双面优化,能大大降低模型训练以及部署的成本。

      Colossal-AI 云平台:platform.luchentech.com

      Colossal-AI 开源地址:https://github.com/hpcaitech/ColossalAI

      参考链接:https://www.hpc-ai.tech/blog/70b-llama2-training


      返回网站首页

      本文评论
      苹果品牌价值增长859% 达到1533亿美元(苹果市值24404.138亿美元=145.090×168.2)
        BrandZ最具价值全球品牌100强昨日发榜,苹果以去年84%的惊人增长,结束了谷歌连续四年雄踞榜首的历史,成为全球最具价值品牌。2006年以来,苹果品牌价值增长了859%,达到1533亿...
      日期:07-27
      揭秘金山毒霸“暗扣”工具:空壳一样的“会员服务”(金山毒霸扣费)
        看了金山毒霸“暗扣门”的报道,笔者感觉恐怕金山网络CEO傅盛的日子在很长一段时间内都不会好过,央视、北京台、纸媒同时曝光,涉案金额巨大,非同小可。网秦之前被315曝光,最...
      日期:07-24
      日本男子吃白饭咸菜20年存下9300万 不结婚只为提前退休_日本人吃咸菜
      为了退休前存够足够的钱,你能接受二十多年时间内仅维持最低的生存开销,放弃美食佳肴,不谈恋爱、不结婚吗?下文的这位日本老哥,就做到了。华为新系统鸿蒙3.0值得更新么近日,日本。...
      日期:07-06
      手机新闻_手机新闻怎么看
      一直是人们关注的焦点。从最新的手机品牌、型号到最新的手机技术和应用,都备受消费者关注。随着时代的发展,手机新闻也不断涌现,接下来,就让我们来看看目前手机新闻的热点话题。...
      日期:05-30
      灵活就业大势所趋,新一代HR-Tech如何进行数字化复合用工管理?
        「我父亲一生只做了一份工作,我的一生将做六份工作,而我的孩子们将同时做六份工作。」   2015年,在接受英国《卫报》采访时,美国共享汽车企业Zipcar创始人Robin Chase这...
      日期:07-17
      三星 sgh u608「三星sghu608」
      三星SGH U608是2006年上市的一款三频GSM手机,拥有时尚的直板设计和精美的金属外壳。该款手机采用2.0英寸彩色屏幕,支持262,144种颜色,并具备相当高的分辨率,提供清晰明亮的画面...
      日期:05-31
      洋码头CEO曾碧波:员工大量流失,但洋码头不会趴下(洋码头创始人曾碧波)
      8月23日消息,今日,针对市场上的诸多流言,洋码头创始人曾碧波发布《致洋码头平台全球买手》公开信,透露了洋码头目前的真实情况:业务受到疫情冲击持续下滑、平台合规改造面临重大...
      日期:08-24
      淘宝斗地主活动「淘宝斗地主大赛热度超过原神 活跃用户超4000万」
      8月2日 消息:近日,淘宝宣布启动为期2个月的“淘宝夏日季”,其中淘宝杯斗地主全国赛于7月24日正式开赛,每天可多次参与比赛,每周通过积分排名的方式获得奖励。用户可以在淘宝搜索...
      日期:08-02
      被喷2年后微软认错 Win11 23H2将不再强制合并任务栏_win11怎么不合并任务栏
      快科技7月26日消息,微软的Win11系统上市两年半了,去年9月份推出了Win11 22H2,这是首个年度重大更新,今年要推Win11 23H2了。在7月份的补丁日中,Win11 23H2的信息也被挖掘出来了,一...
      日期:07-26
      谷歌收购SayNow 将其与Google Voice团队合并_google voice绑定
        谷歌已经收购语音通讯服务创业公司SayNow,可能将其与Google Voice团队合并。交易条款尚不清楚。   SayNow的平台可将语音通讯、一对一通话和集团通话整合到Facebook、...
      日期:07-26
      护航安全!浪潮云“2020攻防演练成绩单”来喽
      马云说电子商务这个字可能下一代特斯拉model x蓝凌智能OA雅迪电动车新闻发布会iqoo顶级旗舰 有道词典告诉你,现代孩子学习工具有多强 滴!浪潮云“春节守护计划”已经上线...
      日期:07-16
      苏宁金融与vivo达成合作 提供“零接触”普惠信贷服务
        近日,苏宁金融与vivo达成合作,旗下任性贷于6月18日正式接入vivo钱包,提供“零接触”普惠信贷服务。与vivo牵手,苏宁金融将充分发挥科技优势,为vivo手机用户提供更便捷、更安...
      日期:07-14
      美国众议院通过2.2万亿「3690亿美元,美国史上最大气候法案获众议院通过」
      实习记者 | 南紫晗历时18个月,美国有史以来针对气候能源领域的最大投资计划即将落地。当地时间8月12日,美国众议院以220票赞成、207票反对通过了《降低通货膨胀法案》。该法案...
      日期:09-27
      “目前最好的文生视频 AI” 来了!做广告、电影都不在话下「文生学校」
      7月11日 消息:最近,一款名为 Pika Labs 的文生视频 AI火了。该 AI 能够生成非常流畅的视频,甚至可以用于广告和电影制作。小米12哪个颜色最值得购买荣耀赵明华为地位从Pika La...
      日期:07-11
      广州印刷展_广印展倒计时   数字印刷亮点抢先看
        (2019年3月18日,北京)第四届中国(广东)国际印刷技术展览会(以下简称“广印展”)将于4月9日-13日在东莞的广东现代国际展览中心举办。本届展会数字印刷馆的看点之一将是...
      日期:10-21
      小米无线鼠标多少钱一个「小米无线鼠标3上架:4色可选 净重57g」
      快科技8月4日消息,小米无线鼠标3现已在京东上架,提供灰色、白色、粉色、蓝色四色可选。从销售页面来看,这款鼠标采用常见的光电模式,支持2.4G 蓝牙双模连接,无可编程键,兼容Window...
      日期:08-04
      磁盘红了怎么办?就找360安全卫士极速版来解决「磁盘红色会有问题吗」
      磁盘红了怎么办这是很多电脑族遇到就会头疼的问题,电脑磁盘满了后,电脑会出现卡顿、故障报错、资料丢失等等故障,对我们日常使用会造成很大的影响。但是有了这款 360 安全卫士...
      日期:04-10
      字节跳动旗下Pico申请XR相关商标_字节跳动买了pico
      9 月 28 日讯:天眼查App显示, 9 月 20 日,字节旗下Pico-VR关联公司北京小鸟看看科技有限公司申请注册多个“PICO XR”商标,当前商标状态均为申请中。苹果 收购 特斯拉领克剪刀...
      日期:09-29
      华为做起AI淘金时代“卖铲人”,天才少年透露“秘密武器”
      7月14日,华为面向AI大模型时代又有大动作,发布了两款新品,为基础模型训练、行业模型训练,以及细分场景模型的训练和推理提供存储解决方案,以更好地释放AI新动能。华为数据存储产...
      日期:07-16
      火星车数字人亮相世界AI大会,祝融号竟然还是百家号创作者_祝融号火星车
        2021年7月8日,第四届世界人工智能大会(WAIC2021)的开幕式上,火星车数字人祝融号惊艳亮相,跟百度创始人、董事长兼CEO李彦宏进行了一场特别的互动。   大会现场,火星车数...
      日期:09-10