您的位置:首页 > 互联网

yandex开发实操Yandex开源LLM训练工具节省高达20%的GPU资源_yandex x86

发布时间:2024-06-12 00:33:10  来源:互联网     背景:

来源:中关村在线

2024年6 月11 日,莫斯科——跨国科技公司Yandex 最近推出了YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。YaFSDP是目前最有效的公开可用工具,用于增强GPU 通信并减少LLM 训练中的内存使用量,与FSDP相比,其训练速度提升最高可达26%,具体取决于架构和参数数量。通过使用YaFSDP 减少LLM 的训练时间可以节省高达20% 的GPU 资源。

yandex引擎

Yandex承诺为全球人工智能社区的发展做出贡献,将YaFSDP开源提供给全球的LLM开发人员和人工智能爱好者即是履行此承诺的其中一步。

“目前,我们正在积极尝试各种模型架构和参数大小,以扩展YaFSDP的多功能性,”Yandex高级开发专家、YaFSDP团队成员Mikhail Khruschev指出,“我们很高兴与全球ML 社区分享我们在LLM训练方面的研发成果,希望能为全球研究人员和开发者获得更多的开源工具和更高的效率做出贡献。”

YaFSDP案例

LLM训练是一个耗时且资源密集的过程。机器学习工程师和自主开发LLM 的公司投入了大量的时间和GPU资源(相当于金钱)来训练这些模型。模型越大,其训练所需的时间和费用就越高。

Yandex的YaFSDP优化了学习速度和性能,使全球的AI开发人员在训练模型时可以使用更少的计算能力和GPU 资源。例如,在涉及具有700亿个参数之模型的预训练场景中,使用YaFSDP 可以节省大约150 个GPU的资源,这意味着每月可以节省大约50 万美元到150万美元(取决于虚拟GPU 提供商或平台)。

YaFSDP通过消除GPU通信效率低下来提升效能,确保训练时只需必要的处理器内存,并使GPU 交互不间断。

英特尔啥时候出新cpu

YaFSDP的训练效率

YaFSDP是FSDP 的增强版,在LLM训练中最耗通信的阶段(如预训练、对齐和微调)中,其表现优于FSDP 方法。YaFSDP在Llama 2 和Llama 3上展示的最终提速表明训练速度显著提高,在Llama 2 70B 和Llama 3 70B 上分别达到21% 和26%。

MikhailKhruschev 表示:“YaFSDP在130 亿至700亿个参数的模型上表现出色,在300 亿至700亿个参数范围内表现尤为惊人。目前,YaFSDP最适合基于LLaMA架构的广泛使用之开源模型。”

YaFSDP并不是Yandex的第一个开源工具。该公司之前曾分享过其他几款在ML 社区中很受欢迎的工具,包括:

CatBoost:一种高性能的基于决策树之梯度提升库。

YTsaurus:分布式存储和处理的大数据平台。

AQLM:最先进的量化算法之一,用于大型语言模型的极限压缩。由 Yandex Research、HSE 大学、 IST Austria 及 NeuralMagic 共同开发。

Petals:是一个旨在简化 LLM 训练和微调过程的库,由 Yandex Research、HSE 大学、华盛顿大学、Hugging Face、巴黎-萨克雷高等经济学院和 Yandex 数据分析学院合作开发。


返回网站首页

本文评论
联想集团非PC占比已达近40%:软硬双引擎持续高增长_联想pc市场份额
2023/5/24 13:18 联想集团非PC占比已达近40%:软硬双引擎持续高增长   2023年5月24日——全球数字经济领导企业联想集团(HKSE:992)(ADR:LNVGY)公布截至2023年3月31日的2022/23...
日期:05-26
项目顺利进行!小米汽车售价曝光:用宁德/比亚迪双电池 、雷军押上全部声誉造
对于有传闻称,小米造车被叫停。小米方面人士表示,不针对传言回应,小米汽车项目正在顺利推进。按照之前曝光的消息看,小米的第一款车将是轿车,并且已确定激光雷达供应商为禾赛科技...
日期:11-03
现场实测,三大能力超越ChatGPT,科大讯飞「星火」大模型如约而至
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:吴昕,授权转载发布。历时5个月、100多天,5月6日下午2点,科大讯飞「星火」认知大模型如约而至。发布会独具匠心,亮点...
日期:05-07
比尔·盖茨成美国最大私人农田“地主”  背后原因太现实「24.2万英亩农田!比尔-盖茨成为美国最大私人农场主」
1月29日消息,根据2022年版《土地报告100》的数据,前世界首富比尔盖茨已经在美国拥有超27万英亩农田,这相当于1090平方千米多土地,接近北京通州区的面积,比尔盖茨也成为目前美国最...
日期:01-29
传闻中的iPad Pro发布前夕 Apple Store下线维护
苹果公司在当地时间今天上午可能会发布新的iPad Pro型号,也有可能同时提供其他产品,苹果在线商店目前已经关闭。当这种情况发生时,苹果通常会用新产品更新其商店。在该公司首席...
日期:10-20
宁德时代:公司会做大量工作去支持车企客户发展 但不会造车
7月4日消息,日前,有投资者在互动易平台上向宁德时代提问,宁德时代是否有发展汽车生产制造的战略规划;也有投资者强烈建议宁德时代切入整车产业链,实现全面的业务发展。电视闪屏是...
日期:07-04
Gemini AI官网体验入口 AI聊天软件app免费下载地址
Gemini是谷歌开发的最强大和通用的AI模型,它是一个多模态模型,为三种不同的大小(Ultra、Pro和Nano)进行了优化。点击前往Gemini AI官网体验入口苹果14promax128g今日价格山东能...
日期:12-22
内容审核,靠人工还是靠机器?_为什么需要人工审核
  去年开始,快手、火山小视频等数十家短视频社交平台在数月内相继被网信办约谈,短视频社交平台从此迎来了一系列大刀阔斧的整改篇章。不久前,网信办会同有关部门对吱呀、语...
日期:06-28
科技公益进行时,腾讯天籁在全国爱耳日推出线上听力健康测试
  据世界卫生组织最新发布的《世界听力报告》数据显示,目前全球五分之一的人听力受损,听力损失影响全球超过15亿人,其中4.3亿人听力较好的耳朵有中度或以上程度的听力损失,听...
日期:07-16
ictc2021「持续打造 “ICT中国样本”ICT中国(2023)案例征集结果发布」
一加11pro配置详细11月30日,由中国通信企业协会和中国邮电器材集团有限公司共同举办的ICT应用创新与数字经济发展论坛在海口希尔顿酒店成功举办!论坛发布ICT中国(2023)案例征集...
日期:12-01
《魔兽世界》回应国服为何先开“巫妖王之怒”:准备时间比正式服快
快科技6月6日消息,今日,《魔兽世界》宣布国服将于6月11日起,开启为期7天的巫妖王之怒”技术测试,预计6月内正式开服。同时,官方还向正式服玩家郑重道歉:对不起,大家还需要再等待一...
日期:06-06
截图曝光 俞敏洪回应面临孙、董二选一:没事 没这么严重_俞敏洪是ceo吗
快科技12月14日消息,针对网传截图面临孙、董二选一一事,有媒体向俞敏洪予进行了求证,他称没事,没这么严重。”2014神曲此前,一份内部流出的聊天记录显示,俞敏洪目前面临要保CEO孙...
日期:12-14
国家发改委:支持5G、AI等新技术融入民生设施,弥合数字鸿沟「5g数字经济产业赋能研究中心」
  记者 周頔  9月26日,国家发展改革委就基础设施建设有关情况举行专题新闻发布会。会上有媒体提问:近期国务院常务会议几次研究稳投资工作,无论政策性开发性金融工具还是设...
日期:10-03
比亚迪5月新能源车销量24.02万辆 再创历史新高_比亚迪5月各车型销量
【】6月1日消息,比亚迪公布了5月销量成绩,当月累计销量240220辆,同比增长 97.63%。此外,5月份比亚迪汽车产量达到了246259辆,同比增长99.34%,产销双双创历史新高。加载速度最快的...
日期:09-25
AI席卷华尔街:对冲基金部署ChatGPT,银行展开“军备竞赛”「华尔街对冲基金公司」
·华尔街正在探索以ChatGPT为主的最新流行工具,希望通过提供足量的金融信息,使机器达到合理地为期权定价、建立投资组合或分析公司新闻的能力水平。·在最热衷于AI的银行中,大...
日期:06-03
沙特阿美投资中国AI初创企业智谱AI 估值达30亿美元_沙特阿美投资公司
6月3日 消息:据国外媒体报道,沙特阿拉伯国有石油集团沙特阿美的风险投资部门Prosperity7近日参与了中国生成式人工智能初创企业智谱AI的新一轮融资,投资金额约为4亿美元,使得智...
日期:06-03
有伤口的时候不能吃酱油吗「有伤口不能吃酱油系谣言 专家:应保持理性思考」
近日,社交平台上出现了一些关于饮食与皮肤健康之间关系的言论,如“有伤口不能吃酱油”和“有些蔬菜越吃皮肤越黑”等。然而,经过专业分析,这些言论均缺乏科学依据,被认定为谣言。...
日期:03-14
「金山文档」正式上线统信 UOS 应用商店:已适配 ARM / x86 架构_统信uos支持软件
  近日,「金山文档」正式上线统信应用商店,为统信 UOS 用户提供简单、高效、安全的协作办公体验。   统信 UOS 版「金山文档」已适配 ARM / x86 架构,统信 UOS 用户可根...
日期:07-17
工作四年后,火星洞察号迎来了它的退休生活,会是怎样的?_火星探测器洞察号
“谢谢你,曾经与我在一起”——洞察号失联,NASA宣告任务结束洞察号陷入沉默:自2018年11月26日着陆以来,洞察号一直在研究火星的地表和内部。无法通信后,NASA将其退役。图片来自NA...
日期:12-15
夏天“成年人的较量”,从2000元一把水枪开始_夏日水枪活动
声明:本文来自微信公众号“电商在线”(ID:dianshangmj),作者:王亚琪,编辑:斯问,,授权转载发布。一生要强的年轻人,打水仗也不能服输。大到水柱发射的距离、角度,小到水枪补水的速度、...
日期:08-04