您的位置:首页 > 互联网

大模型训练可“自动驾驶”,蚂蚁集团全面开源相关技术

发布时间:2024-02-05 16:18:37  来源:互联网     背景:

通信世界网消息(CWW)近日,蚂蚁集团AI创新研发部门NextEvo全面开源AI Infra技术,可帮助大模型千卡训练有效时间占比超过95%,能实现训练时“自动驾驶”,这推动了AI研发效率。

该技术框架名为DLRover,目标在于大规模分布式训练的智能化。目前很多企业的训练作业都是跑在混合部署的集群中,运行环境复杂多变,不管多么“崎岖的地形”,DLRover都可以“轻松行驶”。

苹果更新系统电池健康度下降

完成一个千亿参数级别的大模型,如GPT-3,用一张卡训练一次要耗时32年,那么训练时的算力利用尤为重要。方法之一是把能用的算力用得更好,比如进一步压榨已购买GPU的性能;二是把以前利用不了的算力用起来,比如CPU、内存等,这就需要通过异构计算平台来解决。

据悉,最新集成进DLRover的是Flash Checkpoint(FCP)方案。模型训练时,一般要打Checkpoint(检查点),以便中断时能恢复到最近状态,目前常规的做法,存在着耗时长、高频打点易降低训练可用时间、低频打点恢复时丢失过多等缺点。新方案FCP应用在千卡千亿参数模型训练后,Checkpoint 导致的训练浪费时间降低约5倍,其中持久化时间降低约70倍,有效训练时间从90%提升至95%。


返回网站首页

本文评论
安超云荣获可信云2022-2023年度技术最佳实践奖!
2023 年 7 月25- 26 日,由中国信息通信研究院、中国通信标准化协会主办,中国通信标准化协会云计算标准和开源推进委员会承办,中国IDC圈协办的第十届可信云大会热烈召开。本次大...
日期:07-27
2030年人工智能「2024年人工智能趋势展望:从炒作到现实的碰撞」
12月20日 消息:2024年将是人工智能行业承前启后的关键一年,泡沫逐渐褪去,现实的锋芒开始显露。让我们一窥未来,看看 AI 将在哪些方面掀起波澜:1. 商业化浪潮席卷 OpenAI: 告别...
日期:12-20
Gurman:预计苹果 2022 款 iPad Pro 于本周二发布,配备 M2 芯片_ipad pro 2020 ram
IT之家 10 月 18 日消息,彭博社 Mark Gurman 最新报道,苹果公司计划在本周二(10 月 18 日)宣布推出采用 M2 芯片的 2022 新款 iPad Pro。英创力股票Gurman 之前说,2022 更新的 11...
日期:10-18
构建“标准化+”网络安全业态 腾讯零信任安全标准草案获行业共识
  “零信任”安全技术的标准化再度提速。近日,在由中国通信标准化协会主办、腾讯承办的网络与信息安全技术工作委员会(TC8)第二十六次全会上,腾讯主导的零信任安全标准草案...
日期:11-09
人工智能可能是一种抑制通货膨胀的技术 全球最大资产管理公司-CEO
6 月 15 日消息,据彭博社报道,全球最大的资产管理公司贝莱德(BlackRock)首席执行官拉里・芬克昨日表示,人工智能(AI)具有提高生产力的巨大潜力,并最终可以起到抑制通货膨胀的作用。...
日期:09-24
梅赛德斯-奔驰CEO:在可预见的未来,电动汽车成本仍将高于燃油车
9月4日消息,德国梅赛德斯-奔驰集团股份公司董事会主席、首席执行官(CEO)康松林上周日表示,在可预见的未来,生产电动汽车的可变成本仍将高于内燃机车型,并称这将继续加剧本已激烈的...
日期:09-04
三大重磅成果发布!超聚变亮相2023中国算力大会
(原标题:三大重磅成果发布!超聚变亮相2023中国算力大会) 天猫双十一微博分会场 8月18日至19日,由工业和信息化部、宁夏回族自治区...
日期:08-22
环球音乐发行公司「谷歌与环球音乐正在就人工智能生成音乐授权进行谈判」
8月9日消息:谷歌和环球音乐正在洽谈授权艺术家的旋律和声音,以用于由人工智能生成的歌曲,以此来将音乐业务最大的威胁之一变现。据四名知情人士证实,这些讨论旨在建立一项新的...
日期:08-09
今日恒指为何暴跌「恒指收跌0.83%,新东方在线涨超11%」
  讯 10月3日下午消息,恒指收跌0.83%,恒生科技指数收跌0.67%;房地产、半导体、教育板块走高;新东方在线涨超11%,九毛九涨超12%。三星note5最新系统版本打击侵权和假冒伪劣工作...
日期:10-05
VIA 100美元低价平板电脑性能欠佳 难抗衡iPad
  根据2010年台北国际计算机展(Computex)上参展的低价位平板电脑性能调查结果,“The INQUIRER”网站6月3日宣称,售价位于100美元以下的平板电脑性能和苹果iPad 、华硕Eee Pad...
日期:07-29
36个月超长质保行业天花板!魅族20系列超前预订来了:只要1元「魅族2020还有新产品吗」
进入2023年,魅族各种大动作不断,其中就包括声势浩大的魅族20系列各种预热,按照官方节奏,魅族20系列将在今年春季发布,最有可能的时间就是即将到来的3月份。今日,魅族科技官方宣布,...
日期:03-01
AI图像生成工具Visual Electric发布多张图像组合重绘功能_ai结合图形
12月15日 消息:昨晚,AI图像生成工具Visual Electric推出了两个强大的功能,为AI图像创作流程降低了门槛。首先,它允许用户将生成的多张图像进行组合并进行重绘。其次,用户可以利...
日期:12-15
全面内卷的美妆品牌,如何突破营销困局?
声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:吴锐,授权转载发布。如今,美妆护肤几乎成为了年轻人日常生活的标配,美妆产品的目标消费群体在不断扩容,营销方式与内...
日期:08-22
警惕四大AI新骗术!有人10分钟被骗430万_国内ai骗局
作者 | 吴菲凝 李水青编辑 | 心缘最近几天,AI新骗局在全国炸开了锅。前有AI论文造假和新闻造假,后有疑似AI换脸的杨幂、迪丽热巴出现在直播间卖货。昨日内蒙古包头的一起“AI...
日期:05-26
连续公开炮轰后:马斯克暗示将起诉OpenAI「马斯克回应」
快科技4月19日消息,作为OpenAI最早的投资者之一,马斯克目前与OpenAI的关系却并不理想,甚至多次在社交平台公开攻击OpenAI。近日,有用户在推特上询问马斯克为什么不起诉OpenAI欺...
日期:04-19
魅族新专利公布:把耳机做到手机中 还能当摄像头「魅族手机前置摄像头不能用怎么办」
2月2日消息,珠海市魅族科技有限公司申请的一种智能移动终端”专利公布。据专利信息,这种智能移动终端,包括终端主体,终端主体显示面、非显示面以及集成模块。设计师必备的5款绘...
日期:02-03
“罗技AI全家桶”亮相北京InfoComm China迎接多元办公时代,助力企业全面降本增效
7 月 19 日,罗技携重磅新品“罗技AI全家桶”及多种商用解决方案,第四次亮相专业试听和集成体验平台InfoComm China2023 展会。在本次北京举办的行业盛会上,罗技带来了以AI科技...
日期:07-21
amd显卡rx系列的笔记本「首款接近4GHz的显卡就此诞生?AMD RX 7000这是要上天」
10年前AMD推出了HD 7970 GHz Edition显卡,这是首款核心频率达到1GHz的显卡,直到现在显卡的核心频率只是2GHz以上,NVIDIA的GTX 4090说是要冲击3GHz,没想到AMD更猛,RX 7000中或许会...
日期:09-27
淘宝房产逆市热卖 日均在线卖十套
在网上买衣服、食品,对不少人而言早已是“家常便饭”,在网上买一套价值百万的房子,估计大多数人还不敢相信。但是,根据淘宝房产频道        (http://house.taobao.com)的统...
日期:07-24
比尔·盖茨:盖茨基金会与中国农科院合作,帮尼日利亚水稻增产50%
5月26日消息,2023年中关村论坛全体大会上,比尔·盖茨发表主题演讲。比尔·盖茨表示,危机不分国界,因此我们必须致力于跨国合作、携手应对。新冠疫情至今已在150多个国家和地区造...
日期:05-27