您的位置:首页 > 互联网

记者实访:走进全球运营商最大单体智算中心

发布时间:2024-08-25 17:37:51  来源:互联网     背景:

记者实访:走进全球运营商最大单体智算中心 通信产业网|2024-08-20 09:58:59作者:高超来源:通信产业网

【通信产业网讯】(记者 高超)当提及内蒙古,“风吹草低见牛羊”的草原牧歌画卷便浮现于脑海。不过从内蒙古自治区首府呼和浩特中心城区向南行进20多公里,看见的不仅仅是青山绿水大草原,还有一座加速新质生产力发展的新一代数智基础设施。

中国移动智算中心(呼和浩特)位于中国移动呼和浩特数据中心内,是全球运营商最大单体智算中心。

党的二十届三中全会通过的《中共中央关于进一步全面深化改革 推进中国式现代化的决定》对新一代信息技术、人工智能、数据基础设施的发展和建设擘画了新蓝图。智算中心是新型数字信息基础设施之一,扮演的不仅是算力生产者和提供者的角色,也是数字经济发展的核心“底座”。

作为云计算领域的国家队,中国移动以大算力赋能大模型,统筹规划了“N+X”智算中心布局。截至今年6月底,中国移动已有13个智算中心节点投产,智算总规模达到19.6EFLOPS。其中,中国移动智算中心(呼和浩特)智算规模高达6.7EFLOPS,是全球运营商最大单体智算中心。

日前,《通信产业报》(全媒体)在该智算中心实际投产6个月后进行了一次实地采访,探索这座草原之上的智算基础设施。

中国移动智算中心(呼和浩特)智算规模高达6.7EFLOPS。

绿电比例达80%

今年7月,国家发展改革委等部门印发的《数据中心绿色低碳发展专项行动计划》要求,到 2025年底,全国数据中心平均电能利用效率(PUE)降至1.5以下。中国移动积极响应国家绿色智算中心建设要求,从制冷、绿电、能耗管理三个方面,构建节能创新体系,在保障智算中心安全稳定可靠运行的基础上,实现中国移动智算中心(呼和浩特)绿色节能。

中国移动智算中心(呼和浩特)从制冷、绿电、能耗管理三个方面,构建节能创新体系,在保障安全稳定可靠运行的基础上,实现绿色节能。

在制冷方面,该中心首次大规模引入前沿的冷板式液冷方案,并配套闭式冷却塔、小母线等新型节能技术。数据中心园区内95%以上设备采用了新型空调末端,能够实现机柜级就近制冷,缩短了空调送风距离,解决了传统数据中心中常见的局部过热问题,显著提升了整体制冷效率和能效比。

在绿电使用方面,结合内蒙古当地政策指引、丰富的绿电资源、内部偏差率控制、准确掌握电力市场动态及时交易和调整等举措,最大程度提高绿电使用比例。据介绍,该智算中心2023年使用绿电5.25亿度,绿电比例从2019年的41%提升至2023年的55%,当前该中心绿电使用比例更是已达到80%。

在能耗管理方面,该中心构建了一套计量规范、准确度高、分析精准的能耗管理平台,从“监”“管”“控”三个层面实现数智化管控。在监测层,多维度搭建智能化数据底座,为能耗分析及AI建模提供基础数据服务。在管理层,分场景特征构建能耗管理模型,清晰管理能耗情况。在控制层,引入“专家经验”“AI算法”两种调优方式,多步骤实现能耗动态调优。

凭借一系列措施的落地,该智算中心将PUE值大幅压降到1.15,远低于国家设定的目标值,处于国内绿色智算领域的领先地位。

通过一系列措施,中国移动智算中心(呼和浩特)PUE值大幅压降到1.15,处于国内绿色智算领域的领先地位。

本土化率达85%

作为移动信息现代产业链链长,中国移动积极发挥串联、协同、带动作用,坚持自主技术创新,紧密合作本土智算设备和软件企业,建设了以中国移动智算中心(呼和浩特)为代表的首批智算中心,培育和繁荣国产人工智能算力产业生态。

在软硬件设备方面,中国移动已实现五类国产化智能算力芯片落地与实际应用,特别是在中国移动智算中心(呼和浩特),智算服务器整机、软件主要由中国厂商提供,智算芯片也大量采用本土厂商产品。据统计,该数据中心本土化算力占比已超过了85%。

中国移动智算中心(呼和浩特)本土化算力占比已超过了85%。

在多元异构算力整合方面,中国移动持续攻坚基于多芯片的异构混训技术,破解多元异构算力竖井式生态隔离问题,实现多元芯片的算力生态整合。目前“双芯”混训最优训练效率可达90%以上,“三芯”混训也已初步运行成功。

在算力网络底层技术方面,中国移动为践行“为国建云”使命,解决关键技术“卡脖子”问题,于2023年底推出了OpenCOCA开源项目,打造“一机多芯、一卡多平台”的基础设施,实现统一接口接入不同硬件,屏蔽底层多元硬件差异,更好地赋能千行百业。

在智算生态培育方面,中国移动始终注重聚合产业链上下游的力量,通过开放合作、协同创新等方式,不断繁荣中国算力产业。中国移动还积极与知名企业、高校、研究机构等建立合作关系,共同探索算力技术的前沿领域,推动我国算力产业向更高水平迈进。

4399梦幻之城账号交易

中国移动积极推动国产智算生态构建、促进产业协同与技术创新,也将继续发挥央企引领与带动作用,促进中国算力产业持续健康发展。

攻克三大挑战

中国移动智算中心(呼和浩特),不仅是国内首个超万卡国产液冷智算集群,而且也是支撑中国移动对内训练九天大模型、对外满足各行业客户智算业务需求的重要智算基础设施。

不过,与大多数智算中心一样,该中心在建设和运行初期面临三大挑战。首先,在智算中心初期建设运维中,GPU卡故障频发、网络链路不稳定、软件系统存在缺陷等问题比较突出。其次,在多租户环境下,要确保模型的训练效率、资源利用率,并实现数据隐私与安全的有效隔离。最后,在多平台共存条件下,要实现已训练好模型在多种平台间无缝迁移,且保持训练精度与性能不变。

针对超万卡集群调优和运维问题,中国移动采取了三大关键举措,一是打造自动交付工具,实现标准化流程、自动化部署与高效协同作业,提升部署效率与服务质量;二是研发智能管控平台,实现对AI训练任务的全生命周期管理,保障训练高效稳定进行;三是组建专业集成调优团队,专注于模型跨平台迁移、训练效率优化等关键环节,提供全栈调优服务。

针对多租户模型高效训练问题,中国移动首创容器弹性资源管理KOSMOS架构,实现租户间安全隔离,确保多租户环境下的数据隐私与操作独立性,并融合交换机亲和性的任务调度机制,提升AI任务的启动速度,使国产万卡算力资源分钟级拉起,并确保AI任务内节点间的通信链路最优,从而大幅提升整体计算效率与资源利用率。

在模型跨平台迁移方面,中国移动深度整合硬件平台与AI软件栈,推动大模型关键技术在国产化异构算力上的迁移适配。当前已完成16个系列32款模型的训练、微调、推理适配,形成一整套模型迁移工具,可实现不同硬件平台模型训练权重的迁移与接续训练。同时为了对齐NVIDIA环境下的训练推理能力,研发精度与性能分析工具,精准定位并优化迁移中的进度与性能问题,保障迁移后训练精度与性能。

该智算中心在面临多重挑战下,实现了技术突破与服务优化,不仅满足了内外部智算业务需求,还为中国万卡智算集群的建设和运维积累了经验。

该智算中心是中国移动对内训练九天大模型、对外满足各行业客户智算业务需求的重要智算基础设施。

当前,作为数智时代生产力之源的算力,正定义着新的生产力形态和国家治理模式。有研究表明,计算力指数平均每提高1个百分点,数字经济和国内生产总值(GDP)将分别增长3.3‰和1.8‰。

随着数字经济蓬勃发展,算力需求也日益激增,国产算力迎来重大发展机遇。据国务院国资委,截至2024年3月底,中央企业智能算力规模已超过27EFLOPS,到6月底同比实现翻倍增长。

作为信息通信央企,中国移动相关负责人表示,该公司将持续完善智算节点建设布局,打造一批万卡级智算集群,加快超算、量算等多种类型社会算力并网,为社会提供更加丰富、更加优质的智能算力服务。

中国移动智算中心(呼和浩特)机房外景。

责任编辑:晓燕


返回网站首页

本文评论
寒气传到苹果!降低部分员工奖金发放频率、扩大冻结招聘范围_苹果 裁员
3月15日消息,据知情人士透露,苹果推迟了该公司部分团队的奖金发放,并扩大了成本削减努力。此前,许多硅谷科技公司都采取了类似措施,试图在不确定时期精简运营。知情人士表示,这一...
日期:03-15
商汤:上半年亏损净额31.43亿元 同比收窄2%_商汤最新估值
凤凰网科技讯 8月28日,商汤集团股份有限公司今日公布截至2023年6月30日止六个月(“上半年”)的中期业绩。财报显示,商汤科技的半年报,截至2023年6月30日止6个月,集团营收14.3亿,同...
日期:08-29
中国移动重磅发布“九天”人工智能基座,为时代注智,为国家筑基
通信世界网消息(CWW)5月24日,在中国移动人工智能生态大会上,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,旨...
日期:05-24
马斯克:特斯拉有望 2026 年大规模生产人形机器人,供其他公司使用
7 月 22 日消息,北京时间今日傍晚,马斯克在 X(推特)上发文透露,特斯拉明年将生产出“真正有用”的机器人供公司内部使用,但仅仅是小规模生产。2026 年,特斯拉有望大规模生产人形机...
日期:07-23
外媒:美国多家芯片巨头CEO与白宫高官会谈,寻求美政府放宽对华出口限制
路透社7月17日消息,根据美国国务院与消息人士的说法,英特尔、高通和英伟达等美国芯片巨头高管17日与拜登政府官员会面讨论对华政策。据彭博报道,知情人士透露,英特尔、英伟达和...
日期:07-18
国家市场监管总局:进一步强化网络交易监管执法,围绕“双十一”等重要时间节点等开展行政指导
  10 月 9 日消息 据国家市场监管总局网站,在《对十三届全国人大四次会议第 6187 号建议的答复》中,国家市场监管总局表示,市场监管总局及相关部门将从各自职能出发,采取更加...
日期:06-17
Text2Immersion:可通过文本直接生成3D场景
1月3日 消息:Text2Immersion是一种创新的方法,通过文本提示生成高质量的3D沉浸式场景。该项目的流程首先利用预训练的2D扩散和深度估计模型逐步生成高斯云,然后在高斯云上进行...
日期:01-03
笑脸字符代码「支持中文,性能超GPT-4!笑脸排名第一的纯代码模型」
声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。生成式AI代码开发平台Phind在官网发布了最新V7版本,性能方面超越GPT-4,运行效率提升了5...
日期:11-30
2023内容平台关键词盘点:暗藏哪些新趋势?_主流内容平台
声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:光也,授权转载发布。回顾2023年,各内容平台上内容多元且丰富,全年的热梗频出。为此,克劳锐特意梳理了2023年互联网内...
日期:12-29
亚马逊正洽谈成为 Arm IPO 主要投资者 旨在抓住人工智能芯片热度_亚马逊研发
8月9日消息:亚马逊有望成为 Arm 首次公开募股(IPO)的主要投资者之一,与其他科技公司合作参与该交易,预计募资额可达 100 亿美元。消息人士透露,亚马逊是多家科技公司中的一员,已与...
日期:08-09
魅族广告真多「Xperia手机惊现魅族20广告:索尼称已联系魅族清除」
微博博主“ZACKBUKS”爆料称,索尼Xperia手机上的天气App中出现了魅族20手机的广告。台积电2023年工艺近日,微博博主“ZACKBUKS”爆料称,索尼Xperia手机上的天气App中出现了魅族...
日期:08-07
微软:将奖励零售商以扭转WP销售不佳
  10月10日消息,微软正设法扭转Windows Phone销售不佳的颓势,依靠三星等其他制造商合作伙伴来加强对零售商的销售奖励,增加店内促销。   日前,微软移动部门总裁安迪·里斯...
日期:07-23
西安不倒翁小姐姐回应生娃后变憔悴:少贩卖焦虑「西安不倒翁小哥」
近日,西安大唐不夜城的演员冯佳晨成为网络热议的焦点。一段“大唐女子绝美牵手”的短视频中,她扮演的“唐妞”宛如随风摇摆,轻舞罗扇,将中国唐朝美人的妩媚娇羞演绎得淋漓尽致。...
日期:02-09
微信8.0.0主要更新_微信 8.0 状态大更新
  (原标题::去掉 “微信 8.0”“聚餐”,新增 “裂开”“带娃”“浪”“宅”....)   今年 1 月份,腾讯微信团队发布了微信 8.0 大版本更新,在微信 8.0 中增加了全屏播放炸弹...
日期:07-16
倒反天罡 道反天罡「倒反天罡,人类研究起模仿AI了。」
声明:本文来自于微信公众号 数字生命卡兹克,作者:,授权转载发布。还记得一个月前,用AI视频玩鬼畜很火吗。比如让卢本伟吃屏幕,诸葛亮馋死王朗啥的。这种AI整活,基本能在B站快手上...
日期:08-16
AirPods Pro 2翻车:喜提音频漂移_airpods pro 失真
时隔三年,苹果终于为AirPods Pro带来了新品,不过新品表现有点差强人意,爆料称,AirPods Pro 2无线耳机自上个月发布以来出现了很多bug,具体体现在用户听音乐时的音频漂移问题,甚至...
日期:10-18
美国盟友集体倒戈「陆续反水,美国压不住盟友了,为了生存纷纷加快对中国出货」
随着荷兰ASML对中国的光刻机出口增长18倍,日本芯片设备产业也开始计划放弃跟随美国脚步,希望对中国出口芯片设备,其中尼康已经行动起来了,这意味着美国打造的联盟已经破裂。这几...
日期:11-25
五维递进学习法锻炼口才,智伴小Y便携机器人让孩子能说善道
  语文是锻炼综合素质的基础,它不仅可以帮助孩子提高表达能力、自信心,还能让孩子的组织能力、思维能力更加优秀突出,提升孩子的综合素质能力。   从小学开始,语文就是...
日期:06-11
潘展乐全红婵进暑假作业:学校紧跟时事_潘展乐少泳校
8月15日消息,据媒体报道,有网友发文称在暑假作业里发现了关于奥运冠军潘展乐、全红婵的试题。对此,网友纷纷表示,现在学校作业这么紧跟时事吗?联想ibm thinkpad哪个系列好还有网...
日期:08-16
这3个版本的教材都出现过“故天将降大任于斯人”:是人并非_故天将降大任于斯人也的道理
最近,关于故天将降大任于是人还是斯人也,引发了各种讨论。同时,全民考证也热火朝天地兴起。媒体搜集网上资料发现,至少在北京出版社2019年出版的义务教育教科书《语文》(九年级下...
日期:11-01