您的位置:首页 > 互联网

国内运营商最大单集群智算中心出圈,按下国产算力加速度_智算中心和超算中心

发布时间:2024-09-10 01:38:50  来源:互联网     背景:

通信世界网消息(CWW)算力正如水、电一般,正在逐日成为现代社会赖以生存的重要基础资源。全国各地都在紧锣密鼓地“上马”各种智算项目,算力不仅是新质生产力发展的关键抓手,又是各地方招商引资的有力手段。

智算中心和超算中心

然而,算力利用率低、东西供需不平衡、国产化算力不足等成为目前我国算力高质量发展面临的窘境。当下,大模型产业井喷式发展再度加剧了智能算力紧张的局面。近日,中国移动智算中心(哈尔滨)(以下简称哈尔滨智算中心)建设完成并投产使用为打破以上困境带来了新的解题思路。

万卡集群:智算新标杆让算力迈上新台阶

据不完全统计,截至今年6月,各地方政府参与建设并已投产的智算中心数量已接近百个。

与其他不同的是,近日建设完成并正式投产使用的国内运营商最大单集群智算中心——哈尔滨智算中心,更将“大”表现的淋漓尽致。

“单集群拥有超过1.8万卡的丰富资源,可提供6.9EFLOPS(每秒690亿亿次浮点运算)智能算力。”该智算中心具有单集群算力规模最大、国产化网络设备组网规模最大等特点,技术领先、自主可控,可为万亿级大模型训练提供高效、稳定、安全可控的算力底座。

智能计算集群系统

通俗地说,单集群智算中心,就是把所有AI加速卡打造成1个集群,用以支持千万亿级参数的大模型进行训练。通过先进的智算网络技术把上万块GPU芯片像“积木”一样拼接在一起,大幅提升GPU节点间的通信效率,使其在瞬息之间便能处理海量数据与复杂计算任务。

智算中心和超算中心

哈尔滨智算中心可有效提升区域乃至全国的算力服务水平。在此之前,智算规模大多在一万卡以下,对于千亿或者万亿模型训练来说,仍会在一定程度上受限于底层的算力资源。哈尔滨1.8万卡集群的建成和投入,将更有利于模型团队充分利用底层资源,通过并行度更高的训练策略,加快模型训练进度。大规模智算落地绝非简单的规模数量堆叠,其复杂程度呈指数级增加,对智算建设运营者的技术实力、资源优势、产业协同能力有着很高的要求,中国移动做到了。

i52500配1060显卡

不仅如此,面对大规模万卡集群建设的严峻技术挑战,中国移动研究院作为中国移动的技术创新中坚力量,为哈尔滨智算中心建设提出了一系列突破性和创新性的技术方案,围绕“新互联、新算效、新存储、新平台、新节能”五大创新技术领域展开了系统性重构,并制定了《中国移动NICC新型智算中心技术体系》。哈尔滨万卡集群是业内首个大规模应用融合存储的集群,也是首个落地中国移动原创智算网络全调度以太网(GSE1.0)的万卡集群,并应用中国移动自研“AUTO行云”算网基础设施自动化平台实现万卡集群自动化验收的全量设备覆盖。这充分彰显出中国移动在科技创新的研发实力和技术优势。

中国速度:两个“100天”,AUTO挑战极限助力验收

通常IDC 数据中心规划到投产所需的时间受多种因素影响,会有较大差异,一般来说可能需要1-3 年左右。哈尔滨智算中心从2024年3月规划到2024年9月投产交付,仅用了两个“100天”,建成交付,创下IDC建设新的“中国速度”。

要知道,在哈尔滨智算集群建设过程中,智算基础设施不仅要满足上层大模型业务的极致运行和性能要求,还要面临万卡、国产化等规模和生态的多重挑战,亟待在智算基础设施硬件及网络层面保证建设、交付、运维各阶段保障效率和质量的“双达标”。“AUTO行云”平台在哈尔滨智算中心建设验收过程中,为智算基础设施高质量交付“严把关”,保障后续大模型的稳定运行。

“AUTO行云”是中国移动研究院自主研发、致力于提升算网基础设施集成验证交付效率和质量的自动化平台。前期AUTO BOX承载的都是千卡集群,哈尔滨智算中心是AUTO验收的第一个万卡集群。

据了解,哈尔滨1.8万卡超大规模智算集群中,一轮自动化测试覆盖总计约25万个测试用例,涉及6000多台各类服务器和交换机设备,以及近7万多条网络连线,无论从规模数量、设备多样性、配置参数、建设进度等都是一项巨大、复杂的系统工程。但凭借AUTO工具的优越性能以及AUTO团队的丰富经验,在哈尔滨1.8万卡超大规模智算集群中,2小时内即可对所有设备和网络连线进行一轮自动化全量检查,对智算中心高质量、高效率交付发挥了非常关键的作用。AUTO工具的应用使得验收效率整体提升73%,进一步节省智算集群的上线时间、耗电、人工等多项成本。

如果说哈尔滨智算中心刷新了业界AI大模型训练集群的规模,那么AUTO无疑是其高质量投产的关键助力。如果说,哈尔滨智算中心为我国智算基础设施建设树立了新的标杆,那么AUTO在哈尔滨智算中心建设快速投运这场战役中可谓功不可没。

创新突破:算力国产化跑出加速度

从规模“大”到建投速度“快”,哈尔滨智算中心让外界看到更多是中国移动的技术硬实力。

但万卡集群的构建并非简单的GPU卡堆叠,而是一项高度复杂的超级系统工程。从全调度以太网技术的首次成功应用再到融合存储技术的大胆引入,哈尔滨智算中心建设的背后技术离不开一个“新”。

哈尔滨万卡集群中使用的国产化融合存储技术是业内首个大规模应用融合存储的集群。融合存储技术不仅节省了大量存储容量,还巧妙避免了数据在不同存储系统之间的无效流转,使大模型训练效率提升可达星期级。

全调度以太网(GSE)技术方案打破了西方科技巨头垄断,通过创新算网协同的负载均衡技术和端网协同的拥塞控制技术,实现网络互联的升级,为智算中心提供高性能的连接网络,将训练过程通信时间占比缩短20%以上,达到国际领先水平。

同时,中国移动智算中心(哈尔滨)AI芯片国产化率100%,首次通过国产网络设备探索1.8万张智算卡单集群部署规模上限。中国移动研究院积极主动地推动国产 GPU 在智算中心的广泛应用,有力证明了国产 GPU 同样能够建设高效的超万卡集群。他们以强烈的央企责任担当,以创新架构、系统集群、绿色低碳为关键战略支点,全力推动培育形成国产人工智能算力产业生态,成功实现多家国产化智能算力芯片落地与实际应用,为国产算力的蓬勃发展搭建了广阔舞台。

dr钻戒营销现状

罗欣药业

算力是生产力,也是创新力。当前,国产算力已经觉醒,但国产算力的崛起,拼的不止是AI芯片,还要围绕计算、网络、存储等关键环节,汇聚科技力量,提升自主创新能力,加大研发投入,实现高端芯片、新型数据中心、超算等领域的研发突破,推动算力产业高质量发展。

哈尔滨智算中心的建成投产,不仅在规模上达到了新的高度,为大模型训练提供了强大的算力支持,更在建设速度、技术创新、国产化应用等方面树立了标杆。展望未来,中国移动将继续发挥创新主体和产业引领作用,为超十万卡集群的创新突破做好技术储备,与合作伙伴共同实现国产智算设施的跨越式发展。

华为开发者大会学生票


返回网站首页

本文评论
实机已出 苹果AR/VR头显实机照被曝光_苹果VR、AR
此前有传闻称苹果AR/VR头显示将搭载主/协两个处理器,主处理器为M2 Staten定制化处理器+协同处理器Bora,这两款处理器均由台积电生产,最快将在2023年秋季发布会上发布。目前已知...
日期:01-11
圣诞将至,字体超市派发圣诞字体海报啦!_圣诞节 字体
圣诞节庆模式即将开启,您的圣诞字体包是否已经准备就位?还没准备的朋友们赶紧看过来,字体超市已经为小伙伴精选一波以“圣诞”为主题的精品好字,与您共同欢庆圣诞节。义启圣诞...
日期:12-23
马斯克称已为第二位人类植入脑机芯片_马斯克脑部芯片移植
8月4日 消息:埃隆·马斯克今日宣布,其旗下的脑机接口技术先驱企业Neuralink再次取得突破性成就,成功为第二名人类患者植入了先进的脑机接口芯片。这一里程碑事件,不仅标志着自...
日期:08-04
曝华为Mate 70十月上市:跟骁龙8 Gen4旗舰撞期_2023年华为mate70
快科技6月21日消息,博主数码闲聊站爆料,华为Mate 70系列上市时间跟第一批骁龙8 Gen4、天玑9400旗舰撞档。已知第一批骁龙8 Gen4旗舰、天玑9400旗舰会在10月登场,这意味着Mate 7...
日期:06-22
苏宁315全民焕新节:斩获4大榜单头名,美素佳儿成最大赢家
  今天苏宁全民焕新节终于迎来了它最重要的一天,315国际消费者权益日。作为以新品上新、以旧换新、服务用心三大计划,八大产业联合打造的“苏宁全民焕新节”,苏宁最主要的目...
日期:10-27
北京互联网法院开审中国首例 “AI文生图” 案
凤凰网科技讯8月28日,据北京互联网法院官方账号发文表示,北京互联网法院近日依法公开开庭审理了一起“AI文生图”著作权案,该案为我国首例涉 “AI文生图”案。该案庭审过程由中...
日期:08-28
华为对平板电脑提价 或因存储价格上涨_华为对平板电脑提价 或因存储价格上涨的影响
DoNews11月15日消息,近日有消费者发现,华为大屏平板MatePad Pro 13.2悄悄涨价了。在华为官网上的MatePad Pro 13.2的起售价由此前发布的5199元上涨至了5699元。facebook账户被...
日期:11-15
Google明日开发布会 公布社交搜索功能
  北京时间6月14日消息,据国外媒体报道,科技博客网站Search Engine Land编辑丹尼·沙利文(Danny Sullivan)发布到网上的邀请函显示,Google将于明日邀请媒体在旧金山参加“Insi...
日期:07-30
智能音箱三巨头差距缩小 百度出货量环比增速第一_智能音箱销量排名
  Canalys日前发布报告称,全球智能音箱的出货量有望于2019年达到2亿。中国智能音箱出货量有望于2019年实现5990万台,同比上涨166%,百度出货量环比增速第一。Juniper Researc...
日期:09-18
如果不做直播不接专车-手机支架意义也不大 蔚来汽车李斌
4月21日消息,日前,蔚来汽车CEO李斌直播演示蔚来全域领航辅助NOP+在北京城区的表现。在直播时,李斌谈到了最近争议较大的车载手机支架的话题。李斌称,汽车出厂自带支架可能对专车...
日期:04-21
沙发english「沙发英语创新学习方式引领教育装备领域新潮流」
2024年4月19日至21日,第83届中国教育装备展示会在重庆国际博览中心盛大举行。本届展示会由中国教育装备行业协会主办,重庆市教育委员会、重庆两江新区管委会、重庆市渝北区人...
日期:04-29
马斯克 美国证监会「美证监会拒绝马斯克退出和解协议:他仍需要“推特保姆”看护」
凤凰网科技讯 北京时间2月24日消息,美国证券交易委员会(SEC)本周在写给纽约第二巡回上诉法院的一封信中辩称,特斯拉公司CEO埃隆马斯克(Elon Musk)仍然需要一个所谓的“推特保...
日期:02-25
模型大师「大模型走捷径刷榜?数据污染问题值得重视」
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。我直接看答案。生成式 AI 元年,大家的工作节奏快了一大截。特别是,今年大家都在努力卷大...
日期:11-10
中国联通增强UPF赋能核心生产领域,携手佰工钢铁推动5G+工业互联网深度融合
通信世界网消息(CWW)近日,中国联通智网创新中心、河北联通、华为公司联合秦皇岛佰工钢铁完成了全国首个5G专网增强UPF(用户面功能)的商用部署,这是5G专网赋能智能制造由示范推广阶...
日期:07-17
收购靴子落地!斥资最高4.86亿元亿收购Samton,新纽科技或迎来全方位升级
  8月15日,国内领先的金融IT方案解决提供商新纽科技(09600.HK)发布公告,将以最高4.86亿元的价格收购Samton (Cayman) Holdings Limited(下称“Samton”)100%股权,Samton的境...
日期:09-11
京东否认正进行人员调整:没有任何类似计划_京东宣布
12月13日消息,据媒体报道,目前京东正进行人员调整,涉及物流、科技、零售、工业等业务条线,赔偿金为N+1,没有年终奖。有员工透露,不同部门的比例有所不同,其所在的部门比例较大,年后...
日期:12-13
苹果手机高价回收多少钱「苹果手机估价近3000回收却给500引热议 网友:到手屠龙刀」
快科技12月21日消息,你的旧手机是留着当备用机还是卖给二手平台呢?日前,苹果手机估价近3000回收却给500”的话题登上微博热搜,引起网友热议。vivo首款折叠屏手机x fold 正式发布...
日期:12-21
闲鱼开收软件服务费!分析师点评可靠吗「闲鱼开收软件服务费!分析师点评」
5月17日消息,闲鱼APP发布公告称,闲鱼社区拟对于在平台开展高频且高额交易的卖家收取软件服务费,对于其他卖家及所有买家继续免收软件服务费。本次收费政策预计于2023年6月6日正...
日期:05-17
4399游戏盒精彩呈现《穿越火线》游戏下载_4399游戏盒精彩呈现《穿越火线》
  要想知道一款网游是不是够火,最好的证明不是百度、Google,而是当你在各种类型的网游里折腾时,都能听到有人对你说这样的话:“我们去玩××游戏吧”。如果是这样,那就说明这...
日期:07-27
拆解Mate60-Pro彰显出华为的独创性 正重拾辉煌 外媒
来源:中关村在线华为最新旗舰手机Mate60 Pro在中国市场推出后,销售情况非常火爆。与此同时,该系列在刚刚结束的双十一活动中也表现出色。拆解Mate60 Pro的结果显示出了华为的创...
日期:11-16