您的位置:首页 > 互联网

中国首个网络大模型,pick了CPU_最新网络模型

发布时间:2024-09-14 11:19:13  来源:互联网     背景:

声明:本文来自于微信公众号量子位 | 公众号 QbitAI,作者:金磊 梦晨,授权转载发布。

当电信网络用上了大模型,会是一种什么体验?

以前网络上若是出了问题,运维人员需得是先靠着经验反复排查,找到了“病根”再“对症下药”。

而现在有了大模型,这事儿的“打开方式”就变得截然不同了。

首先,网络上若是出现了问题,大模型已经学会自己去找“病根”了,然后会把它的判断结果呈现到运维人员的面前。

若是结果跟运维人员的诊断一致,那么OK,“啪的一下”,问题就可以快速得到解决。

其次,即使诊断结果有所偏差或者描述不够详细,运维人员现在也只需做一个动作——问。

大模型不仅会像一位领域专家一样,凭借专业且丰厚的知识,对人类提出的问题做详尽的解答;更重要的是,它还非常得快。

业界一般认为文本生成延时小于100毫秒是人类觉得较为舒适的阈值,而这个大模型它的生成速度则是:

首字符时延在1秒以内,生成延时在50毫秒左右。

因此,即使面对再多再复杂的问题,运维人员工作的感觉就好比旁边有一位“高人”在现场指导一样了。

值得一提的是,这个网络大模型并不只是个现象级产品,而是已经实实在在的做到了“上岗”。

据悉,某电信运营商已经在全国31个省将它铺开应用,日均调用量高达10万次!

也正因如此,就在刚刚落幕的第二届“华彩杯”算力大赛·智能计算专题赛中,它还拿下了一等奖的好成绩,是获得了官方认证的那种。

另外,方案白皮书《中国电信携英特尔积极探索基于至强®CPU 平台的网络大模型推理算力方案》也在中国通信标准化协会CCSA TC610、欧洲电信标准化协会ENI产业标准组主办的云网运营自智与网络大模型技术研讨会上正式发布。

那么接下来,我们就来进一步深入了解一下这个网络大模型。

当大模型“上岗”电信网络

就目前“上岗”的结果来看,该电信运营商的各级运维人员均已接入网络大模型。

正如我们刚才提到的,他们运维的方式已经产生了实质性的改变——

专业知识问答、信息筛选、总结信息等等,统统交给大模型来处理即可。

不仅如此,在网络规划方面,网络大模型也在发挥着作用。

它的推理输出结果已经涵盖了网络建设、网络维护、网络优化和运营决策等场景。

基层运维人员通过这些结果,就可以实现精准理解与分析规则、自动规则核查;同时,网络大模型提供的专业领域专业知识,还可以帮助电信行业方案分析与生成。

最新网络模型

或许有小伙伴就要问了,这和市面上的众多大模型问答产品又有什么区别呢?

重点就在于够垂直。

网络大模型作为行业的“专家”,它所提供的答案是可以深入理解运维人员的用户需求和意图的,因此生成的答案和知识更精准、更个性化。

生成内容是够专业了,接下来我们就要聊聊速度的问题。

众多的运维场景都属于边缘端,也正因如此,就会对数据在边侧的即时响应速度提出了较高的要求。

毕竟若是等大模型生成答案还要好几分钟,那么对于运营商网络故障修复来说就成了臃肿的包袱。

对此,该电信运营商的“解法”是:

使用满足OTII标准(边缘硬件产业的新标杆)的边缘服务器。

边缘服务器的部署环境要求要比数据中心高,有时甚至需要部署在一些极端的恶劣情况下。

这意味着边缘服务器需要在功耗、体积、耐用性、 TCO 等方面符合特定的要求,能够在极端高低温、灰尘、腐蚀、震动冲击、电磁干扰下保持设备的正常运行。

最新网络模型

而该电信运营商所采用的OTII服务器部署在边缘场景下就具备了相对的优势,例如针对环境适应的问题,它可以在高温55°以下工作。

除此之外,它还支持IP65,符合EMC ClassB设计,支持9级地震烈度,机身小巧,有1U/2U/4U等多种型号,支持挂墙安装等等。

不仅如此,服务器还支持前维护,适应边缘的运维需求,该电信运营商大量的边缘机房无需任何改造,就可以部署基于OTII标准的标准服务器。

也正因为在如此,便让数据的及时交互和响应有了强有力的安全保障。

其生成速度也正如刚才所述,已经达到了首字符时延在1秒以内,生成时延在50毫秒左右,可以满足大模型推理的功能和性能需求。

就目前来看,网络大模型已覆盖网络“规、建、维、优、营”全生命周期五大类场景,围绕知识问答、辅助助手、智能体三个维度,已经打造了12个AI助手。

具体场景和性能表现如下表、图所示:

iqoo256g上市时间

△网络大模型在不同应用场景中的性能表现

据悉,该电信运营商网络大模型已实现问答准确率85%、方案生成可用率90%、故障处置效率提升30%、高危指令稽核效率提升50%的总体目标。

由此可见,网络大模型已然是一个合格有效且可放心“上岗”的AI了。

而在它能够做到“够快、够准”的背后,该电信运营商还有一个杀手锏——

在背后起关键作用的算力“马达”,某电信运营商pick的是CPU。

Why CPU?

从上述”网络”大模型的应用流程可以看到,模型推理是至关重要的一个环节,它直接决定了故障定位、处置方案的生成速度和准确率。

而这恰恰是CPU大显身手的”主场”。

从电信行业本身的特点来说,历来整个系统中就有大量的CPU存量,无需引入全新的异构架构,而是继续采用成熟的CPU方案,对电信行业来说有几大优势:

减少采购环节,降低总拥有成本。

该电信运营商作为全球规模最大的通信运营商之一,其网络中部署着数以百万计的X86服务器。这些服务器往往还处于使用周期内,完全可以通过软件升级的方式,快速实现大模型的部署与应用。相比重新采购新的硬件设备,这种方式可以大幅降低前期投入,提高投资回报率。

电信行业对系统稳定性要求更高。

电信业务覆盖范围广,涉及社会运行方方面面,从医疗救援到金融交易等等,对连续性要求极高,轻微故障也会直接影响客户体验。现代通信网络又是全球最复杂的工程系统之一,一处小小的异常都可能引发连锁反应,影响整网运转。而以X86平台为代表的英特尔CPU架构安全和稳定性经过几十年的积累和验证,经得起考验。

已建立成熟的运维技术团队。

作为ICT领域的传统企业,该电信运营商拥有一支规模庞大、经验丰富的IT技术团队。这些工程师、运维人员,对英特尔CPU的微架构、指令集、调优工具等都有着深入的理解和掌握。继续采用CPU部署大模型无需太多学习和培训成本,大大降低了新技术的采用门槛。

△网络网络大模型在不同应用场景中的性能表现

具体到CPU产品的选型,“网络”大模型方案使用第五代英特尔®至强®可扩展处理器作为算力核心,来应对高强度、高并发的大模型推理需求。

首先,第五代英特尔®至强®可扩展处理器配备了更多的处理器内核数量、更强的单核性能和更大的三级缓存(LLC)容量。尤其是LLC容量的提升,使得大多数模型参数能够直接驻留其中,从而大幅提升推理速度。此外,每路处理器还支持多达8个DDR5-4800内存通道,能够有效缓解高内存需求场景下的带宽瓶颈。

苹果看动漫软件哪个好

更重要的是,第五代至强®还内置了多个专用于AI加速的引擎。特别是英特尔®AMX(高级矩阵扩展),采用分块矩阵乘法的创新方式,通过Tile矩阵乘法单元(TMUL)对数据实施矩阵运算。并且AMX支持INT8、BF16等低精度数据类型,在保证精度的前提下显著提高每时钟周期的指令数。

软件方面,方案还引入了一系列英特尔AI工具来进一步释放硬件潜力。

最新网络模型

例如,英特尔开源的分布式推理优化框架xFastTransformer(xFT),可基于至强®平台的指令集实现张量并行、流水线并行等多种性能优化,并支持 BF16、INT8、INT4等多种数据类型以及多种主流大模型。

这些AI 软件工具实现了对主流AI开发框架的全面兼容,使得网络大模型无需修改代码即可从GPU迁移到CPU,真正实现“一次编写,随处部署”。

此外,得益于CPU的能效优势,采用第五代至强®方案还能显著降低模型运营的能耗成本。数据显示,第五代至强®的开箱即用能耗比较上一代提升高达34%,启用BIOS优化后还可进一步提高。

除了对CPU本身的选择,网络大模型由于需要部署到生产一线,有时甚至需要在极端恶劣环境部署,对于整个服务器的要求非常高。

为了更好地满足业务需求并提升使用体验,该电信运营商选用了符合OTII标准的边缘服务器。

OTII标准由英特尔联合中国通信标准化协会、该电信运营商等企业共同制定,满足电信边缘场景对开放性、可扩展性的要求,涵盖了服务器外形、散热、电源、管理等各方面的规范,在功耗、体积、耐用性等方面符合特定要求,能在极端高低温、灰尘、腐蚀、震动冲击、电磁干扰等情况下保持运行。

由此可见,选择CPU进行网络大模型推理部署,已被该电信运营商这样的大型企业实际验证。这既是出于技术成熟度与稳定性的考量,更契合了企业客观的IT环境与人才储备。

该电信运营商的实践表明,在时延、吞吐、功耗等关键指标上,CPU不仅可以满足严苛的业务需求,借助软硬件的联合优化,推理成本也大幅下降。

特别是该方案还在2024华彩杯取得好成绩,为大模型在更多场景应用打造了一个标杆。该电信运营商和英特尔的合作模式,也成为一个可以值得借鉴的“范本”。

随着未来技术发展,大模型还会深入走进更多行业,需要在性能、功耗、成本、易用性等多方面实现最佳平衡。

总的来说,CPU在AI推理加速上仍然大有可为。


返回网站首页

本文评论
Link Turbo应用适配稳步推进,荣耀V20实战表现大幅领先(荣耀的link turbo)
  现今的生活中,智能手机对网络的需求越来越大,网络环境与用户体验息息相关,在一些需要低时延、高速度、高稳定性的网络使用场景下,这一痛点表现得更为明显,最常见的例子便是...
日期:10-19
全球首发6GHz频率 Intel高调宣告:领先无可争议「6ghz cpu」
前两天的创新大会上,Intel正式发布了13代酷睿,代号Raptor Lake,这一代不仅升级了最多24核32线程,同时在频率上也大幅提升,i9-13900K加速频率达到了5.8GHz。然而这还不是13代酷睿...
日期:09-30
苏宁易购:预计2022年同比减亏73.42%至78.04%_苏宁易购2021年半年报
凤凰网科技讯 1月30日消息,苏宁易购发布2022年度业绩预告。公告显示,公司预计全年GMV规模达到1113亿元,营收730亿元。在不考虑非经营性现金流相关因素影响下,公司在2022年4个季...
日期:01-30
qq程琳的个人资料简介「QQ空间第一代女神程琳最新晒照:16年前非主流照片变视频」
快科技8月19日消息,曾是QQ空间首批网红之一的程琳,今日分享了一批她16年前的非主流照片。这些照片经过AI技术处理后转化为视频,其中她的一颦一笑、发丝轻飘以及经典的剪刀手姿...
日期:08-19
闻库谈6G标准工作:谋定而动,做好5G-A与6G衔接「6g技术标准」
通信世界网消息(CWW)6月27日,在中国移动举办的“5G创新引领,数智融合共赢”技术创新论坛上,中国通信标准化协会理事长闻库表示,现阶段正处于5G商用推进与6G研究布局的叠加期,要大力...
日期:06-27
POL连续四年第一!华为已发布新一代Wi-Fi 7万兆园区光网_华为wifi价格
快科技7月29日消息,近日,IDC发布最新的《2022H2中国POL市场报告》,2022年华为在中国POL(无源光局域网)市场份额排名第一,这也是华为连续四年位居该市场第一。作为中国POL市场领导...
日期:07-30
苹果 iPhone 15 Pro 机模曝光:采用 USB-C 接口、固态按键「苹果手机15pro」
IT之家 4 月 11 日消息,近日,一段 iPhone 15 Pro 机模的视频在抖音上流出,展示了该设备的传闻设计。据悉,iPhone 15 Pro 的主要硬件特性包括固态按键、USB-C 接口和钛合金框架。...
日期:04-11
谁才是大模型“四小龙”?
声明:本文来自于微信公众号定焦(dingjiaoone),作者:黎明,授权转载发布。这两年热闹的大模型创业潮,被业内称为“AI2.0”。与之对应的“AI1.0”,指的是2015年左右开始的那一波AI创...
日期:07-12
VR游戏分岔点宣布完两轮共数千万元投资
讯 8月15日上午消息,上海分岔点网络科技有限公司宣布完成数千万元Pre-A轮融资。   本轮融资由红杉中国种子基金投资,资金将主要用于产品研发以及技术团队扩充。在此前半年,分...
日期:08-16
俞敏洪20年好友再发5问罗永浩-斥罗永浩忘恩负义人品极差_俞敏洪 罗永浩 李笑来
8月8日消息,近日,俞敏洪20年好友曝罗永浩五宗罪上了热搜,对此罗永浩还回应称要写一篇澄清稿,让大家看看什么叫有理有据有节。小鹏汽车工程车下线现在,自称俞敏洪20年老友的张翔再...
日期:08-08
百度资深副总裁李震宇轮岗CEO助理,不再负责智能驾驶事业群组,王云鹏获晋升
出品|科技作者|梁昌均11月6日消息,百度发布内部邮件宣布新一轮干部晋升及轮岗:百度副总裁、自动驾驶事业部总经理王云鹏晋升为集团副总裁,并担任百度智能驾驶事业群组(IDG)负责人,向...
日期:11-06
lec春季赛视频「BLG拿下2024LPL春决冠军,与Lexar雷克沙共造电竞之光」
4月20日,2024英雄联盟职业联赛(简称LPL)春季赛总决赛在佛山市南海体育中心体育馆落幕。经过四局的比拼,BLG电子竞技俱乐部英雄联盟分部(以下简称“BLG”)以3:1成绩战胜TES战队,夺...
日期:04-24
查重名率「姓名查重,一天收入3000」
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:十里村,授权转载发布。各位村民好,我是村长。多数赚钱的生意,都是在赚信息差。益生菌是一类活性微生物,具有改善而且信息差...
日期:05-30
英伟达市值一夜蒸发310亿美元 总市值1.1万亿美元_英伟达的市值多少
美国东部时间12月4日,美国股市三大股指全线走低,道琼斯工业平均指数下跌0.11%;纳斯达克综合指数下跌119.54点,跌幅0.84%;标准普尔500指数下跌0.54%。科技股普遍走弱,英特尔下跌...
日期:12-05
搜狗ai气象主播是谁_搜狗AI气象主播上线,视频产业开启智能化升级之路
  “今天晚上到明天白天,冷空气将由西向东影响我国大部分城市,云南、广西、甘肃等地还将迎来降雨……”,从1980年起,《天气预报》就紧随《新闻联播》后出现,每天为广大居民的...
日期:07-16
郑州一火锅店爆改成麻辣烫店:每天接待1000多名顾客_火锅 郑州
郑州一家原本是火锅店的小店,在开业一周后突然改卖甘肃天水麻辣烫,吸引了大量顾客。这家小店每天接待1000多名顾客,包括本地市民和在郑州工作的甘肃人。店家表示,他们每天都很忙...
日期:03-19
中融小贷获批增资至190亿,提升对抖音生态内小微商户扶持力度_中融小额贷款产品
12月29日消息,深圳市中融小额贷款有限公司(以下简称“中融小贷”)发生工商信息变更,其注册资本金增加至190亿元。中融小贷相关负责人表示,此举是为提升对抖音生态内小微企业的扶...
日期:12-29
Intel奇迹上演:2年内EUV工艺超越量产多年的台积电、三星_英特尔正式宣布反超台积电
Intel以往是全球最先进芯片工艺的领导者,然而在14nm到10nm节点之间遇到了问题,导致台积电、三星追赶上来了,并且率先量产了EUV工艺,不过Intel也在努力反超,CEO制定的路线图意味着...
日期:09-20
谷歌CEO施密特称中国业务保持稳定_谷歌董事长施密特
  据国外媒体报道,谷歌CEO埃里克·施密特(Eric Schmidt)当地时间周四表示,公司中国业务稳定,预计收购手机广告公司AdMob的交易将获得监管机构批准。施密特这番话显然旨在打...
日期:07-29
如何打造更时尚环保智能手机 且看三星是如何做到的
工业文明的出现,不仅加速了人类文明的发展,也为人类在科技创新领域得到了飞速提升。但同时,重工业的发展模式,也对人类赖以生存的自然环境造成了极大的影响。为了更好的守护环境...
日期:08-02