您的位置:首页 > 互联网

磐基存储「中国移动磐基 PaaS 平台基于 eBPF 的应用可观测性建设实践」

发布时间:2024-01-17 19:34:51  来源:互联网     背景:

通信世界网消息(CWW)作为中国移动智慧中台的统一技术底座,磐基 PaaS 平台提供了高效的集群管理和调度功能,满足多元化的业务场景需求。该平台携手 DeepFlow 借助 eBPF 技术,解决了 APM 落地困难和组件追踪断路中的挑战,实现了全栈且无侵扰的应用可观测性。磐基 PaaS 平台将 eBPF 数据与现有的可观测数据整合,提供了开箱即用的应用可观测性,全栈无盲点的调用链追踪等能力,大大提升了各业务系统云化的底气,并促进了平台本身的快速推广。未来,平台还针对运营商等特定行业场景,进一步深化可观测性数据的融合,并将创新性地拓展其 AI 能力,以增强市场竞争力。

背景介绍

磐基 PaaS 平台是中国移动智慧中台统一技术底座,为算力网络提供编排调度能力,提供分钟级的集群交付,实现 ARM/X86/混部架构集群统一管控,按需调度,支撑 B、O、M 三域用户交互、计算密集、数据密集、交易密集等多种类型的业务系统,具备万级 POD 承载能力,构建双栈网络,使在线业务稳定运行、平稳应对业务高峰。

磐基 PaaS 平台整合了磐基容器平台、磐舟 Devops、算力管控、磐维数据库、磐智 AI 平台及相关能力,以战略指导、统一规划、能力解耦、有机组装、需求驱动、场景匹配、敏捷迭代、低感升级为原则,全面布局云原生 PaaS 产品能力图谱,均衡发展。

磐基 PaaS 平台目前纳管 700+集群,4 万+节点,6 千多套组件,支撑省分公司包括 CRM 核心系统、BOSS 计费系统,IT 公司、各专业公司 IT 系统包括 AI、大数据系统等 600 多个业务系统上云。

磐基技术

云原生 PaaS 产品能力图谱

目前磐基 PaaS 平台基于可观测性三大基石(指标+追踪+日志)的指导思想,已经使用不同的组件构建完成,利用 Prometheus 获取了云原生基础设施资源(Docker、K8s 自身)、中间件(Redis、Nginx)等指标数据,利用自研的 APM 实现了微服务在代码级别的调用链追踪,利用自研日志平台收集主机、Kubernetes、组件、应用实例的日志数据。但是在业务真正落地过程中,还是存在以下一些问题:

中国移动磐舟

推广支撑力度不够

 信任度不足:传统 APM 探针技术主要采用字节码注入技术,该技术虽无需业务系统研发人员关注代码实现,但对业务系统仍有代码侵入特性,进而占用业务系统资源,或影响业务性能。高并发生产系统往往因探针可能产生的影响,而质疑其收益性。

•语言依赖强:字节码注入技术依赖业务系统代码语言和代码框架,导致传统 APM 技术需提供各种语言和框架的探针,才能满足企业级 PaaS 平台的可观测能力,因而在能力建设上的投入往往落后于实际生产需要。

•迁移难度大:SkyWalking 等 APM 产品早在非容器化时代便已普及,云原生时代同步提供了容器化操作。当业务系统与 APM 产品深度融合后,变更观测产品的推动力便极其微弱。

rtx 4080

观测能力覆盖不足

•云设施观测能力不全:云原生全栈式可观测融合视图应包含云原生网络层能力,但传统探针技术在 CoreDNS、NodeLocal DNS 等 Kubernetes 网络层还存在盲区。

•组件观测能力弱:可观测能力应尽可能地呈现业务系统及其相关的依赖组件、基础设施的全貌,但传统的探针技术因语言和框架的依赖性,在观测系统所依赖的组件内部的呈现能力还显得不足,往往只能到其表面请求入口,内部仍是黑盒状态。

基于以上痛点,磐基 PaaS 平台开展 ebpf 技术能力特性的研究,并与 deepflow 社区开展合作,启动基于 ebpf 技术的可观测平台能力建设,突破创新性的技术壁垒,致力于完善云原生场景下的应用观测图谱。

为什么引入 DeepFlow?

DeepFlow 基于 eBPF 实现了应用性能指标、分布式追踪、持续性能剖析等观测信号的零侵扰(Zero Code)采集,并结合智能标签(SmartEncoding)技术实现了所有观测信号的全栈(Full Stack)关联和高效存取。

零侵扰的方式支持主流应用协议的解析,包括 HTTP 1/2、HTTPS(Golang/openssl)、Dubbo、gRPC、ProtobufRPC、SOFARPC、MySQL、PostgreSQL、Redis、Kafka、MQTT、DNS,未来还将扩展更多应用协议的支持。提供了查看所有微服务应用的 RED(Request/Error/Delay)黄金指标,所有微服务之间的全景调用关系,以及网络协议栈 L4 层的吞吐、时延、建连异常、重传、零窗等指标。

开箱即用

利用 eBPF 和 Wasm 技术零侵扰实现分布式追踪,支持任意语言的应用程序,完整覆盖网关、服务网格、数据库、消息队列、DNS、网卡等各类基础设施,不留下任何追踪盲点。

零侵扰分布式追踪

依托 eBPF 技术获得的无插码零侵扰能力,DeepFlow 基本能做到独立应用部署,对应用开箱即用,对外提供的 Grafana Dashboard 也非常丰富。

磐基 eBPF 应用可观测性实践

DeepFlow 对外提供统一的 SQL 接口查询所有类型的观测数据,磐基平台可以非常方便的将 DeepFlow 数据与自身可观测平台集成,目前磐基可观测平台基于 eBPF 数据实现了网络流量拓扑展示、eBPF 调用链火焰图展示、告警阈值配置、并将 eBPF 数据与现有的指标、日志、调用链数据融合,以实现全栈一体化的可观测性平台。

平台架构

流量拓扑展示,支持多种维度拓扑视图(应用 POD/NODE、网络 POD/NODE);支持跨集群流量调用展示;支持黄金指标(吞吐量、错误率、延迟等)进行告警阈值配置找到异常网络路径;支持告警阈值配置控制线条颜色,展示不同颜色拓扑线条,并实时告警通知;支持灵活的过滤条件(集群、分区、工作负载、协议、节点)。

流量拓扑-01

ipad2018对比ipadmini4

流量拓扑-02

调用链火焰图,展示单条请求的全栈调用关系,包括系统进程、主机、容器节点、POD 容器内的请求耗时情况。

调用链火焰图

deepflow-agent、deepflow-server、deepflow-app 等镜像进行重新编译和底包 OpenEuler 操作系统替换,并通过镜像安全扫描。

磐基信息技术有限公司

Google Pixel 3

从统一门户,资源中心获取用户和业务系统等数据,和 eBPF 可观测数据进行融合,做多租户权限隔离。

将 deepflow-server 端元数据查询存储引擎 MySQL 进行改造,使其能够同时适配磐维数据库和 Postgres。

将磐基自身 APM 数据转换成 OpenTelemetry 标准的调用链数据,并将 OpenTelemetry、eBPF 获取到的追踪数据进行关联, 覆盖一个应用从业务代码、系统函数、网络接口的全栈调用路径,实现真正的全链路分布式追踪。

未来展望

通过一段时间的探索和实践,磐基 PaaS 基于 eBPF 可观测取得了一些阶段性成果,后续将加速磐基 eBPF 应用可观测性平台在各个地域上生产,给业务系统上云提升信心。也将继续在功能上快速迭代,大致计划:

•进一步融合 eBPF 可观测性数据与指标、日志及调用链追踪数据,构建全栈一体化可观测性平台

•利用 WASM plugin 实现 eBPF 内核可编程,实现业务私有协议解析能力、私有字段数据脱敏能力

•利用 eBPF 采集进程的性能剖析数据,实现 CPU、内存全栈性能数据分析展示

•结合 AI 能力,提供根因分析、故障预测、大模型智能助手等功能

同时将进一步加强与 DeepFlow 社区的合作,把磐基 eBPF 可观测性在运营商行业的实际应用经验和成果分享给社区,促进开源社区


返回网站首页

本文评论
廊坊市安次区观摩课落幕!希沃全程助力赛前练兵
  2019年12月2日,由廊坊市安次区教育和体育局组织,希沃支持的信息技术与教学融合现场观摩课圆满落幕。   此次观摩课旨在分享优秀经验,为即将参加全区课件大赛的数十名参...
日期:03-08
S24 Ultra最新渲染图曝光 采用钛金属_三星Galaxy
来源:中关村在线近日,平面渲染设计频道Technizo Concept与RoderSuper合作,根据现有线索制作了一款钛合金版的Galaxy S24 Ultra手机。据曝光的渲染图显示,该机整体外观与Galaxy S...
日期:11-03
笔记本电脑驱动下载_笔记本电脑驱动下载好了怎么安装
随着笔记本电脑的普及,其功能越来越强大,但是在使用过程中往往会遇到一些驱动问题,如触摸板失灵、声音失真等问题,这时需要下载相应的驱动程序来修复。在本篇文章中,我们将会介绍...
日期:06-01
显卡同款TORX 5.0风扇散热!微星展示M570 PRO PCIe 5.0 SSD
快科技8月31日消息,近日,在IFA 2023上,微星展示了旗下的M570 PRO PCIe 5.0 SSD,以及配套的主动散热系统。联想收购摩托罗拉移动案例根据微星官方展示的信息,M570 PRO的顺序读取速...
日期:08-31
火绒安全加入统信UOS主动安全防护计划 共筑数字安全屏障
日前,作为中国信息技术应用产业年度盛会的“ 2023 通明湖论坛”在北京召开。由统信软件与龙芯中科联合主办的“信息技术基础底座创新发展”分论坛上,举办了UOS主动安全防护计...
日期:05-18
今年5成以上司机月均抽成低于15%-9成以上低于20% 滴滴_滴滴司机5.0
【】6月16日消息,据滴滴出行官微披露,2023年以来,每个月服务时长超过30小时的所有司机月均抽成为13%,其中,5成以上的司机月均抽成低于15%,9成以上低于20%。小米平板1和ipad3滴滴方...
日期:09-23
美团港股开盘跌_港股美团跌超11%,市值跌破1万亿港元
iphone 11 原价 查看最新行情   讯 8月16日下午消息,港股美团跌超11%,报159.6港元每股,市值跌破1万亿港元。此前有市场消息称,腾讯计划出售美团的全部或大...
日期:08-18
宠物洗剪吹多少钱「宠物“洗剪吹”,国庆档“Tony”难求」
声明:本文来自于微信公众号 锌刻度(ID:znkedu),作者:铲屎官Lily,授权转载发布。epic起诉苹果事件升级国庆将至,“铲屎官”姜姜眼下正为一件事发愁,家里的猫狗都到了该洗澡的日子,但...
日期:10-13
监管新规下车险保费最高可降23%?业内人士:有些还会变贵_车险出险保费上涨规则
车险新规来了,各位车主朋友们保费最高能降价23%!不过降价与否还看个人,也有可能会涨价。据悉,近日银保监前向各银保监局、各财产保险公司、保险业协会、精算师协会、银保信公司...
日期:01-13
太蓝新能源CEO李彦:做固态电池的普及者,我们有充足的自信_太蓝科技 固态电池
成立于2018年的太蓝新能源,是一家专注于新型固态锂电池及关键锂电材料技术开发和产业化的公司,最近两年内完成多轮上亿规模融资。这与其在固态锂电池材料和工艺上突破密切相关...
日期:07-31
华为徐直军今起当值公司轮值董事长:任期6个月_华为集团轮值董事长
10月1日消息,从华为官网获悉,日前,华为发布关于公司轮值董事长的当值公告”。成年之后 怎么长高公告显示,根据公司轮值董事长制度,2022年10月1日-2023年3月31日期间由徐直军先生...
日期:10-06
苹果a16或采用台积电4nm工艺","info":{"wordid":"7076844702532670720"}},{"
来源:中关村在线据最新报道,苹果iPhone 15 Pro系列手机在其发布前曾被预计将搭载A17仿生芯片,但最终发布的iPhone 15 Pro和iPhone 15 Pro Max并未使用这一芯片,而是使用了A17 Pr...
日期:09-29
iPhone15系列开启预售:标准版遇冷,溢价不如华为Mate60 Pro | 钛媒体焦点_价格
9月15日晚八点,被吐槽“毫无新意”的iPhone15系列正式开启预售。与多数人预计的不同,在官网、京东、淘宝等预售渠道,iPhone15 Pro系列首批机器很快被一抢而空,“官网崩了”也是...
日期:09-16
LinkedIn发布新的AI工具帮助用户创建个人简历资料_linkedin app
3月16日 消息:OpenAI GPT 模型将会越来越多应用到大公司的产品中。比如 GPT 模型即将登陆 LinkedIn,以帮助简化发布职位和填写个人资料的过程。腾讯音乐占比据了解,LinkedIn正...
日期:03-16
Netflix ceo「Netflix挖走Snap两名高管:负责广告销售业务」
  讯 北京时间8月31日早间消息,据报道,流媒体巨头Netflix周二宣布,该公司从Snap挖来两名高管负责领导其广告销售团队,这两名高管为该公司在品牌营销人员中赢得了信誉。  Net...
日期:09-04
派美特耳机app_派美特新品蓝牙耳机PaMu Nano发布:主打随行HiFi
  在 2020 年的最后 1 天,国内知名音频品牌派美特(Padmate)推出了全新的真无线耳机产品-- PaMu Nano。这款耳机的市场定位是能够随身携带的 HiFi 耳机,搭配石墨烯扬声器,无感...
日期:07-16
马斯克:Neuralink将在6个月内开展脑机接口人体临床试验「马斯克芯片直连大脑在明年开始临床实验」
12月1日消息,据国外媒体报道,当地时间周三,特斯拉CEO埃隆·马斯克表示,他预计Neuralink研发的可植入“脑机接口”将在6个月内开始人体临床试验。当地时间周三,Neuralink举办了Sho...
日期:12-03
小米官网教育优惠_免费领取1000元补贴!小米教育优惠正式上线:学生专享
  9月1日,是许多学校开学的日子,也有不少学子要首次独自离家踏入大学的校园,在报道之前大家都会准备好自己新的装备,智能手机等数码产品也成为如今大学生必不可少的装备。  ...
日期:09-17
浙江在线微博_微博“浙江现象”助推全国首个“微城市”
5月30日,许多开着QQ的”亮相腾讯微博,网友可以通过“对话”、“转播”等方式直接向政府机构、官员等咨询问题。 “微杭州”其实是一个微博圈子。这里面汇集了杭州多个政府部...
日期:07-28
百度副总裁沈抖是哪里人「百度沈抖:大模型将改变所有行业,三大“智能新基建”将提速」
百度沈抖:大模型将改变所有行业,三大“智能新基建”将提速 通信产业网|2023-07-03 16:07:08作者:通文来源:通信产业网【通信产业网讯】5月30日,河北省人大常委会邀请百度集团执行...
日期:07-03