您的位置:首页 > 互联网

跨越速运 x DorisDB:统一查询引擎,强悍性能带来极速体验

发布时间:2022-07-17 05:36:18  来源:互联网     背景:

  跨越速运集团有限公司创建于2007年,目前服务网点超过3000家,覆盖城市500余个,是中国物流服务行业独角兽企业。跨越集团大数据中心负责全集团所有数据平台组件的建设和维护,支撑20余条核心业务线,面向集团5万多员工的使用。目前,大数据中心已建设数据查询接口1W+,每天调用次数超过1千万,TP99在1秒以下。我们利用DorisDB作为通用查询引擎,有效解决了原架构大量查询返回时间过长,性能达不到预期的问题。

  “作者:张杰 跨越集团大数据运维架构师,负责集团公司大数据平台的维护和建设”

    一、业务背景

    1、总体架构

  我们原始离线数仓的总体架构如下图所示,数据从各个业务线的数据库,比如MySQL等,通过数据集成工具汇聚到ETL集群(即Hadoop集群),再使用Hive、Spark、Presto等批量处理引擎进行数据仓库的分层处理,然后将DW层和ADS层的数据推送到各种不同的查询引擎。

  在这些查询引擎之上,有个统一的查询API网关,应用层的自助分析工具或ERP系统前端通过调用这个API网关,将数据内容呈现给用户。

    二、业务痛点

  该系统最大的痛点是查询性能问题。公司对大数据查询接口的响应延迟是有考核的,期望99%的查询请求都能在1秒内返回,比如页面ERP系统、手机端各类报表APP,用户会随时查看数据并进行生产环节调整,过慢的查询响应会影响用户体验,甚至影响业务生产。针对复杂的SQL查询场景,之前采用的Presto、Impala+Kudu、ClickHouse等系统,是远远达不到预期的。另外,针对各种复杂的数据分析业务场景,引入很多不同组件,导致了维护和使用成本非常高。

  因此,我们急需一个新的查询引擎,能统一查询引擎,解决性能查询问题,降低使用和维护成本。

    三、OLAP引擎选型

 

  第一阶段,在2019年,跨越集团大数据中心使用Presto作为通用的查询引擎。此阶段集团大数据中心数仓层基本用的是Hive,Presto可以直连Hive的特性让我们无需做过多的改造,就可以直接生成查询的API。从性能角度考虑,我们也会将数仓中的部分数据拷贝至独立的Presto集群,和数仓ETL集群进行资源隔离。这套架构运行一年多之后,随着业务需求越来越复杂,数据量越来越大,该基于Presto构建的集群性能急剧下降。

  第二阶段,为解决Presto集群性能不足的缺陷,我们基于ClickHouse开始构建新的通用查询引擎。2020年我们使用ClickHouse构建了大量大宽表,将此前需要多层关联的查询逐步迁移到ClickHouse集群。通过这种方式,我们确实解决了此前面临的性能问题。但与此同时,我们需要建设越来越多的大宽表,操作繁琐运维困难。并且这种数据模型无法随业务需求变化而快速改变,灵活性差。

  第三阶段,我们在2021年开始寻找其他能满足我们需求的OLAP引擎,此时我们发现了DorisDB这个产品。首先关注到DorisDB的单表、多表关联查询的性能都非常优秀,能够满足我们对查询延时的需求;DorisDB支持MySQL协议,让我们开发同事在开发接口的时候学习和使用门槛非常低。另外,DorisDB还具备支持按主键更新、支持多种类型外表、部署运维简单以及支持丰富的数据导入方式等特性。这些都是我们所需要的。

  因此,我们开始逐步将以往的分析业务迁移到DorisDB集群上,将DorisDB作为大数据中心的通用查询引擎。

    四、DorisDB在跨越集团的应用

    1、在线场景应用

  当前我们每天在线数据接口的查询请求量已经超过千万。在引入DorisDB前,我们用了8到9种查询引擎来支撑各种在线业务场景。大数据量的明细点查场景使用ElasticSearch作为支撑;对于查询维度固定、可以提前预计算的报表场景,会使用MySQL;对于SQL查询复杂,如果多表Join、子查询嵌套的查询场景,会使用Presto;实时更新的场景,则会使用Impala+Kudu的组合来支撑。

  引入DorisDB后,目前已替换掉Presto和Impala+Kudu支撑的场景。ElasticSearch、MySQL以及ClickHouse,后续也可能会根据业务场景实际情况逐步替换为DorisDB。

  下面详细介绍一个实际在线场景的典型案例。如上图,我们在原Presto系统上有一个包含200个字段的宽表聚合查询。由于业务需求比较复杂,SQL语句有600多行。我们曾希望从业务逻辑上进行优化,但是并不容易,不能因为系统能力问题就一味要求业务方来迁就。现在我们使用10个节点相同配置的DorisDB替换原15台相同配置服务器的Presto集群后,在没有做什么业务逻辑变化的情况下,使用DorisDB明细模型,凭借DorisDB本身的高性能将查询延时从5.7秒降低为1秒,性能是原Presto集群的近6倍。

    2、OLAP场景应用

  跨越集团的OLAP多维分析平台是我们自研的一套BI系统。用户可以根据自己业务场景选择字段以及关联条件等,以拖拉拽的方式生成数据的表格或图表。最早我们支撑OLAP多维分析的后端引擎是Presto,在这类场景下的性能确实不尽如人意。因为性能问题,我们也没办法将这个工具推广给更多的用户使用。我们将后端查询引擎替换为DorisDB后,性能提升非常明显。我们将OLAP多维分析平台向整个集团推广,受到了越来越多的用户好评。

  OLAP多维分析主要是离线分析为主,以客户离线分析场景为例,数据经过ETL处理后,生成对应的DW层或ADS层数据,再通过Broker Load将数据按天导入DorisDB中。我们使用星型模型构建客户主题域,客户主表以明细模型在DorisDB中建表,同样以明细模型创建维表。这样用户就可以在前端对客户主题域的各种指标、各种维度进行拖拉拽,生成对应的表格和图表。

  在客户离线分析场景下,我们DorisDB上线前后业务逻辑没有进行太多调整前提下,TP99从4.5秒下降到1.7秒,性能是原来的三倍(后续我们将尝试开启CBO优化器,预计会有更大性能提升)。绝大多数场景都能实现1s内返回,大大提升了用户的体验。

  利用DorisDB的实时分析能力,我们还构建了实时OLAP多维分析。以运单实时分析场景为例,原本我们是用Hive每两小时跑批的方式来实现的,将固定维度数据算好,结果写入Presto上提供查询,逻辑类似于离线数仓,并不能称为真正的实时。引入DorisDB后,我们调整数据流转逻辑,通过监听Binlog将数据写入Kafka,再通过Rontine Load的方式消费Kafka,将数据实时写入DorisDB中。我们使用更新模型建立实时运单主表,将运单ID设置成主键,这样每一笔运单更新后,都能实时更新到运单主表中。和离线分析场景一样,使用星型模型构建运单主题域。

跨越速运 x DorisDB:统一查询引擎,强悍性能带来极速体验

  通过这样的调整,以往每两小时更新数据的运单主题域,现在可以实现秒级更新,成为名副其实的实时分析。另外此前需要依赖预计算,维度都是固定的,很多分析上功能受限。经改造后,除了大幅提升“实时”体验外,在分析灵活性上的提升也非常明显。实时体验和灵活分析也成为OLAP多维分析平台工具在实际服务中最大的亮点。

    五、后续规划

  1、为了避免部分慢查询影响整体的集群性能,后续会搭建多套DorisDB集群,按业务场景进行物理资源隔离。

  2、DorisDB查询Hive外表的功能,经内部测试比Presto查询Hive的性能要好,后续会将原本Presto查询Hive的场景无缝迁移到DorisDB上。

  3、目前我们在DorisDB上写入了很多实时数据,这些数据需要进行聚合等处理,我们正在尝试使用调度工具,在DorisDB上进行5分钟级、10分钟级的轻量ETL处理。

  4、开启DorisDB的CBO优化器,进一步提升查询性能。

  最后,感谢鼎石为我们提供DorisDB这么好的产品,满足了我们对性能强、功能全的查询引擎产品的要求;感谢鼎石一直以来提供的技术支持,解决了我们在使用中遇到的各类问题。


返回网站首页

Comper×脱口秀大会,用全新沟通方式圈粉年轻人
腾讯阿里打通生态,针锋相对的时代或将结束

有价值的社交

微软 Surface RT

陆巡V8发动机

onedrive视频剪辑

体育营销组合策略

惠普售后花钱吗

小飞猪怎么玩

汇元银通(北京)在线支付技术有限公司


返回网站首页

本文评论
老马和小扎,要把40亿人带进Web3
新网银行金融科技挑战赛2020   出品|虎嗅科技组   作者|周舟   头图|视觉中国   一个奇怪的国际现象正在互联网行业发生,腾讯(中国最大的社交公司)、Meta(美国最大的社交公...
日期:08-15
腾讯数字藏品平台“幻核”宣布正式停售:用户可自行退款
2021年8月2日,腾讯正式推出隶属于PCG部门的数字藏品平台幻核”,是市场上为数不多未开放转赠功能并禁止二级交易炒作的数字藏品平台。今天,腾讯宣布,刚刚度过一周岁生日的幻核”...
日期:08-17
高通5g和联发科5g_高通惨遭华为、联发科围剿:5G市场彻底失利
  (原标题:终端产品彻底失利,高通5G中端市场将面临出局)   继5G高端手机市场的一番争斗后,无论是手机厂商还是芯片厂商均纷纷转向中端市场发力,毕竟高端攻占用户心智,中端才...
日期:07-14
8G运存4800万像素,降至1549元,值得入手吗?(1240万像素算高吗)
  这几年手机的发展趋势是配置越来越高,但手机的价格却越来越低,这是科技发展的必然的结果,科技会不断的更新换代,所以手机价格会越来越低。今天和大家一起聊一款手机,这款手...
日期:08-13
“丫头baby”直播间位居10月6日抖音主播带货榜_淘宝直播丫头baby带货
10月8日消息,经新腕儿整理分析10月6日抖音电商带货日榜,数据显示,主播“丫头baby”直播间位居主播带货榜第一,GMV达1000万-2500万,直播销量达5万-7.5万。其【丫头baby粉丝专享】...
日期:10-18
走出趣布局西南 助力重庆跨境人力市场迎生机
  跨境人力资源行业根植于国内几十年以来的传统出国劳务市场,受地域社会经济环境和各地政策等因素的影响,不同区域的跨境人力资源行业发展呈现出不均衡的现象。比如江苏、...
日期:06-28
【D1Net专访群脉】零售业的分岔口:疫情自救与未来的数字化转型路
  突如其来的大疫情,几乎让企业措手不及!消费零售行业更是如此,改革开放四十年,没有哪一个阶段让零售行业如此艰难。虽然有林清轩创始人孙来春的直播效益,也有特步集团的全民...
日期:07-14
实况2015_《实况2012》新版DEMO游戏品质明显提升
  《实况足球2012》背负的压力很大,此前放出的第一个DEMO放出后基本是面对普遍批评,同时《FIFA 2012》的试玩版虽然因为真实碰撞系统的不成熟存在一些BUG,但是整体素质还是...
日期:07-23
WPS全面接入MIUI新系统字体MiSans,用户可免费使用(MIUI wps)
  ITBEAR科技资讯4月26日消息,金山办公宣布其旗下WPS全面接入MIUI新系统字体MiSans,所有WPS用户均可免费下载使用。   用户点击WPS Office客户端的“插入”—“稻壳素材...
日期:07-18
苹果因新款iPhone双摄像头技术再陷官司,被诉侵犯10项专利(苹果面临70亿美元专利赔偿)
  (原标题:苹果双摄像头iPhone被诉侵犯10项专利)   网易科技讯8月15日消息,据外媒报道,以色列摄像头技术公司Corephotonics日前针对苹果提起诉讼,指控苹果故意在其最新款iP...
日期:11-14
10月起,1688平台升级新灯塔考核体系「1688新灯塔考核指标」
9月28日 消息:1688发布公告称,1688新灯塔考核体系自上线以来得到了商家的大力支持,随着市场环境及平台发展的变化,本次将对原有考核指标及评定标准做整体升级。诚信通商家将在2...
日期:10-06
苹果14百度百科「苹果官网资料显示iPhone 14 Plus最初曾被命名为“iPhone 14 Max”」
新发现的iPhone 14 Plus在苹果网站上被称为"iPhone 14 Max",这表明这是最初打算用于低端6.7英寸设备的名称,然后该公司在短时间内改变主意。正如荷兰博客iCreate所发现的,在该...
日期:10-01
港股新东方在线涨超20%,股价创六月份以来最高_港股新东方股票实时行情
查看最新行情 美国 特斯拉 自动驾驶  讯 8月30日上午消息,港股新东方在线涨超20%,股价达27.45港元,创六月份以来最高,昨日收盘涨近6%,新东方此...
日期:09-08
iPhone13手机电池容量「续航再次登顶!iPhone14系列将配备史上最大电池,安卓手机很羡慕」
随着智能手机的不断更新换代,手机上的各种配置都得到了升级,无论是屏幕、处理器、马达、拍照、系统等都得到了升级,随着手机功能的不断完善,随之而来的续航问题也随之而来,为了解...
日期:09-25
更耐得住寂寞 澳大利亚首位女宇航员诞生:一大气物理博士_科学家 宇航员
11月26日消息,据媒体报道,澳大利亚航天局局长宣布称,经过数月的精心遴选,梅根娜克里斯蒂安(Meganne Christian)从22500 多名符合条件的申请者中脱颖而出,现成为澳大利亚有史以来第...
日期:11-29
360儿童携手阿里云 首款AliOS Things儿童手表今日开售_360儿童手表支付宝
  3月5日,360儿童手表SE5 Plus 4G版在天猫360儿童旗舰店正式开售,新品支持移动4G/2G网络,拥有健康记步、无接触扫码支付、IPX8防水等特色功能配置,首发到手价仅需279元。据了...
日期:09-03
周源创业知乎给我们的启示「知乎CEO周源:未来3年将打造500位超100万收入的创作者」
11月25日 消息:今日,知乎创始人、CEO周源发出公开信,从社区定位、内容生态和职业教育三个方面分享知乎的发展和布局。知乎2022年一系列动作都是围绕专业讨论在展开:“海盐计划...
日期:11-26
决定退出中国后 亚马逊发布新款电子书Kindle Scribe:配备手写笔「kindle电子书可以手写吗」
亚马逊中国决定将于2023年6月关闭Kindle电子书商店,硬件的退货服务也已经开启,截至到今年10月底结束。尽管在中国市场结束运营,但Kindle在海外市场却活得不错。继前两天发布新...
日期:10-06
元宇宙里只有求生欲
一年前很多人可能从未听过的“元宇宙”,正在风口理论下快速形成转型黑洞,吸入了几乎所有的主要科技公司、品牌商、游戏公司以及权威机构。6月28日,根据美国科技网站VentureBeat...
日期:08-02
Android系统在美市场份额接近45% 环比增长1%(安卓系统全球占比)
  11月7日消息,据国外媒体报道,知名互联网统计公司comScore公布的数据显示,谷歌的安卓操作系统今年9月份所占美国市场份额环比增长约1%,而苹果公司的iOS操作系统在等待iPhone...
日期:07-24