您的位置:首页 > 互联网

猿辅导xDorisDB:构建统一OLAP平台,全面升级数据分析能力

发布时间:2016-11-09 16:26:16  来源:互联网     背景:

  猿辅导公司的数据中台部门为猿辅导、斑马、猿编程、小猿搜题、猿题库、南瓜科学等各个业务线的产品、运营、研发提供标准化的数据集(OneData)和统一数据服务(OneService)。OLAP平台作为数据中台的一个核心部分,为各个业务线提供统一标准化的、可复用的、高可靠的数据服务,支持各个业务线人员进行快速灵活的查询和分析,是连接前台和后台的桥梁。

  我们引入了性能强悍的新一代MPP数据库:DorisDB,来构建OLAP平台。基于DorisDB,我们统一了实时数据分析和离线数据分析。当前DorisDB有3个集群,每天百万级有效查询请求,p99延迟1s,用于广告投放渠道转化、用户成单和续报、直播质量监控等多个数据场景,支持各业务线进行更加快速灵活的查询和分析,全面提升数据分析能力。

  一、平台选型的业务背景

  1.业务特点和需求

  猿辅导作为互联网教育行业赛道中的领先品牌,每日有海量数据生成,为实现科技助力教育,十分重视数据在公司发展中发挥的作用,需要不断解决在数据建设上遇到的诸多挑战。

  在互联网教育数据体系中,不仅仅要关注用户活跃、订单收入,也很看重渠道推广转换率和用户续报率。这些指标存在不同的维度和不同的计算口径,以及多样化的业务系统接入模式,给我们OneService的底层设计带来了挑战。另一方面,数据时效性需求逐渐增强,离线T+1的数据已经越来越无法满足驱动业务的需求,数据逐步实时化也成为不可逆转的行业发展趋势。

  在这样的背景下,我们的OLAP平台需要同时支持实时和离线数据写入,以支持不同时效的查询需求;需要支持复杂、多样的数据查询逻辑,以满足各种不同的业务场景的数据分析需求;需要能够进行快速的在线扩展,以支持业务快速发展带来的数据规模增长。

  2.对OLAP引擎的需求

  总结起来,我们对于OLAP的需求大概包括以下几点:

  ·数据查询延迟在秒级/毫秒级;

  ·同时高效支持大宽表和多表join查询,以支持复杂查询场景;

  ·需要支持高并发查询场景;

  ·同时支持流式数据和批式数据摄入,支持实时/离线数据ETL任务;

  ·支持标准化SQL,大幅度降低用户使用成本;

  ·具有高效的精准去重能力;

  ·较好的在线扩展能力,较低的运维管理成本。

  3.技术选型和优劣势对比

  OLAP(On-line Analytical Processing,联机分析处理)是在基于数据仓库多维模型的基础上实现的面向分析的各类操作的集合,强调数据分析性能和SQL执行时间。

  在当今,各类OLAP数据引擎可谓百花齐放,可以分为MOLAP(Multi-dimensional OLAP)、ROLAP(Relational OLAP)和HOLAP(Hybrid OLAP)三类。

  (1)MOLAP引擎的代表包括:Druid,Kylin等,本质是通过空间和预计算换在线查询时间。在数据写入时生成预聚合数据,这样查询的时候命中的就是预聚合的数据而非明细数据,从而大幅提高查询效率,在一些固定查询模式的场景中,这种效率提升可谓非常明显。但是他的缺点也来自于这种预聚合模型,因为它极大的限制了数据模型的灵活性,比如在数据维度变化时的数据重建成本非常高,而且明细数据也丢失了。

  (2)ROLAP引擎的代表包括:Presto,Impala,GreenPlum,Clickhouse等,和MOLAP的区别在于,ROLAP在收到查询请求时,会先把query解析成查询计划,执行查询算子,在原始数据基础上进行诸如sum、groupby等各种各类计算,查询灵活,可扩展性好,往往使用MPP架构通过扩大并发来提升计算效率。这种模型的引擎优点是灵活性好,但是对于一个大查询/复杂查询它的性能是不稳定的,同时可能造成冗余的重复计算,消耗更多资源。

  (3)HOLAP引擎是MOLAP和ROLAP的融合体,对于聚合数据的查询请求,使用类似于MOLAP的预计算数据模型。对于明细数据和没有预聚合的数据场景下使用ROLAP的计算方式,比拼资源和算力,这样即使没有明确的场景要求下,也可以实现最优化的查询性能,适应性更好。这方面做的比较好的系统主要有DorisDB。

  在团队的小伙伴们一系列调研和论证之后,首先排除了无法提供低延迟查询性能的引擎,比如Presto等,其次我们同时需要兼顾复杂业务场景支持能力,易用性和生产运维成本最低化,因此在这些维度上对比了Druid、ClickHouse、Kylin和DorisDB。

  DorisDB作为一个MPP架构的HOLAP引擎,保证了数据模型的灵活性和查询性能,Rollup和物化视图功能使用了MOLAP引擎的预计算思想,在一些场景上通过空间换时间的方式极大地提高数据查询效率。最终我们选择DorisDB,一方面是因为DorisDB查询性能强悍,同时兼容MySQL协议极大降低了用户的使用门槛;另一方面它可以在高并发和高吞吐的不同场景下都表现出较好的适用性,和数据中台流批一体的OneService发展思路不谋而合。

  二、应用场景

  我们基于DorisDB构建了实时和离线统一的OLAP平台,交互查询和BI报表应用在数据中台的应用层发挥了巨大作用,为各个业务线的主管/产品运营同学的运营策略、广告投放策略等提供了可靠支持。

  基于DorisDB,我们构建的全新数据架构如下:

  下面简单介绍几个典型的应用场景:

  1.实时直播质量监控

  我们使用DorisDB在直播质量分析相关系统中提供支持。这部分是直播引擎的研发同事十分关心的一些指标,直接关系到直播上课中的服务质量,一般是分钟级/亚分钟级的时效性要求。场景包括:网络质量、宏观丢包率、高峰时段可用率、音视频可用率等。

猿辅导xDorisDB:构建统一OLAP平台,全面升级数据分析能力

  2.离线数据交互查询和BI报表

  在数据架构升级前,离线T+1数据最终落地到MySQL上进行交互式查询和BI报表展示,查询的Query多是单表查询,维度组合较为灵活。但是随着业务增长和数据规模扩大,MySQL的查询性能逐渐遇到瓶颈,无法支持一些多维度数据的查询场景,同时运维成本也越来越重。

  在架构升级过程中,我们引入了DorisDB计算引擎作为BI数据的落地层。由于DorisDB兼容MySQL协议,数据应用层可以通过JDBC直接连接,因此在迁移过程中几乎没有成本,而数据摄入和查询效率得到了几倍到几百倍的提升,为各个业务线的主管/产品运营同学提供了可靠的决策支持。

  3.准实时用户成单和续报数据

  我们在订单/续报等核心数据场景中,T+1的离线数据已经无法为业务提供最有力的决策支撑,越来越多需要当天数据的场景和报表需求。这里的主要挑战是:

  ·跨团队合作、跨源、跨库的数据场景。

  ·数据有时效性要求,查询响应要快。

  ·对线上业务没有侵入性,屏蔽影响。

  我们的解决方法是,导入Hive历史存量数据+订阅binlog增量数据通过flinkSQL实时灌进DorisDB中,同时针对不用的业务需求场景做表结构设计和查询优化。

  4.实时推广投放策略

  对于广告投放类的效果数据,我们会需要分钟级或更高的时效性要求,因为数据的变化可能直接影响到投放效果的评估和投放策略的变化。

  我们同样用flinkSQL订阅业务DB的binlog,最终落地到DorisDB,作为BI报表和业务系统的统一数据产出口径。

  三、实践心得

  1.集群监控

  目前我们关注的核心集群监控指标包括:

  ·FE节点失联

  ·BE节点失联

  ·BE磁盘坏盘

  ·BE CPU平均使用率过高

  ·FE Master的内存水位过高

  基于Query级别的监控主要有:

  ·大查询告警,例如ScanBytes、ScanRows

  ·超过2分钟的慢查询告警

  ·用户连接数过多

  ·用“select 1”查询探活整体服务的可用性

  2.打通生态

  在早期使用时,DorisDB当时和其他大数据开源生态的适配能力还有不足,因此我们做了一些改造性工作。

  (1)Flink Connector

  我们目前实时的摄入任务大部分都是通过Flink来实现。我们基于Stream Load实现了flink connector,线上使用性能良好,数据批次的时效性一般控制在分钟/半分钟级别。

  (2)离线数据摄入

  对于离线数据的摄入,基本是T+1的时效,在凌晨调度中完成。

  我们主要是使用Stream Load和Broker Load两种方式,我们在仓库ETL调度框架中对于两种Load分别进行了封装,区别是:

  ·数据量不大/需要加工计算的,先落地本地磁盘文件,然后通过Stream Load导入DorisDB

  ·数据量较大的,先写入Hive临时表,然后Broker Load导入DorisDB

  (3)Presto DorisDB Catalog

  我们使用Presto查询DorisDB的时候主要是针对于一些需要跨源查询的场景,比如DorisDB中的实时同步数据与Hive中的历史数据通过一定条件join并最终产出小时级的数据报表。

  这里遇到的问题是Presto原生的MySQL Catalog无法读取DorisDB元数据,主要原因是information_schema中元数据的类型和Presto数据类型需要适配,我们最终通过重新实现的Presto DorisDB Catalog来解决。

  (4)DorisDB审计平台

  另外我们也打造了DorisDB DDL工单审计平台,帮助用户能够更好的建立正确的表结构。

  审计平台会监控大查询和慢查询,这些对集群性能影响较大的查询,通过告警机器人的方式通知到用户,督促大家去做查询的优化。

  3.基于审计日志数据治理

  之前常见遇到的一个问题是:BE CPU被吃光了/磁盘IO打满

  不同的case都可能导致这个现象:

  ·某一个大查询scan数据量太多、耗时较长直接吃掉所有io

  ·表buckets过多导致scan所有盘

  ·大查询频繁提交等

  这类问题排查起来较为困难,除了手动杀掉查询,好像没什么好的处理办法。另一方面大量的导入操作(compaction)是否也会造成cpu和io的压力。

  目前的解决方案就是通过审计日志和BE服务日志来监控查询和写入,对于有问题的请求及时处理避免对集群性能影响的进一步扩大。

猿辅导xDorisDB:构建统一OLAP平台,全面升级数据分析能力

  我们通过filebeat采集了fe.audit.log日志,并最终导入到ES中,基于ES做query的分析和监控。

  目前监控主要是:大查询和慢查询,这些对集群性能影响较大的查询,通过告警机器人的方式通知到用户,督促大家去做查询的优化。并实现了大查询/慢查询的告警,监控和明细分析。

  四、未来展望和规划

  1.应用场景

  后续我们计划基于DorisDB做更多的场景实践探索:

  ·基于Bitmap的多维分析/BI自助工具

  ·通用事件分析平台(支持明细+聚合)

  2.运维建设

  在组件运维层面的工作包括:自动化运维,建设回归测试框架、自动化集群扩缩容脚本、自动化集群升级脚本等,降低人工操作成本。

  3.平台推广

  在数据中台的平台化建设中也少不了DorisDB的参与,包括:

  ·技术分享,最佳实践和用户培训;

  ·统一元数据平台,打通不同引擎的DDL、权限/租户管理等功能;

  ·用户自助BI工具,屏蔽引擎细节,用户简单操作的可视化报表平台。

  总结

  通过引入DorisDB计算引擎,我们实现了流式数据、批式数据融合的一站式数据存储和查询引擎,对外提供语义一致和易用的数据服务。可以说DorisDB为猿辅导数据中台的标准化数据集(OneData)和统一数据平台服务(OneService)能力奠定了一个稳固的基础,支持各业务线进行更加快速灵活的查询和分析,全面提升数据分析能力,也为未来的数据平台化建设提供了更多可能性。

  最后,十分感谢DorisDB鼎石科技团队专业的支持服务,希望我们能一起把DorisDB建设得更好。(作者:申阳 猿辅导数据中台,大数据研发工程师)


realme天玑700

返回网站首页

学而思编程语言


乐视为什么还能运营

华米科技芯片

智能手机与可穿戴设备中,采用什么功能进行移动支付

买车走融资租赁

匠心65载,梦洁股份全新形象剑指高端
乘风破浪魅力绽放 第十三届光电子产业博览会6月高光亮相

返回网站首页

本文评论
Twitter联合创始人斯通证实首席技术官将离职(Twitter创始人)
腾讯科技讯(晁晖)北京时间5月21日消息,据国外媒体报道,一名消息人士透露,Twitter首席技术官格雷格·帕斯(Greg Pass)已经从公司离职。Twitter首席技术官格雷格·帕斯(腾讯科技配...
日期:07-28
产业带掀起“入淘潮”:5年增长20倍,跻身天猫Top2,他们用直播破局
声明:本文来自于微信公众号 天下网商(ID:txws_txws),作者:杨洁,授权转载发布。清河的羊绒、许昌的假发、海宁的皮草、景德镇的陶瓷、常熟的羽绒服……在中国,类似产业带数不胜数...
日期:12-13
百度健康:建立医患匹配引擎,直连20余国家医疗区域中心(百度健康互联网医院有限公司)
讯 8月15日上午消息,百度健康称其打造了医患匹配引擎,与公立三甲医院和专科合作,通过大数据与AI技术匹配区域内公立三甲医院专科服务。   百度健康方面表示,其一共直连了20余...
日期:08-16
互联网走弯的路,区块链给掰回来_区块链技术可以说是互联网
这个微不足道的瞬间被认为是互联网诞生的时刻...但后来逐渐变了质,它被用作了赚钱的机器,广告商低成本地滥发垃圾邮件,网络公司侵犯隐私,恶意参与者发动网络攻击,犯罪分子使用互...
日期:08-09
PlayStation中国商店恢复服务_索尼周六开始恢复亚洲PlayStation网络服务
(小贝)北京时间5月28日消息,据国外媒体报道,索尼开始部分恢复日本和亚洲其它地区的PlayStation网络和Qriocity电影音乐服务。今年4月份,索尼在遭受黑客攻击,并导致超过1亿用户账...
日期:07-28
返工第一天 国美真选小家电拯救你的“节后综合征”(国美家电退货)
  2021年的第一个元旦假期这么过完了,想到早上一睁眼就要继续开始“打工人”的生活,就浑身不得劲,怀疑自己患上了“节后综合征”。   摆脱疲乏,重振旗鼓,国美懂你的“节后综...
日期:07-16
助力国资国企数智化采购,用友商业创新峰会来了!_用友商业创新大会
  “工业和信息化系统将以提升产业链供应链的现代化水平为着力点和落脚点,进一步固根基、扬优势、补短板、强弱项,推进制造强国和网络强国建设不断迈上新台阶。”在3月1日...
日期:07-16
2021年智博会在哪里举办_圆满落幕2021全球智博会亮点纷呈
  9月18日,为期三天的2021全球人工智能产品应用博览会(以下简称:2021全球智博会)在苏州国际博览中心圆满落下帷幕。   本次大会以“数智融通 协创未来”为主题,国内外行业...
日期:07-17
百度将投20亿元在深建研发中心(百度科研投入)
  百度发起的“2011年营销中国行”系列活动昨日在深圳拉开序幕。副市长袁宝成出席活动。   据中国互联网信息中心的最新数据显示,中国网民数量快速攀升,截至去年12月已达...
日期:07-27
微信支付智慧出行_腾讯全球数字生态大会:微信支付延伸数字化出行解决方案
  随着微信支付智慧生活普及,智慧出行也加速在全国多个场景落地。5月22日,微信支付亮相腾讯全球数字生态大会,展示了以无感支付为核心的智慧交通布局,并推出针对无感支付停车...
日期:02-22
天玑8200杀疯!冲击高频率 碾压二代骁龙7「天玑820相当于骁龙870」
旗舰级的天玑9200发布了,次旗舰或者说高端的天玑8200也要来了。早在今年7月底,就有消息称,联发科将推出新一代天玑8200,作为目前天玑8000系列的升级版,升级台积电4nm制造工艺,并且...
日期:11-15
snap股东「Netflix挖走Snap两名高管:负责广告销售业务」
  讯 北京时间8月31日早间消息,据报道,流媒体巨头Netflix周二宣布,该公司从Snap挖来两名高管负责领导其广告销售团队,这两名高管为该公司在品牌营销人员中赢得了信誉。  Net...
日期:09-01
TCL集团2020年业绩_TCL经评估荣获2020年企业标准“领跑者”称号,全面夯实市场影响力
  近日,2020年度国家首次对电视机企业进行“领跑者”评比工作,经过专业权威第三方机构的层层评审,最终TCL实业控股股份有限公司企业标准Q/SY0001-2020《液晶电视接收机》成...
日期:07-16
spacex发射多少火箭「SpaceX正在大肆招聘 准备把加州发射火箭的数量增加一倍」
SpaceX正计划大幅提高其从美国西海岸发射火箭的频率,这一信息来自于SpaceX的猎鹰9号运营经理为该公司在西海岸发射设施招募新员工的广告。SpaceX从三个地点发射任务,其中两个...
日期:09-17
青莲网络重要事记回顾|砥砺前行 未来可期
  后疫情时代,国家加快5G网络、数据中心等新型基础设施建设进度,数字化的进程被按下“快进键”,掌握技术的企业率先跨入数字化转型的快车道。青莲网络从企业级云产品体系销...
日期:07-17
美林十二岁以上如何服用「小红书成人使用美林攻略引争议 医生呼吁:别和孩子枪药」
12月20日 消息:近日,许多网友出现发热等症状后,社交网络上不断传播病情和用药情况。而小红书上却出现了许多帖子宣称“美林是新冠病毒的成人最佳退烧药”,并附上教程,提供如何抢...
日期:12-20
乐视拍卖结果_原乐视大厦5.73 亿元拍卖成交
  11 月 30 日消息,阿里拍卖信息显示,北京市朝阳区姚家园路 105 号 3 号楼 1-14 层不动产,即乐视网公司总部乐融大厦(原乐视大厦)再次被拍卖,起拍价依旧为 5.73 亿元,保证金 5...
日期:07-17
人人网等抢先LBS布局 考验资源整合能力
  Facebook创始人马克·扎克伯格访华的消息引发了一次“追星热”,而Facebook自身发展和有可能以怎样的产品模式进入中国也再度被业界和网民所关注。值得注意的是,Facebook...
日期:07-25
小米300亿回购「小米集团:今日耗资约2417万港元回购270万股」
  小米集团9月30日公告,今日回购270万股公司股份,耗资约2417万港元。主流大数据解决方案坚果j10和当贝f3评测ipad mini6有120hz吗微软win11 build 22000.100 更新发布  ...
日期:10-01
昔日生鲜电商股 每日优鲜2021年年报发布:全职员工仅剩55人_每日优鲜2020年营收
11月15日消息,日前,每日优鲜在美国证监会官网上传其截至2021年12月31日的财务报表。财报显示,2021年总营收为69.65亿元,同比增长13.3%。其中,产品销售额由2020年的59.997亿元增长...
日期:11-23