您的位置:首页 > 移动互联

汽车之家 x StarRocks:极速实时数据分析实践

发布时间:2022-07-26 12:12:04  来源:互联网     背景:

  汽车之家(NYSE:ATHM)成立于2005年,为消费者提供优质的汽车消费和汽车生活服务,助力中国汽车产业蓬勃发展。我们致力于通过产品服务、数据技术、生态规则和资源为用户和客户赋能,建设“车内容、车交易、车金融、车生活”4个圈,建立以数据和技术为核心的智能汽车生态圈,正式迈向智能化的3.0时代。

  汽车之家目前在智能推荐的效果分析,物料点击、曝光、计算点击率、流量宽表等场景,对实时分析的需求日益强烈。经过多轮的探索,最终选定StarRocks作为实时OLAP分析引擎,实现了对数据的秒级实时分析。

    实时数据分析的现状

  在汽车之家内部,实时数据的来源主要是三部分:

每天打开手机次数

摩拜app是什么

  ·手机端户行为的日志;

  ·应用程序的服务端的日志;

  ·MySQL、SQLServer数据。

  实时数据分析场景,目前面临的一些痛点包括:

  ·使用Flink做指标聚合,Flink聚合不灵活,面对需求的时候开发成本比较高的,面对多变的需求,经常需要重复开发;

  ·Kylin支持指标预计算,并发支持较好,但是不能够支持高效的明细数据查询。在一些需要下钻或者获取明细数据的场景支撑的不够好;

  ·TiDB不支持预聚合模型,某些数据量大的场景,聚合指标需要在线计算。在线计算会导致服务器压力瞬间增大,而且查询性能不稳定,取决于参与计算的数据量和当时服务器的负载情况。

    为什么选择StarRocks

  上图是几个OLAP引擎的横向对比。StarRocks作为一款新兴OLAP产品,具有以下几个突出的优点:

  ·查询场景灵活:StarRocks所能够支撑的查询场景比较灵活。既能够从明细数据进行聚合分析,也能基于预聚合的模型去提前构建好,加速查询;

  ·兼容MySQL协议,平时使用MySQL的客户端就能进行查询和简单的运维:StarRocks兼容MySQL协议,使用成本、运维成本都比较低;

  ·全面向量化引擎,查询性能好:查询性能高,并且能支持较高的并发和吞吐;

  ·架构精简,易于运维。

  但是StarRocks作为OLAP界的“年轻人”,也存在一些不太成熟的方面,比如:目前各个公司应用的深度可能不会特别深,所以还需要结合业务持续打磨。

  在选型过程中,我们对StarRocks和常用的OLAP引擎做了一些对比测试。

饿了么代理加盟

    业务规模

  多维监控平台整体业务规模:

  协议:3000多个协议,也就是对应3000多个维度表。

  数据量:维度表的原始数据量非常大,峰值数据达到33亿条/min,3万亿/天。

  并发量:异常检测平台调用,最高33w/min的调用峰值。

智能平台产品部 腾讯

    VS Apache Kylin

thinkpade14酷睿版

  在汽车之家内部Apache Kylin主要是面对固定查询的场景。主要都是一些特定的数据产品,还有一些日常的报表等。由于Apache Kylin是基于纯预聚算模型的,拿空间去换时间。所以在固定报表的场景下查询性能是非常好的,也能支持很高的并发。缺点就是不太灵活,要预先定义模型,如果要修改模型话,要重刷历史数据。

  上图是StarRocks与Apache Kylin的一些对比。在6个亿的数据量下,用一个线上的Cube,和两台StarRocks去做一个简单的对比,在命中物化视图的场景下,StarRocks的查询性能可以媲美Apache Kylin,有些查询甚至比Apache Kylin还要快。

    VS ClickHouse

  ClickHouse虽然能支持明细数据和预聚合模型,也是基于向量化的引擎,但主要缺点是运维成本高,对多表关联查询的支持较弱,所以我们选择了StarRocks。

  上图是StarRocks与ClickHouse的性能对比。在120亿的数据规模下,部署了四台服务器,针对Count和非精确去重两种查询做性能对比。在Count的场景下,ClickHouse的性能是比较接近的,两者没有明显的差异。在非精确去重(HLL)场景下,StarRocks查询性能明显优于ClickHouse。这得益于StarRocks 1.18针对HLL查询的性能优化,在我们的测试场景下HLL查询的性能相比StarRocks 1.17提升了3~4倍。

    VS Apache Doris

  上图是StarRocks与Apache Doris的性能对比。也是在6个亿的数据量和两台机器的规模下进行的对比。由于StarRocks引入向量化引擎,相比Apache Doris查询性能有2~7倍的提升。

    VS Presto、Spark(hive外表)

  上图是StarRocks与Presto、Spark查询Hive外表的一些性能对比。在10亿的数据量下,部署了八台服务器(是和Presto、Spark对等的资源),测试用例主要是Count和Count Distinct查询。测试的结果是StarRocks性能最优,大部分查询StarRocks性能优于Presto,Presto的性能优于Spark。还有另外一个使用StarRocks优势就是可以直接用ndv函数去做非精确的排重(HLL),此时查询性能优势更为明显。

    其它

  机械硬盘和SSD硬盘的对比。在6个亿的数据量和两台机器的规模下,在未命中PageCache情况下,SSD集群查询性能提升3~8倍;在命中PageCache情况下,两个集群的性能是比较接近的,此时SSD不会带来性能提升。

    应用实践

  当前我们已经初步完成了StarRocks和实时、离线平台的集成工作。

  首先是实时平台,实时计算平台直接集成Flink-connector-StarRocks;然后是离线平台,我们通过提供broker load脚本,支持将Hive数据导入到StarRocks。最后是StarRocks监控,主要是基于Prometheus、Grafana,我们还收集了StarRocks本身的audit log,并解析每SQL的执行情况、分析StarRocks的查询性能和成功率。

开发者大会WWDC21

  首先看一下StarRocks和Flink平台(AutoStream)的集成,用户可以通过Flink原生的DDL来定义StarRocks表,也就是把StarRocks里面已经存在的一张表映射成Flink表。

  上图是一个基于Flink+StarRocks的实时ETL的案例:

  ·从一张表里面过滤user_id大于0的,biz_id和biz_type是数字类型的,event_id在这几个事件里面的数据;

  ·通过DATE_FORMAT函数以及CASE WHEN语句对字段做处理;

  ·最终把结果写入到StarRocks表中。

  在离线调度平台上,我们提供了一个标准的Python脚本用来提交broker load任务,通过脚本+参数配置的方式,可将Hive数据高效导入到StarRocks中。同时这个脚本会持续检查broker load任务的进度,如果执行失败了,那么对应的调度任务也会失败,并触发调度平台本身的重试及告警机制。

  这是我们DBA同事配置的StarRocks监控的报表。当时遇到了一个问题,就是StarRocks它FE metrics格式不规范,导致Prometheus TextParser解析失败,我们做了一些代码修复。

  这是StarRocks集群的统计报表。前面提到了,我们会实时收集、解析auditlog中的查询记录,并将这些查询记录写回到一张StarRocks表中;再通过配置AutoBI的仪表版,就实现了StarRocks本身的性能监控及分析。

  在报表中我们可以从数据库、用户的维度查看StarRocks的查询次数、相应时间、异常SQL等信息。当集群发生问题时,这个报表可以帮助我们快速定位问题、恢复业务;同时用户也可以了解自己业务的查询情况,定位慢SQL并进行优化。

  截止10月底,StarRocks在汽车之家已经有两个实时数据分析业务上线,分别是:推荐服务实时监控、搜索实时效果分析。

    推荐服务实时监控

  首先是推荐服务的实时监控。需求背景是实时推荐体系涉及多个子系统,为了提升推荐服务的整体稳定性,需要实时监控各子系统的服务健康情况。

  上图是一个大概的链路,各个子系统会引入方法监控的SDK,通过SDK把每分钟的方法监控的明细数据聚合起来,并将这些经过初步聚合的数据写入到监控系统里,监控团队负责把这些数据推送到Kafka,并通过Flink实时把数据写到StarRocks表中。在这个场景中,每天写入StarRocks的数据有两亿条左右,这是StarRocks在汽车之家上线的第一个业务。

  最终在AutoBI中的仪表板如上图,报表的TP95响应时间在1秒左右,响应速度还是比较快的。

    搜索实时效果

  搜索实时效果,需求是搜索效果数据的实时统计,查看各频道、实验、内容类型的无结果率、跳出率、曝光量、点击量、CTR,特点就是日增的数据量在数十亿级,主要是应用GroupingSet模式,把所有可能的组合都计算好,给用户提供一个数据表格,并支持按照条件筛选;同时这个需求中涉及多个UV指标(非精确去重)的计算,每一行数据中包含6个UV指标的计算,下面是SQL的示例:

  在这个场景下,由于数据量较大,并且包含多个聚合指标,所以我们定义了物化视图来加速查询。最后的展示形式就是下面的这种图表加上明细表格的形式。

汽车之家 x StarRocks:极速实时数据分析实践

  我们最初使用的是StarRocks 1.17,由于存在多个UV指标,查询性能并不理想,在升级到StarRocks 1.18之后,性能得到了较大的提升,响应时间从十几秒降到四秒内。

    总结与规划

  最后简单总结一下,我们通过引入StarRocks统一了明细查询和预聚合两种模型。其次是流批的统一,实时的数据和离线的数据都可以写到StarRocks里面,对外暴露统一的OLAP引擎来提供服务,这对用户来说是很友好的。另外在查询性能方面,我们通过跟其他的引擎的对比发现,StarRocks的查询性能整体上来说是有优势的。最后StarRocks兼容MySQL协议,容易上手,运维简单。

  后续我们会持续完善内部工具链,支持将业务表数据实时分发到StarRocks表中,进一步简化实时分析的链路。同时我们也会持续扩展StarRocks应用场景,积累经验,提升集群稳定性,更好的支持业务。(作者:邸星星,汽车之家实时计算平台负责人)


返回网站首页

本文评论
传神语联以科技驱动创新发展,助推网文顺利出海
  网络文学已经成为东南亚、北美等许多地区的重要文娱内容,备受年轻人青睐。随着网络文学出海的不断发展,整个产业链分工更加细化,每个流程有着更加专业的团队提供服务,例如网...
日期:07-29
燧原科技招聘_燧原科技携新品云燧智算机重磅亮相世界人工智能大会
  2022年9月7日,中国上海——9月1日-3日,2022世界人工智能大会(WAIC)在上海隆重举行,这是燧原科技连续第三年参加这一行业盛会。本次大会上,燧原科技不仅带来了第二代云燧训练...
日期:09-08
联想图像斩获第十届财经峰会“2021杰出品牌形象奖”「联想图像集团」
  聚焦行业发展新机遇,探寻可持续发展新路径。日前,CFS第十届财经峰会暨2021可持续商业大会在沪隆重举行,商界、政界、学界等各行领域杰出代表齐聚现场,共话行业热点,吸引了社...
日期:07-29
英集芯:聚焦细分市场 不断拓展下游应用领域_芯片细分行业龙头
  近年来,随着中国经济的不断发展和国家产业政策的引导支持,我国芯片领域的科技水平突飞猛进。国内芯片厂商通过立足细分市场、拓展应用领域的发展途径,实现由点到面的突破,不...
日期:07-27
单品销售额破2.5亿,极米H3S凭什么卖那么好?「极米h3s会降价吗」
  在刚刚结束的双十一中,家用投影头部品牌极米也晒出了自家的战报。笔者注意到,其中极米H3S单品的销售额突破2.5亿,总共售出了四万多台。作为一款旗舰级家用投影产品,极米H3S...
日期:07-26
从愤怒的小鸟,到王者、暗黑,是什么扛起了大梁?
  用手机玩游戏,已经成为当下很多人主流的娱乐方式。根据中国音像与数字出版协会的数据,2021年,中国游戏市场实际销售收入达到2965.13亿元,较去年增收178.26亿元,同比增长6.4%...
日期:07-25
多元产业运营力 推动复星蜂巢站上C端新赛道
  ​在11月4日于上海开幕的第四届中国国际进口博览会上,作为植根中国的全球化企业,复星连续第四年携成员企业及合作伙伴亮相进博会。复星蜂巢,作为复星全球产业生态的融合与...
日期:07-26
跨界合作,普渡机器人和蒙牛合力打造智慧新零售
  继普渡科技和蒙牛集团的合作官宣之后,在全国各大商场里已经陆陆续续可以看到普渡机器人“葫芦”装载着蒙牛饮品巡航的身影。俨然一位不知疲惫的“服务员”,普渡机器人以新...
日期:07-30
2022公认最好的4K投影仪当贝X3 Pro用户的真实体验,都在这里了「比当贝x3好的投影仪」
为了搭建心心念的家庭影院,最近入手了一台当贝X3 Pro,那画质简直绝了,和在电影院看的效果几乎一样,看来以后再也不用往电影院跑了,在家就能享受影院级的视听。那这么多投影仪中,我...
日期:10-10
大隐于智:方太创新背后的“科技自信”
  当前的中国,各领域经历了多年的技术学习与追赶,市场对国际品牌的“技术崇拜”早已开始回归理性,而中国厨电也在体验、功能、外观、设计、性价比等各方面都呈现赶超之势。在...
日期:07-29
Aqara亮相Google I/O开发者大会,支持Matter协议助力智能家居互通互联「aqara google home」
  北京时间2022年5月12日报道,Google在加州山景城举办了I/O开发者大会,发布了多款最新硬件产品,同时也带来了Android13系统的新特性介绍。在大会现场,Google特别表示计划在今...
日期:07-14
腾讯QQ团队AI音视频降噪算法揭秘:声声入耳皆清晰_QQ语音降噪
  当6亿用户习惯每天通过QQ发送语音和进行视频通话,或者在群里与网友语音接龙完成一场Pia戏,又或是与好友一起派对语音答题的时候,大家可曾想过,在不同场景下始终清晰、流畅的...
日期:07-26
极米618佳绩连连:H3S销量破4.5万台,Z系列销量破9万台(极米 618)
  极米2022年618完美收官,官方总战报显示,极米全网成交总额(GMV)突破7亿,蝉联京东和天猫投影机类目销售/销售额九连冠!其中,高端旗舰H3S全网销量超45000万台,全网单品GMV破2亿;...
日期:05-05
数据化转型和智能化升级_绿色+智能,如何构建数智化转型下的数据中心?
  数字经济发展如火如荼,数据中心作为全行业数智化转型的智慧基座,重要性日益凸显。与此同时,数据中心建设规模和业务总量不断增长,机房管理规模持续增长、网络复杂度不断加大...
日期:12-17
《家用美容仪认知及抗老消费行为调研报告》发布,雅萌受多数调研用户认可
  皮肤抗衰正在成为全民话题,家用美容仪行业呈现爆发式增长。根据相关数据,近两年美容仪市场的复合年增长率为28%;京东数据显示,今年“6·18”电商节,射频美容仪成交额同...
日期:07-25
重要里程碑!小马智行成为国内首个获得出租车经营许可的自动驾驶公司
  4月24日,小马智行宣布中标广州市南沙区2022年出租车运力指标,这是国内首个颁发给自动驾驶企业的出租车经营许可。中标通知明确,允许符合广州市智能网联汽车示范运营安全技...
日期:07-14
搜狗智享科技嗨购季真诚钜惠来袭,最高立减500元「京享嗨购怎么赚佣金」
  818大促快要结束了,你还不知道搜狗智享科技嗨购季?这波钜惠福利的小尾巴可得抓住了,各种智能录音笔、词典笔、儿童电话手表等常用的AI硬件产品迎来8月超级划算的优惠,智享...
日期:07-29
厉害了!数睿数据通过CMMI5全球软件领域最高级别认证
  日前,南京数睿数据科技有限公司顺利通过CMMI LEVEL5 OPTIMIZING PROCESS MATURITY评估,标志公司在产品研发、过程组织、项目管理及方案交付等方面的能力均达到了国际先进...
日期:07-27
CubeFS正式进入CNCF孵化,OPPO成为全球顶级开源基金会成员
  7月3日,全球顶级开源组织云原生计算基金会(CNCF)宣布,OPPO正式成为CNCF基金会成员,由OPPO主导开发与运营的开源云原生存储产品 CubeFS 也正式进入CNCF孵化阶段。CubeFS...
日期:07-27
更美多维度数据实现大幅度上涨,将来会引入更多创新模式
  数据显示,从2021年5月份以来,更美APP旗下的更美次卡订单量核销率达到了70%以上,消费者们对这款产品也普遍认可。截止到目前,购买更美次卡的累计订单量已经突破数万单,很多医...
日期:07-28