您的位置:首页 > 互联网

MatrixOne HTAP 分布式架构演进之路

发布时间:2023-04-17 17:06:01  来源:互联网     背景:

矩阵起源是一家专注于为企业用户提供简捷强大的数据操作系统的数据基础软件公司。公司创始团队来自腾讯云、Snowflake等国内外一流的互联网企业、软件公司、数字化企业和开源社区,核心团队为产品、研发、解决方案、生态和开源社区等领域的专家,在分布式架构、数据库、云计算、大数据及人工智能等领域积累了丰富经验。

MatrixOne 是矩阵起源(MatrixOrigin)开源的一款超融合 HTAP 云原生数据库,借助于全新设计和研发的统一分布式计算和存储框架,使数据库同时具备 TP、AP和Streaming三种能力,帮助客户彻底打破数据孤岛问题,成为企业智能化核心的数据基础设施。得益于这一创新的架构设计,用户可以在公有云、私有云、数据中心和边缘节点上部署和使用MatrixOne。秉承“One Size Fits Most”的产品理念,MatrixOne将运维工作简化到极 致,使得数据应用开发变得极为简捷,同时也保证了数据处理的极 致性能。

推翻三座大山

分布式框架

MatrixCube作为当时的分布式框架,提供了多副本存储模式,每一份数据都保存 3 副本并且以分片(shard)形式保存,使得存储的成本飙升。而基于Raft选举的Leader节点,频繁成为了热点,各类操作都需要通过Leader节点进行分发,在极端业务场景下,Leader节点的负载会数倍于普通节点。

引擎众多

早期的MatrixOne内置了三种存储引擎,三个引擎之间代码复用率较低,使得对功能的维护需要投入更多人力。而基于因子化算法的Plan构建方式过于激进和抽象,在计算组内部对其完全理解的程序员数量有限,往往添加功能时仍旧需要主开一人完成,新功能添加缓慢。

资源分配

旧架构采用了存算不分离的架构,这个架构导致了扩展性较差。每扩展一个单位的计算节点必须同步扩展存储资源。由于存储采用了shard分片,使得在shard较大时影响了OLTP的性能,在shard较小时,又会影响OLAP性能。

在找到了三座大山之后,接下来要做的事情就是一一扳倒它们,田丰博士结合MatrixOne的产品愿景以及未来的技术趋势,对于实验架构进行了总结,并提出了MatrixOne独有的架构设想,从整个架构的现状来看,要分三步走:

第 一步,将旧架构share nothing的框架破除,完成更灵活的解耦;

李彦宏创立百度的原因

第二步,将多种引擎合二归一,实现内部引擎的大一统;

第三部,重构计算引擎,留有足够的空间给未来的产品发展。

重生后的MatrixOne

新架构通过解耦,最终实现了三个各自独立的层级,每个层级有自己的对象单元与分工,不同类型的节点可以灵活伸缩,不再受到其他层的制约:

计算层,以计算节点Compute Node为单位,实现了计算和事务处理的Serverless化,又有自己的Cache,可以实现任意重启与扩缩容;

事务层,以数据库节点Database Node为与日志节点Log Service为单位,提供完整的日志服务以及元数据信息,内置Logtail用于保存最近数据;

存储层,全量数据保存在以S3 为代表的对象存储中,实现了低成本的无线伸缩存储方式,以File Service命名的统一文件操作服务,实现了不同节点对底层存储的无感知操作。

微软杀毒defender关闭

在确定了以TAE作为唯 一存储引擎之后,对融合后的TAE引擎又做了诸多设计上的调整,才有了后来融合后的TAE存储引擎。完成了单一引擎完成所有数据库存储行为的目标,并且具备了如下优势:

列存管理,统一的列存与压缩,对于OLAP业务有着先天的性能优势;

事务处理,共享日志与DN节点共同完成对计算节点的事务支持;

冷热分离,使用File Service以S3 对象存储作为目标,每个计算节点都有自己的Cache。

多次运行测试,得出置信度较高的结果:

早期的计算引擎中,兼容MySQL的大目标没有变化,但是对于节点调度、执行计划、SQL能力又有着更高的要求。重构后的高性能计算引擎,既具备了实验架构中计算引擎的MPP,又弥补了过去的诸多不足:

兼容MySQL,既有对MySQL协议的支持,又包含了对MySQL语法的支持;

融合引擎,基于DAG重新构建执行计划,可以同时执行TP和AP;

节点调度,未来可支持自适应节点内和节点间调度,同时满足并发和并行执行;

完善SQL能力,支持子查询、窗口函数、CTE、Spill内存溢出处理等。

积跬步以至千里

回顾历时数月的架构升级之路,充满了各种辛酸和痛苦。无论考虑的多么充分,在实际开发中,总会遇到各种各样意想不到的问题出现,尤其是在一些关键问题上的困难,让研发团队从开始的一筹莫展,到偶尔的灵光乍现,再到很后面的零之曙光,走向最终的黎明时刻。个中三昧,不言而喻。

这些难题中,主要围绕在存储、事务、负载隔离与资源配比几个方面。

寻找更合适的存储

在意识到三副本存储带来的问题后,如何寻找一个新的存储适配新架构,成为了当时一大难题,而这个新的存储必须满足两个核心需求,低成本与冷热数据分离。

在对市面上的诸多存储进行了调研以及试验之后,AWS S3 成为了最终的选择。单一副本,自带的冷热数据分离。

事务分工的调整

最初的新架构中,计算节点CN与数据库节点DN之间的分工是CN负责计算,计算结果推给DN,由DN完成事务。随着开发进度的不断推进,这个分工开始出现了问题,DN对事务的处理能力成为整个系统的瓶颈。因此,对于CN和DN的分工,必须做重新定义:

CN负责所有的计算以及事务逻辑,DN负责保存元数据信息、日志信息以及事务裁决,DN不再成为瓶颈;

在日志中引入Logtail对象,用于保存最近日志中的关联数据,定期将Logtail的数据写入S3 中,CN扩容可以实时将Logtail数据同步至Cache,实现了部分数据共享;

为事务大小设置阈值,超过阈值上限的事务直接写S3,日志只保存记录写入记录,未超过阈值的事务继续由DN写入,极大增加了吞吐量。

实现HTAP的工作负载隔离

半导体巨头突陷停产危机

作为HTAP数据库,如何实现不同类型的工作负载隔离,是一个必须解决的问题。在完成了对旧的实验架构的灵活解耦之后,工作负载的隔离也得以实现:

服务器级别的隔离,硬件资源充裕的情况下,各个组件分别在不同的物理机运行,接入同一个对象存储;

容器级别的隔离,硬件资源有限的情况下,利用所有节点无状态的特性,以容器作为各个节点的隔离手段。

实现资源配比的灵活调整

作为HTAP数据库,日常业务中,不同业务场景的比例是在动态变化中,对于资源的配比也有着更高的要求,而旧架构下的资源分配模式注定无法实现灵活调整,需要对各个节点实现更加精细化的管理,包含但不限于:

CN节点的分工,允许用户对CN进行划分,用于TP或AP业务,其中某项业务资源出现瓶颈之后,对CN进行水平扩容;

在不类业务的CN组之间,动态判断各组的负载情况,当前两类业务的负载差异较大时,可以自动将闲置资源分配至繁忙组内;

通过租户(account)的逻辑概念,实现逻辑资源的完全隔离,不同的租户可以以独享或共享的方式使用指定的CN资源。

写在最后

矩阵起源作为一家数据智能领域的创新企业致力于成为数字世界的核心技术提供者。 矩阵起源专注建设开放的技术开源社区和生态系统、打造世界 级的团队、并通过业界领先的技术创新和工程能力,实现数据在数字世界中的任意存储和任意计算,帮助用户释放数据的潜力和创新力(Store Anywhere, Compute Anywhere, Innovate Anywhere)。

整个MatrixOne的架构升级之路,始于0. 4 迭代,在0. 6 迭代初步完成,历时半年多,数十位一线研发与测试工程师投入其中,最终完成了今天的新分布式HTAP架构,团队与产品共同获得了成长。在今年,MatirxOne 将会推出第 一个 GA 版本,为开发者持续创造价值。


返回网站首页

本文评论
商汤自研大模型生成图片涉嫌抄袭? 公司回应来了_商汤cmo
凤凰网科技讯4月12日消息,在近日商汤技术交流日上,商汤所演示的精选模型中出现AI模型站civitai的图片,引发了网络质疑。据科创板日报援引商汤方面回应表示:“秒画SenseMirage包...
日期:04-12
Nubia Z40S Pro星空典藏版图赏,能有几分《星月夜》的味道?
智能手机发展这么多年来,除了带来技术层面的进步外,各种定制机也已推出了不少,但以一幅画作为设计元素的可以说寥寥无几。而在11月5日,Nubia Z40S Pro星空典藏版正式发布,根据发...
日期:11-08
2022 OPPO 广告联盟峰会 |洞悉时代增长机遇,携手开发者共生成长「oppo 推送联盟」
 11 月 8 日,以“共生·成长”为主题的 2022 OPPO 广告联盟峰会在厦门成功举办。本次峰会,OPPO 广告联盟为开发者带来了独特的行业洞见、升级的产品策略、全新的业态布局和优...
日期:11-16
是谁催生了野生景点旅游热词_是谁催生了野生景点旅游热?
  来源:法制日报  ● 近年来,随着露营日趋火热,野山、野水、野地方成了博主的流量密码,吸引不少游客为“野趣”前往打卡。但这些地方由于缺乏配套设施,危险重重,一些事故频频...
日期:08-23
运营成本高、租车率下滑、融资难 共享汽车“共享”难_共享经济对传统出租车的影响
  作者: 李溯婉  [ 莫闻经营的共享汽车平台曾在珠三角、长三角以及西南地区投入数千辆共享汽车,原本计划于2020年实现盈利,但事与愿违,不仅没有实现盈利,目前该共享汽车平台...
日期:09-06
跟美的、海尔比,格力真是掉队了_格力为什么比不过美的
作者|Eastland头图|视觉中国在国内外多重不利因素作用下,经济增长放缓、居民对未来收入的信心不足,社会消费总额下降。由于购买家电不是刚需(冰箱、洗衣机、电视机只要还能用,晚几...
日期:09-22
应对疫情,粉笔网武汉地区停止招生,线下未开课程全国可退
  近日,新型肺炎疫情的爆发引发社会各界的关注,在这全国人民共同抗击疫情的非常时刻,粉笔网发布声明,为最大限度的减少疫情传播,决定全面暂停武汉地区线下班招生,并且在全国范...
日期:10-11
NASA已敲定UFO研究小组成员,希望能科学分析这些现象_UFO研究
8月19日消息,美国国家航空航天局(NASA)表示,已经敲定研究“不明飞行物”(UFO)的团队成员组成。今年秋季就将正式启动相关研究工作。今年6月份,NASA宣布将开展一项关于UFO的科学研究...
日期:08-20
年轻人 网红「老年网红迷住年轻人」
声明:本文来自于微信公众号 银杏科技(ID:yinxingcj),作者:夏天,授权转载发布。“前一秒是年迈老大爷,下一秒是靓丽小伙”。这届年轻人,似乎格外青睐这类极具戏剧张力的老年变装视...
日期:12-14
京东拟分拆两公司独立上市 京东仍持有两公司50%以上股权「京东股份划分」
电商巨头京东近日发布公告,计划将其旗下子公司京东产发和京东工业在香港联交所主板独立上市。据悉,京东工业是中国领先的工业供应链技术和服务提供商,通过数字化工业供应链,帮助...
日期:04-01
腾讯2022年营收5546亿,四季度营收1449.5亿__2020年腾讯营收
3月22日消息,腾讯控股发布2022年第四季度及全年财报。财报显示,腾讯2022年收入同比下降1%至5546亿。腾讯第四季度营收1449.5亿元,同比增长1%;四季度净利润1062.7亿元,同比增长12%...
日期:03-24
马斯克为城市拥堵支招:隧道是唯一答案「隧道 马斯克」
11月14日消息,马斯克在线上出席了印尼二十国集团工商峰会,演讲中,马斯克谈到了交通堵塞问题,他认为解决城市拥堵的唯一答案就是隧道。在汽车高速发展的今天,从燃油车到新能源汽车...
日期:11-15
阅文新管理层以实际行动打破谣言,恳谈会承诺解决网文行业顽疾
  昨天,阅文新管理团队和作家代表举办作家恳谈会,开诚布公,摊开了谈。阅文新管理层谈到的几点内容,都针砭了网络文学圈子目前的积弊,包括合同争议,明确财产权收益规则,免付费模...
日期:01-27
居然之家家居连锁集团_居然之家“家居领袖思辨会”首秀 智能家居消费困在何处?
  5月20日,居然之家“家居领袖思辨会”首场解码智能家居新驱力于北京国贸大酒店圆满举办。居然之家执行总裁王宁、居然之家副总裁王鹏、居然之家尚屋智慧家总经理方予之...
日期:07-02
日本车企要跑了?_日本的车企
出品丨虎嗅汽车组作者丨李文博编辑丨周到头图丨视觉中国最近,有两条关于汽车供应链的新闻,似乎让全球汽车工业感受到了一股别样的风。第一条:日本《产经新闻》近日报导,本田汽车...
日期:09-06
索尼发函要求 Dbrand 停售纯黑版本 PS5,因其侵害商标权
  10 月 16 日消息,索尼 PS5 游戏主机发布之后,多家海外公司对其外观改造,推出了定制版本的产品。此前有家公司曾推出 PS2 复古风格的改造方案,但是在不久之后,该公司宣布暂停...
日期:07-17
ios gmail 推送_谷歌iOS原生Gmail应用通知推送存在问题
  北京时间11月3日消息,谷歌周三针对iPhone、iPad和iPod Touch推出了原生的Gmail应用,用户可以通过苹果App Store应用商店下载该应用。   这款应用最大的特点是能够提供...
日期:07-24
《阿凡达2:水之道》国内票房破4亿!口碑已下滑 20亿美元才能回本
作为国内电影市场的救星,《阿凡达2:水之道》上映4天票房不断走高,据猫眼专业版数据,截至19日0点,国内票房已经突破4亿,观影人数累计678.2万人。《阿凡达2:水之道》突破3亿票房是12...
日期:12-19
工信部:三大运营商去年完成提速降费计划 让利1200亿元(工信部提速降费政策)
  2018年已经过去,而在过去的一年,三大运营商都交出了怎样的成绩单呢?   国资委公布的详细数据显示,中国电信、中国联通、中国移动三大国内运营商提前超额完成提速降费专...
日期:08-14
骁龙8+续航怪兽!员工晒OPPO Reno9 Pro+续航:用了将近17小时还有电_iqoo 8 pro续航
今日消息,欧加集团工程师程杰晒出了OPPO Reno9 Pro+续航表现,满电后使用了16小时54分钟,还剩4%的电量。据悉,OPPO Reno9 Pro+搭载高通骁龙8+旗舰处理器,从续航表现来看,Reno9 Pro+...
日期:11-23