您的位置:首页 > 互联网

如何融合不同计算范式?Ray在蚂蚁的规模化应用实践

发布时间:2022-07-16 06:23:04  来源:互联网     背景:

  导语:随着互联网技术发展,新技术不断涌现,这制造了一个意想不到的新问题:打造服务时可能经常多种不同领域技术深度结合,但由于种种原因这些技术通常难以结合的那么好。蚂蚁集团基于开源的分布式计算框架Ray构建融合引擎,在不同场景去解决这个问题,取得了一定成果,现在就让我们来看看他们是怎么做的?

  利用Ray构建融合引擎

  随着互联网的发展,人们倾向于使用新的计算范式来应对不同的场景,新的技术也随之涌现,如OLAP引擎、图计算、流计算、深度学习等。这意味着在解决一个问题时,可能需要两项甚至多项技术进行深度的结合。

  Ray的使用也很简单,在目前比较流行的分布式框架,都有三个比较基础的分布式原语,分布式任务、对象和服务。而常用的面向过程的编程语言中,也刚好有三个基本概念,函数、变量和类。这三个编程语基本概念刚好可以和分布式框架的原语对应起来。在Ray系统中,可以通过简单的改动,实现它们之间的转换。

  但是,在将不同技术结合到一起的时候,会遇到多方面的挑战,包括:

  ● 复杂系统的协调。当多个核心计算引擎组合到一起的时候,系统的复杂性大大上升,也加大了工程师对复杂系统的协调难度;

  ● 性能优化。在进行性能调优工作时,工程师需要面对多种分属不同领域的计算引擎,导致系统难以突破性能瓶颈;

  ● 开发效率。工程师需要熟悉多个引擎如何协同工作,出现问题也难以定位和排查,导致开发效率低下。

  这正是蚂蚁集团开发融合计算引擎的原因,其目标是将多种不同范式的引擎融合在一起,更好的提供服务,融合计算基于分布式计算框架Ray开发而成,具备以下特性:

  ● 简单且通用的API。

  ● 同时支持多个编程语言。

  ● 弹性且可自定义的任务调度。

  ● 分布式状态管理。

  ● 易用的错误处理和故障恢复。

  ● 低成本的DevOps。

  Ray是由伯克利大学RiseLab实验室发起,蚂蚁金服共同参与的一个开源分布式计算框架,它提出的初衷在于让分布式系统的开发和应用能够更加简单。Ray作为计算框架具有敏捷的调度机制,也可以根据计算对资源使用的需求实现异构调度。

  Ray的使用也很简单,在目前比较流行的分布式框架,都有三个比较基础的分布式原语,分布式任务、对象和服务。而常用的面向过程的编程语言中,也刚好有三个基本概念,函数、变量和类。这三个编程语基本概念刚好可以和分布式框架的原语对应起来。在Ray系统中,可以通过简单的改动,实现它们之间的转换。

  左边是一个简单的例子,在这个函数前面需要加入一个“@remote”修饰符,就可以把一个函数转换成为分布式任务。任务通过“.remote”调用执行,返回值是一个变量,又可以参与到其他计算中。

  右边是另一个例子,通过加“@remote”修饰符的方式可以把一个类转变成服务。类中的方法可以通过“.remote”调用变成一个分布式任务,和函数的使用非常相似。通过这种方式可以实现从单机程序到分布式任务的转变,把本地的任务调度到远程的机器上进行执行。

  关于Ray更多的介绍参见:《提效降本:蚂蚁金服如何用融合计算改造在线机器学习》

  在蚂蚁的金融智能技术架构中,融合计算运行于Kubernetes集群之上,Ray作为分布式计算的基础设施,支持包括动态图计算、在线机器学习等应用框架,驱动上层实时风控、知识图谱等应用。

  蚂蚁深度参与了Ray开源项目的开发,在Ray社区贡献位于前二位。截止到2020年10月,前25位贡献者当中有8位蚂蚁工程师,22%的代码由蚂蚁集团贡献。蚂蚁为Ray贡献了包括Java API、容错性GCS等功能特性,并为Ray在大规模落地实践提供了宝贵经验。

  Ray在蚂蚁集团的规模化应用实践

  蚂蚁在18年Ray项目的早期就参与到了项目的开发,长期和Ray开源社区保持密切合作,并深度参与了Ray内核的开发。在蚂蚁内部,我们基于Ray构建了实时图计算、在线计算、在线机器学习等计算平台,以及多个直接运行在Ray之上的分布式业务系统。这些系统在微贷、风控、智能营销、金融智能、金融核心等核心业务领域得到了广泛的应用,平稳顺利地支持了多次双十一大促。

  下面,我们将简要介绍Ray在蚂蚁集团的规模化应用实践。

  首先是在线机器学习系统。

  传统的在线机器学习系统是一系列子系统组成的任务管道,原始的实时数据需要流经过滤、采样、特征工程、训练和部署等系统,才能发挥作用。这就给我们带来了数据一致性、系统稳定性、多平台等挑战。

  蚂蚁基于Ray开发出端到端的在线机器学习架构,如下图。

  这套架构在一个在线机器学习框架中包括实时数据处理、分布式训练以及模型部署三大组件,并通过Ray的分布式计算特性,支持跨编程语言的开发、exactly once、自动化训练和模型更新等。

  在该在线学习系统的运行时里,我们可以看到实时数据处理和训练及部署是高度集成在一起的,外部的实时数据被转换为微批处理,并实时同步给训练组件,然后进行部署,这种设计可以最大化系统效率。这套系统同时支持数据流API和SQL两种调用方式,进一步为业务方降低了使用的学习成本。

  另一个落地场景是大规模并行处理。

  随着业务场景和需求的不断深化扩展,许多在线应用开始承担分布式计算功能,然而,现有的应用架构缺乏分布式计算系统中的任务调度、集群管理、灵活容错 FO 等能力,导致在业务规模化过程中,容易出现集群负载不均、单机瓶颈、资源无法动态隔离等问题。

  银行卡支付一直是支付工具中重要的组成部分。银行卡业务涉及各类金融机构渠道,涉及的机构众多,各个机构的能力各不相同。如何保障用户在大促期间的高支付成功率,让用户的大促体验丝般顺滑存在极大的挑战。当银行卡支付发生异常时,需要尽快做出准确的决策,执行应变操作,以及时减少异常带来的损失。而传统的监控报警提供的秒级指标查询延迟较高,特别是对于决策常用的成功率联合计算指标,延迟更是超过1分钟,决策也因此只能做到分钟级的熔断能力,同时稳定性也不能满足大促的SLA要求。

如何融合不同计算范式?Ray在蚂蚁的规模化应用实践

  为了解决上述问题,我们基于 Ray 打造了Ray-MPP在线计算系统,具备端到端极低延迟、高可用、具备数据准确性保障(exactly once)等特点。

  一方面可以很好的处理在线计算应用中大规模细粒度任务调用的场景,另一方面发挥 Ray 运行时动态扩展的特点,使得系统具备更好的运行时资源动态隔离能力,并在处理任务时具备更强的灵活性。

如何融合不同计算范式?Ray在蚂蚁的规模化应用实践

  Ray-MPP 被运用在金融网络的金融决策链路中,为金融决策的指标查询计算和决策脚本计算提供分布式计算能力。经过实际场景中的检验,Ray-MPP 为业务在计算性能、稳定性、研发效能等各方面都带来了提升。

  未来展望

  目前,Ray项目发展势头良好,并且得到了越来越多的关注。除了蚂蚁之外,Uber、Intel、微软、字节跳动等公司也在积极参与Ray社区。同时,也有越来越多开源项目已经集成进了Ray的生态。

  未来,我们将从扩展性、性能、调度、弹性、生态建设等方面继续提升Ray的能力,把Ray打造成一个稳定、高效、易用、通用的分布式计算底盘,也期待和业界与社区有更多交流探讨。

  同时,我们也正在面向应届毕业生招聘2021年实习生,欢迎自荐和推荐。

  团队介绍

  我们是蚂蚁集团数据技术部,是整个蚂蚁集团数据引擎的底盘,为整个集团的各项业务发展保驾护航。我们打造的蚂蚁集团计算存储基础架构,其技术核心包括金融大数据的开放计算体系,金融级大规模图计算存储,金融智能机器学习平台及系统架构,以及适合金融场景的多模融合计算引擎等方面的研发和攻关。

  依托蚂蚁集团丰富的数字金融和数字生活场景,我们致力于打造新一代大数据和AI基础设施。

  我们的团队横跨美国硅谷和中国北京、上海、杭州和成都。我们追求的工程师文化是开放、简单、迭代、追求效率、用技术解决问题!

  你想要的我们都有!!!

  ● 平台好:顶尖的工程师团队,超大规模数据计算平台,Stanford、Berkeley等一流高校的合作伙伴, SQLFlow等多个自研和开源项目。

  ● 成长快:面对不可多见的一流计算场景,挑战世界级技术难题,主管师兄带你飞。

  ● 福利好:提供业内极具竞争力的薪资,各种补贴我们都帮你想到了。

  ● 活动多:生日会、工程师节日、阿里日、战役庆功、各种团建……来了你就知道了!

  招聘需求

  面向对象:2021.11-2022.10期间毕业的应届毕业生

  岗位类型:

  ● 研发工程师:C/C++, Java, Python, Go

  ● 算法工程师:机器学习

  技术方向:图计算、分布式计算、分布式存储、数据库、人工智能

  工作城市:杭州、北京、上海、成都

  应聘方式:发简历至antcomputing@antgroup.com

  需要注明【岗位+编程语言+技术方向】或者找学长学姐帮你内推。

  期待大家以最帅/最美的姿势跑完招聘流程,等待offer降临!


中兴手机blade

日本乐天海淘网站

返回网站首页

黑鲨更新joyui12.5系统真恶心

格力董明珠节目

乐视max处理器


苏宁易购双十一晚会肖战

万物新生(原爱回收)旗下B2B平台拍机堂再创新高 同比增长超243%
央视点赞抖音创作者itsRae:记录就地过年的异乡人

返回网站首页

本文评论
1899元起!华为nova 9官翻机开售:50MP主摄+4300mAh电池「nova6 1799」
华为官方今日宣布,华为官方翻新产品nova 9将于今日10:08在华为商城正式开售。官方海报显示,华为nova 9 官翻机提供9号色、亮黑色、绮境森林三款配色,128GB版本售价1899元,256GB...
日期:12-16
以色列部长致信乔布斯要求删除反犹太应用_爱因斯坦拒绝做以色列总统
(吴超)北京时间6月22日讯,据国外媒体报道,一位以色列外交部长致信乔布斯,要求苹果移除iTunes商店中一款称为“第三次因提法达”(Third Intifada)的应用。他表示该应用煽动针对以色...
日期:07-30
梅开二度!老虎证券再携真成投资创始人李剑威发起SPAC
  3月4日,老虎证券携真成投资创始人李剑威为一家SPAC(特殊目的收购公司)“TradeUP Global Corporation”提交IPO申请。该公司将以“TUGCU”的股票代码登陆纳斯达克,每单位...
日期:07-16
疫情之下,看BEIJING汽车的技术的温度如何暖生活
  当新冠肺炎疫情卷入我们的生活,我们就开始琢磨与思索,到底如何出行,才能护自己与所爱之人的健康安全?世界依旧在运转,停不住的奔波仍继续,即便是一些人在家里从客厅到床头就...
日期:09-19
网络文学行业迎来变革窗口期,平台与作家更应紧密合作(结合一部文学作品,谈谈你对网络文学的看法)
  今年两会期间,全国政协委员、中国作协网络文学委员会主任陈崎嵘接受人民网采访时表示,中国网络文学已经发展近二十年,现阶段出现一段平缓期或曰“瓶颈期”,实属正常。网络...
日期:07-14
视频短信,游戏行业都在用的移动营销方式_手机好多游戏推广短信
  2020年,疫情催生的“宅经济”持续火爆,中国游戏产业发展势头强劲。据伽马数据的报告显示,2020年1-3月移动游戏市场收入超过500亿元,同比增长率超过40%,而4月同比增长24.4%,5...
日期:07-14
丰巢智能柜小程序开辟“生活服务”专区 推广丰巢自营洗衣业务「丰巢智能柜系统」
10月12日 消息:丰巢都开始推洗衣业务了?近日,有用户发现,丰巢智能柜小程序推出了“生活服务”专区,推广丰巢自营洗衣业务。根据丰巢智能柜小程序的信息,“丰巢洗护”服务内容包...
日期:10-26
iPhone 13立减800 比双十一便宜 到手4388起「苹果13双十一能降价吗」
10月7日iPhone 14 Plus首销当日就立减400多元破发,而目前外观、性能等方面iPhone 13更加合适,iPhone 13还和iPhone 14用的都是相同的A15芯片,但iPhone 13立减800元,到手4388元起...
日期:10-28
贝壳上半年净亏损25亿,新房业务偏好央国资房企「贝壳新房市场份额」
查看最新行情   作者/孙梦凡  在房企业绩普跌、一片哀嚎之际,行业中介贝壳-W(02423.HK)也交出了一份惨淡成绩单。100w氮化镓充电器评测...
日期:09-06
2020年极光预测_极光发布2021年上半年最受欢迎APP榜单TOP10
  近日,中国领先的移动开发者服务提供商极光(Aurora Mobile, NASDAQ:JG),发布了2021年上半年移动应用排行榜,该榜单根据用户日活、品牌影响力等维度进行评选,包含上半年最受...
日期:12-04
春节红包“一网打尽” 应用宝成一站式福利聚集地(应用宝红包活动)
  俗话说“过完十五才是年”,虽然不少公司已经开工大吉,但网友们依然沉浸在年味之中,见到朋友、同学的第一件事,一定少不了新年抢红包的话题。而每年的春节红包大战,不仅是网...
日期:03-24
苹果 iPhone 14 卫星紧急求救功能今天开始正式上线_苹果 iphone 14 卫星紧急求救功能今天开始正式上线了
11月15日消息:苹果公司今天在一份新闻稿中宣布,iPhone14 的卫星紧急求救服务将于今天正式开始推出。苹果公司在 9 月份的 iPhone14 发布会上宣布了这一功能,表示其将在 11 月...
日期:11-18
机器人日益融入实体经济 多部门出台措施支持拓展应用空间(政府怎样完善和形成机器人产业链)
岳洋合 制图联想M10 PLUS 网课平板参数   ◎记者 李雁争   最近一段时间,小米、腾讯等多家公司发布机器人新品;已有的机器人也在加快进入抗洪、防疫和工业生产的一线;科技...
日期:08-16
招工难!亚马逊宣布将仓储和货运工人的平均时薪上调至19美元「亚马逊物流工资」
  讯 北京时间9月29日早间消息,据报道,当地时间周三,美国电商巨头亚马逊宣布,旗下物流仓库和快递系统的工人们,将获得一轮涨薪:平均起步小时工资将从过去的18美元上调到19美元。...
日期:09-29
保障高校复学返校健康安全 腾讯微校协助记录师生校内动态轨迹
  近日,教育部发布“各高校错峰开学复课”的通知,3700余万大学生即将重返校园。如何快速完成开学入校的核验工作?开学后,如何筑牢校园复学防“疫”线?近日,郑州工商学院...
日期:09-14
网盘的图片_普通下载提供网盘 网店图片更有容身之地
  在电脑网络时代,为了便捷或更安全地存储提取文件,只靠电脑硬盘是远远不够的,因此很多人都会备用有U盘、内存卡、移动硬盘等存储空间。而近年来移动办公、网店的兴起,网络硬...
日期:07-29
网上鞋城好乐买借巨额融资 加速电子商务行业洗牌(网络卖鞋创业)
  近日,国内最大正品鞋网站好乐买宣布完成C轮融资,金额达6000万美元。好乐买总裁助理罗敏称,“本次融资将会是目前垂直B2C领域里面最大的一笔”。伴随巨额融资进入,后来者进...
日期:07-26
硬件数字化成就下一代轻量级解决方案 提升客户全生命周期价值(数字化核心技术)
  数字化大潮席卷而来,对电气化产业的发展带来重大变革,更分散的配电设施分布,更复杂的运维管理需求,更严苛的安全可靠标准,更专业的行业场景应用……对配电系统而言,从设计到...
日期:02-20
极氪ZEEKR 001第5万辆下线 创造新势力品牌首年生产速度纪录「极氪zeekr官网到底是什么」
10月12日消息:极氪 ZEEKR 官方宣布,旗下豪华猎装轿跑 ZEEKR001的第5万辆正式下线,不到1年,创造了新势力品牌的首年生产速度纪录。索尼双摄手机据此前极氪公布的极氪001交付数据...
日期:10-25
2020年10月诺贝尔奖「2022年诺贝尔奖将从10月3日起陆续揭晓」
  记者/郝晓丽5G手机贵吗?  据诺贝尔奖官网消息,2022年诺贝尔奖将于10月3日至10日陆续颁布。诺贝尔基金会还决定邀请2022年诺贝尔奖获得者与2020年、2021年的获奖者一起...
日期:10-02