您的位置:首页 > 互联网

并畅谈大模型推理技术实践 作业帮受邀出任稀土开发者大会架构专场出品人

发布时间:2024-07-03 16:53:14  来源:互联网     背景:

6月28日至29日,集行业前瞻性与实践性为一体的稀土开发者大会在京成功举办。凭借对前沿科技的持续探索与深入研究,作业帮应邀参会,不仅重点参与了架构专题的建设,还针对行业热点的大模型技术做了重点分享。

applecare只换不修

作业帮线上业务中心负责人郑长帅受邀出任架构设计和业务稳定性建设出品人,立足行业,郑长帅深入参与了本场会议架构议题的选材与建设,作业帮业务中台技术负责人熊定云与声网、小红书、海达数据库等技术负责人场景化的还原了头部科技企业在架构技术方面的实践经验。

稳定性是系统架构治理的一个重要环节。每个业务都有各自领域的特点和发展阶段,相应地也会遇到稳定性挑战和治理决策的问题。作业帮的架构呈现多元化差异化、跨平台多角色强协同等特点,容量、功能、数据、容错容灾、高频活动的保障便成为了作业帮架构治理的关键任务点。

在架构专场,熊定云从作业帮架构的整体思考出发,围绕作业帮的架构治理方案的设计思路、方法、效果进行了详细阐述,讲解途中穿插实际案例,深入浅出地还原作业帮架构治理的实践之路。在分享最后,熊定云强调,对系统的稳定性要时刻保持敬畏之心,关注业务或系统中产生的新变量,持续迭代认知、坚持必要投入。

此外,作为最早开始教育垂类大模型研发的企业,作业帮AI Infra架构师乔显杰还在大模型部署与推理专题分享了作业帮大模型推理加速的实践经验。前沿科技的探索离不开底层技术的持续开发,随着大模型的发展,参数量和计算量越来越大,这些年GPU的算力也在不断发展,英伟达每次数据中心产品更新的算力都在5-10倍。因此如何充分利用GPU算力是大模型工程的重点。

乔显杰提到,大模型推理优化的重点,是如何充分利用GPU算力资源。因此,避免充分冗余计算、减少非Gemm计算时间、最大化Gemm算力则成为大模型推理优化的关键步骤。乔显杰通过开源框架的选择、量化方式的探索等几个方面详细分享了作业帮大模型的推理实践。

稀土开发者大会是由稀土掘金技术社区主办,本届大会主题为“代码不止,掘金不停”,面向开发者社区的中坚力量,集结近百位国内外技术大咖,旨在帮助开发者拓宽技术视野,传播前沿的技术理念,打造一场业界标杆级的开发者技术盛宴。


返回网站首页

本文评论
乐森打造全新家庭娱乐场景互动体验,机器人+AI_乐森机器人公司怎么样
5月25日,消费级机器人品牌「ROBOSEN」乐森机器人(以下简称:乐森)在北京兰境艺术中心隆重举办以“Make Life More Fun”为主题的新品发布会。发布会上,乐森重磅推出三款消费级娱...
日期:09-16
微软宣布放弃Win10!Win11 23H2年度更新来了:正加紧准备「微软发布windows 11」
快科技5月18日讯,微软前不久宣布不再为Windows 10推送任何功能更新,版本号止步于22H2(Build 19045),且家庭版/专业版会在2025年10月14日结束支持。这意味着,微软将把更多经历放在W...
日期:05-19
新款iPadAir和Pro启用80%限度充电功能:旨在减少电池损耗_ipad pro 只能充到80
5月15日 消息:今日,备受期待的苹果新款iPad Air与iPad Pro正式开售。这两款新品不仅在硬件配置上进行了全面升级,更引入了iPhone15系列独享的电池健康功能,为用户带来更为贴心...
日期:05-15
上海虹桥火车站:4月28日发往全国各站车票均已售完_上海虹桥火车站所有车次
五一假期开启前一天,准备回家、旅游的朋友们,已经提前出发,国内不少地方车站,车票已经售罄。智能电视的推出颠覆了人们心中4月28日消息,据澎湃新闻”报道,铁路上海站方面获悉,上海...
日期:04-28
nbc环球财报「承认与员工存在“不正当关系” NBC环球CEO引咎辞职」
4月24日消息,美国最大有线电视运营商康卡斯特宣布,其子公司NBC环球首席执行官杰夫·谢尔(Jeff Shell)在承认与一名女员工存在“不正当关系”后,于当地时间周日引咎辞职。谢尔在一...
日期:04-24
硅谷银行金融集团「多家公司紧急回应硅谷银行危机 无业务合作」
美国财政部、美联储、联邦存款保险公司(FDIC)在硅谷银行事件后宣布采取行动。从3月13日周一开始,储户可以支取他们所有的资金。与硅谷银行破产有关的任何损失都不会由纳税人承...
日期:03-13
事关违规经营!中国广电已取消下属中国有线开展数据传输服务的经营许可
通信世界网消息(CWW)据中华人民共和国审计署官网消息,近日,受国务院委托,国家审计署审计长侯凯在第十四届全国人民代表大会常务委员会第七次会议上所做的《国务院关于2022年度中...
日期:01-26
传音与腾讯官宣合作:产品将搭载腾讯游戏语音GVoice技术_传音通讯怎么样
通信世界网消息(CWW)据传音官方介绍,近日传音研发中心与腾讯游戏语音GVoice在上海传音研创园签署了技术创新合作协议,双方将在移动语音技术领域展开深入合作。iPhone 14 pro特斯...
日期:06-07
全国算力网络「工信部刘郁林:我国算力总规模达180EFLOPS,服务器超过2000万台」
通信世界网消息(CWW)推动算力深度融入千行百业,为经济社会高质量发展提供新动能。近日,在“算力浦江”行动计划发布一周年大会上,工业和信息化部信息通信发展司一级巡视员刘郁林...
日期:06-15
未开售便引发数十万人抢先预约 荣耀亲选Earbuds X2凭什么这么火?(荣耀亲选 Earbuds X2)
  近日,最新发布的荣耀亲选Earbuds X2真无线耳机在各大电商平台开启了预约,预约价179元。目前,仅京东平台荣耀京东自营旗舰店预约人数已达11.3万,全平台参与预约人数异常火爆...
日期:11-27
沃尔玛+亚马逊模式_沃尔玛紧跟潮流:9月起向会员提供流媒体服务 试图挑战亚马逊
编辑/周子意   美国最大传统零售商沃尔玛公司周一(15日)与影视公司派拉蒙环球(Paramount Global)达成协议,向沃尔玛会员计划的订户提供Paramount+的流媒体服务。沃尔玛试图通过...
日期:08-20
硬气如Temu,还在强啃日本这块硬骨头?_日本最硬的食物
声明:本文来自于微信公众号 白鲸出海(ID:baijingapp),作者:赵思尧,授权转载发布。一位投资人在播客中透露,拼多多的人效比能达到千万元。这家公司的做事效率真的太强了,这很难不让...
日期:12-01
全国新能源汽车保有量达1149万辆 占汽车保有量3.65%_我国新能源汽车保有量
10月8日消息:据公安部最新统计数据显示,截至2022年9月底,全国机动车保有量达4.12亿辆,其中汽车3.15亿辆;机动车驾驶人4.99亿人,其中汽车驾驶人4.61亿人。天猫精灵超级会员有什么...
日期:10-10
三大运营商财报 2019「三大运营商最新财报出炉:一天净赚4.2亿」
快科技5月21日消息,三大运营商今日披露了2023年4月主要运营数据。纳斯达克和英伟达关系数据显示,2023年一季度,三大运营商共实现营业收入约4777亿元,实现归母净利润约383亿元,平...
日期:05-22
致敬中国航天!《王者荣耀》盾山新皮肤演示:大招出现长征5号
11月1日消息,日前,《王者荣耀》公布了盾山梦圆繁星航天主题皮肤,致敬中国航天。今日,@王者荣耀 官方公布了这款皮肤的设计思路以及技能实机演示。造车新势力分析华为智能手表上...
日期:11-02
苹果修复30个安全漏洞 其中一个长达一年_苹果手机的漏洞修复
  5月20日消息,据国外媒体报道,苹果公司近日修复了总计30个的安全漏洞,其中一个漏洞居然存在了一年多。   据悉,Java for Mac OS X 10.5 Update 7和Java for Mac OS X 10.6...
日期:07-29
众泰汽车2019年预亏损60亿-90亿元「2023年前三季度净利润亏损4.47亿:众泰汽车发布最新财报」
快科技10月30日消息,日前,根据众泰汽车公布最新财报显示:第三季度实现营业收入1.61亿元,同比下降14.46%。其中,归属于上市公司股东的净利润亏损1.63亿元;前三季度归母净利润亏损4....
日期:10-31
瑞芯微与百度飞桨联手推动AI应用场景普及
  在AI向前不断推进的过程中,随着业界对AI应用落地的迫切需求,AI软硬件的充分结合势在必行。瑞芯微高算力AI芯片与百度飞桨开源深度平台之间的合作,强势赋能AI行业。   ...
日期:05-09
26.78万起售贵过汉兰达:广汽丰田威兰达高性能版上市_威兰达2021款汉兰达怎么样
快科技6月6日消息,2024 款广汽丰田威兰达高性能版上市,共推出3款车型,官方指导价区间为26.78-30.18万元,起售价比自家大哥汉兰达(24.98万)还要贵不少,之所以如此,是因为这款为插电混...
日期:06-07
韩国sk集团ceo「OpenAI CEO 访韩 或就 AI 芯片合作事宜与 SK 集团会长会面」
1月22日 消息:随着企业和消费者对人工智能(AI)应用的兴趣日益浓厚,对 AI 芯片的需求也在快速增长。为应对可能的芯片短缺,美国 AI 初创公司 OpenAI 正在寻求解决方案。据报道,Ope...
日期:01-22