您的位置:首页 > 互联网

AWS面向生成式AI的全栈云服务对云厂商构筑大模型“前店后厂”的启示

发布时间:2023-07-31 12:46:10  来源:互联网     背景:

通信世界网消息(CWW)ChatGPT 横空出世重振云服务市场预期,全球云厂商纷纷锚定生成式AI展开布局。AWS作为长期占据全球云服务市场1/3份额的绝对龙头,2023年4月面向企业客户训练、部署、定制模型以及构建生成式AI应用等发布三项产品:训练用网络优化型加速计算实例EC2 Trn1n,新一代推理用加速计算实例EC2 Inf2,多模型调用API服务Amazon Bedrock。AWS在保持其基础设施先进性的同时将版图拓展到MaaS,形成贯通模型生产到落地的全栈云服务。

AWS面向生成式AI的全栈云服务

1. 不断丰富加速计算实例并自研高性价比AI芯片,夯实领先云基础设施

AWS提供多种加速计算实例满足不同类型客户需求。对于AI训练和推理,客户或要求效率,或关心成本。面向训练,AWS基于英伟达H100/A100/V100等GPU打造高性能EC2 P5/P4/P3等实例,承接时间敏感型客户大规模训练场景;基于英特尔Gaudi GPU打造EC2 DL1实例,为成本敏感型客户提供高性价比选项;基于自家 Trainium 芯片打造高性能低成本EC2 Trn1实例以及专为生成式AI而生的网络优化型EC2 Trn1n。面向推理,AWS依托英伟达A10G/T4及自家Inferentia/Inferentia2等芯片推出EC2 G5/G4/Inf1/Inf2等多款产品。

AWS不断创新芯片提高云端AI训练与推理成本效益。AWS认为,定制硬件是云服务商改善IT基础设施运行效率与成本、形成竞争优势的必要条件。其2018年起针对机器学习自研AI芯片,2018年底推出推理芯片Inferentia,2020年底推出训练芯片Trainium,2022年底推理芯片升级至Inferentia2,并在这些芯片支持下不断提升AI训练与推理的性价比。例如,由Trainium支持的EC2 Trn1实例与其他EC2实例相比,训练成本节省高达50%;Inferentia2支持的EC2 Inf2实例较上一代由Inferentia支持的与Inf1实例吞吐量提高4倍,延迟降低至1/10,实现与同类EC2实例相比推理成本最低。

2. 打造成熟机器学习平台和多模型调用API服务,构筑先进开发工具

面向模型厂商,AWS将亚马逊二十余年人工智能经验沉淀至Amazon SageMaker机器学习平台,为开发人员构建、训练与部署AI模型提供端到端服务。亚马逊长期关注人工智能并已在机器学习驱动下实现众多功能,如电商门户的推荐引擎、捡货机器人的路径选择、Prime Air无人机和 Amazon Go无人零售实体店中的机器视觉,Alexa语音助理处理千人千面用户诉求等。2017年,AWS将亚马逊成功经验开放,推出Amazon SageMaker机器学习平台,覆盖数据准备、模型构建、模型训练、模型部署等全周期,并包含机器学习治理、低代码机器学习、机器学习工作流等,可进一步降低开发与管理难度的工具。同时,AWS通过可与Amazon SageMaker无缝配合的第三方数据集服务AWS DataExchage拓宽机器学习数据来源。凭借Amazon SageMaker优秀的功能特性、服务交付能力与市场表现,AWS不仅位列IDC《2022年亚太地区(不含日本)AI生命周期软件工具和平台供应商评估》领导者阵营并取得第一,更是在2020~2023年连续四年入选Gartner《云AI开发者服务魔力象限》领导者象限。

图1(左) 2022年亚太地区(不含日本)AI生命周期软件工具和平台供应商评估(来源:IDC,图中圆形面积代表市场份额)

图2(右)2023年云AI开发者服务魔力象限(来源:Gartner)

面向基于模型构建生成式AI应用的客户,AWS瞄准痛点打造Amazon Bedrock 多模型调用API服务。ChatGPT出圈后全球生成式AI应用开发热情高涨,AWS展开调研并归纳出客户现阶段主要三项需求。第一,直接找到并访问与业务场景匹配度最佳的高性能基础模型;第二,将AI模型能力与自身应用无缝集成,且无需为此管理大量基础设施集群、致使成本增加过多;第三,在确保数据安全和隐私保护,掌控数据控制权的前提下使用自有数据构建差异化程序。对此,AWS推出Amazon Bedrock API服务,允许客户按需访问第三方大语言模型Claude、文生图模型Stable Diffusion、多语种大语言模型Jurassic-2和自研大语言模型Amazon Titan等多个基础模型,以及通过与AWS其他产品与工具(如S3存储服务,SageMaker的测试、工作流功能等)搭配使用完成模型测试、模型批量管理、专属模型定制及AI应用开发等工作。其中,针对数据积累不足、担忧数据泄露等制约客户使用云上基础模型的普遍痛点,Amazon Bedrock最低只需客户提供20个标注数据用以模型微调,降低数据门槛,并利用数据加密和虚拟私有云(VPC)等杜绝数据风险。

3. 通过教科书式生态合作助推AWS AI云服务能力持续升级

AWS形成以IaaS/PaaS吸引AI企业,借力AI企业强化AI PaaS的生态闭环。2021年,AWS与建有全球最大机器学习开源库的Hugging Face公司合作,实现优势互补。AWS客户可通过Amazon SageMaker调用Hugging Face上丰富的开源模型、开源数据集,以及其他AI开发工具,Hugging Face用户则不必再为开发部署环境耗费精力。2022年11月,Stability AI公司因看好Amazon SageMaker及Amazon EC2和S3等计算和存储产品首选AWS作为云服务提供商;而AWS则凭借Stability AI的Stable Diffusion模型快速补齐文生图能力,应对微软Azure OpenAI 服务(含文本理解和生成模型GPT-3/3.5/4、代码理解和生成模型Codex和文生图模型DALL-E等)带来的竞争压力;而Amazon Bedrock又将Stable Diffusion推广至更大市场,令其得以获取更多真实反馈与数据,加速迭代升级。

知乎小蓝星是什么

AWS对云厂商构筑大模型“前店后厂”的启示

在生成式AI掀起数字应用变革的当下,云计算作为数字经济承载核心向“为大模型而生”转型势在必行。AWS基于多样化加速计算实例、领先机器学习平台、生态共建模型API服务等建立起面向生成式AI的全栈云服务,为云厂商提供参考范式,即以MaaS为核心打造前店后厂型一站式业务模式,贯通模型生产到落地全环节,助推生成式AI市场蓬勃发展并从中获益。后端,对接大模型供应方,承接基础模型构建、训练、部署、销售等需求;前端,面向大模型使用者,降低模型选购、调用、定制、集成等难度;同时,运用安全沙箱、联邦学习、机密计算等技术建立模型供应方、模型使用者、云厂商三方互信基础,加速模型能力与业务场景无缝融合。

荣耀magic4 pro与oppofindx5pro


返回网站首页

本文评论
诺辉健康宫证清什么时候上市「诺辉健康与医思健康达成战略合作,推动宫证清在港上市」
3月24日消息,诺辉健康(6606.HK)与医思健康(2138.HK)达成独家战略合作,未来将全面整合双方的优质资源,共同推动宫证清™在中国香港的注册上市、分销及市场推广,以居家早筛助力宫颈癌...
日期:03-24
icloud未使用双重认证「苹果称 95% 的 iCloud 用户开启了双重认证」
IT之家 8 月 28 日消息,随着今年秋季推出的下一轮软件更新,苹果 iOS 16 和 macOS Ventura 等将集成对 passkey 标准的支持。该标准被描述为独特的数字密钥,旨在通过简化的跨设...
日期:09-27
深化三服务 “浙江省科协We+抗疫暖企云服务平台”上线
  深化“三服务” 助力开复工     “浙江省科协We+抗疫暖企云服务平台”上线   随着企业逐渐复工,如何尽快走出疫情的影响,正常平稳发展成为每一个企业亟需解决的问...
日期:02-23
蜜芽等中国母婴行业代表企业创始人及CEO应邀出席活动
  5月10日母亲节当天,快手母婴发起#快手母亲节#活动,以“送给妈妈们最好的礼物”为主题,蜜芽、好孩子、乐友等中国母婴行业代表企业创始人及CEO应邀出席活动,开启母亲节CEO福...
日期:03-27
腾讯将减持美团?知情人士辟谣:没有计划_美团腾讯持股
  原标题:媒体称腾讯将减持美团,知情人士辟谣:没有计划  小寒下雪有什么说法部分iphone14机型或移除sim卡槽英伟达rtx 40 系列  36氪获悉,有媒体报道称,腾讯控股计划出售其...
日期:10-08
为了让up主赚到钱,b站表态了吗「为了让UP主赚到钱,B站表态了」
声明:本文来自于微信公众号 刺猬公社(ID:ciweigongshe),作者:弋曈,授权转载发布。2023年,B站迈向商业化的决心比以往任何时候都要坚定。618期间,B站电商类广告收入同比增长超400%,...
日期:07-20
赛博朋克2077用1080ti「《赛博朋克2077》销量破2000万份 首批适配NVIDIA DLSS 3」
虽然《赛博朋克2077》在最初上市之后遭到吐槽,尤其是与前期宣传不符,以及优化拉胯等问题,十分影响玩家体验。但官方一直在努力补救,挽回丢掉的口碑,目前来看做的还算不错。今天CD...
日期:09-30
15万以下造不了智能车?周鸿祎:我不认同(周鸿祎要造15万以下智能车)
  “360跟哪吒汽车合作以后,我希望能够被用户记住的标签是国民智能汽车。”7月2日,360集团创始人、董事长周鸿祎在接受媒体采访时表示:“哪吒汽车要造15万内国民级智能车...
日期:08-13
BCS2021:奇安信推出零信任身份安全解决方案3.0_腾讯发布零信任安全解决方案
  8月27日,在2021北京网络安全大会(BCS2021)期间,奇安信身份安全事业部总经理张泽洲正式发布奇安信零信任身份安全解决方案3.0。据介绍,奇安信零信任身份安全解决方案3.0核...
日期:11-21
抢攻 ai 的大厂先从哪些场景下手「抢攻 AI 的大厂先从哪些场景下手?」
声明:本文来自于微信公众号见实(ID:jianshishijie),作者:阿爽,授权转载发布。变化正在快速发生!从OpenAI的ChatGPT-4聊天窗口转移到你我每天的工作中。比亚迪鲨鱼海鸥先有微软的...
日期:04-21
鸿蒙支持龙芯吗「强强联手 国产龙芯支持鸿蒙开源系统」
中关村在线消息:龙芯中科宣布,在龙芯中科与润和软件共同努力下,OpenHarmony操作系统与龙芯2K0500开发板完成适配验证,龙架构平台对于OpenHarmony已形成初步支持。下一部将龙芯与...
日期:10-16
金秋阳澄湖大闸蟹淘宝商城首发 千人试吃明白消费(网购阳澄湖大闸蟹)
9月16日,苏州市相城区阳澄湖生态休闲旅游度假区鞭炮齐鸣、鼓乐声声。二十艘渔船一字排开,渔民们身着水乡服饰,唱着嘹亮的渔歌起航捕捞。这是占整个阳澄湖水域面积达70%的相城...
日期:07-23
西瓜视频手艺人|“当代鲁班”阿木爷爷获4000万外国人点赞,榫卯工艺火了!
  老话曾言,高手在民间,那些看似平平无奇的人说不定都是大隐隐于市的高手。   在西瓜视频,就有这样一位爷爷,乍看上去就是一个普通人:一顶草帽,一张亲切的笑脸,一双爬满皱纹的...
日期:07-14
大楚云直播 - 教您快速优选最佳直播交友方案
  直播是最近大热的行业,那么想要开发一款脱颖而出的直播系统,指定开发方案时该具备哪些功能呢,今天给大家介绍选择直播方案开发商的要点。   大楚云直播(Cloud Streamin...
日期:02-18
京东为什么要发起价格战「京东不能只靠“价格战”」
声明:本文来自微信公众号“深燃”(ID:shenrancaijing),作者:邹帅,编辑:唐亚华,授权转载发布。进入3月,京东一直处于话题中心。4399小游戏塔防游戏原定于3月6日晚8点上线的京东百亿...
日期:03-10
OPPO Find X6 Pro大促价至6139元 速度抢购「oppo x60pro价格」
OPPO Find X6 Pro手机自3月21日发布以来,备受关注。该款手机采用高通骁龙8 Gen 2处理器和马里亚纳X专用NPU,16GB 512GB版本发售价为6999元。近日,在京东618大促期间,活动价降至6...
日期:06-19
联想手机官网大全「联想手机官方网」
是联想集团旗下的手机品牌,旗下有众多备受瞩目的手机产品,例如:Z系列、X系列等,同时在国际市场中也占有一席之地。以科技、创新为驱动力,不断推陈出新,提高用户体验。其开发的UI界...
日期:05-30
马斯克成立AI公司「xAI」 此前表示将推出TruthGPT
7月13日 消息:今日,特斯拉CEO马斯克宣布成立xAI。据介绍,xAI的目标是理解宇宙的真实本质。xAI团队由特斯拉和SpaceX的首席执行官伊隆·马斯克领导。xAI的团队成员曾在DeepMind...
日期:07-13
Google推出Android 13第二个测试版_Google发布Android 12
  5月14日消息(刘文轩)Google 在 I/O 大会期间推出了 Android 13 的第二个测试版,在操作系统、开发者资源与应用程序更新上的体验都进行了优化,并且在隐私权管理方面,推出...
日期:07-18
超40度高温来袭 网友:出门就是蒸桑拿「桑拿蒸汽多少度」
据6月16日气象台发布的信息,未来48小时,华北、黄淮和内蒙古西部等地区的部分地区将会出现35~39℃的高温天气,局部地区甚至将会超过40℃,这一气温甚至高于南方某些城市的气温。今...
日期:06-16