您的位置:首页 > 互联网

大模型进入实用时代,亚马逊云科技已是Next Level_亚马逊模块

发布时间:2024-05-30 19:40:37  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。

在云计算领域竞争最激烈的时代,亚马逊云科技曾提出,云计算的普惠是技术升级带来的。这个说法换到如今的生成式 AI 时代也是成立的。

如果细数这半年来震撼发布、颠覆时代出现的频率,其实并不比往年低。每一次迭代都在抬高大模型解决问题能力的上限,也都拓宽了人们关于如何利用大模型解决现实场景问题的视野。

前段时间,Claude3高调面世,一度打破 GPT-4保持了许久的全球最强大模型纪录 。

Claude3的背后,站着 Anthropic 的深度合作伙伴 —— 亚马逊云科技。经过对 Amazon Bedrock 上的 Claude3与微软 Azure GPT4相关测试,假定6:1的输入输出比,Claude3Sonnet 成本仅为 GPT4-Turbo 的37%,Claude3Haiku 成本仅为 GPT3.5-Turbo 的61%。

成本的大幅降低,并不意味着性能方面的牺牲。由于硬件和软件的优化,Amazon Bedrock 上的 Claude3模型的实时交互速度显著加快。此外,通过大规模扩展以及新的自监督技术,Claude3上下文中复杂问题的准确性预期也提高了2倍,这意味着人工智能更加有用、安全和诚实。

2024年即将过半,大模型赛道越来越卷,厂商们又该凭借什么如何留住用户?亚马逊云科技的秘诀是什么?

技术进步的同时,用户的需求也在进化。在亚马逊云科技中国峰会上,我们再次看到了这家公司的一系列新思考。

全球80% 独角兽的选择

Amazon Bedrock 有哪些优势?

在现实场景中,没有一个模型能适用于所有用例,也不会有一个大模型能一统天下。对于那些急需使用大模型重做业务的企业来说,最理想的接入方式是通过一个 API 访问不同模型,根据自己的业务需求做出最佳选择。

大模型落地的范围越广、程度越深,企业用户们就越能感受到这一点。

上述需求客观存在,就是 Amazon Bedrock 保持核心优势的背景之一。在亚马逊云科技的三层生成式 AI 技术栈中,Amazon Bedrock 位于其中的工具层。而且与多数提供大模型 API 服务的厂商不同,亚马逊云科技起初将 Amazon Bedrock 设计为一位全能选手。

截至目前,Amazon Bedrock 提供的基础模型数量已经达到了30个,且都是来自 AI21Labs、Anthropic、Cohere、Meta、Stability AI 、Mistral AI 等顶尖的大模型厂商。在功能上,这些基础模型覆盖了文本生成、虚拟助手、文本和图片检索、文本摘要、图片生成等;在场景上,覆盖了翻译、智能运营、角色扮演、创意写作、智能教辅、智能办公、客户服务、审核风控、智能开发、视频 VQA 这十大常见应用,涉及社交、游戏、电商、零售、教育、制造等多个行业。

可以说,当前最新、最前沿的一批模型,都在 Amazon Bedrock。

如果大致对比今年 Amazon Bedrock 的上新,可以看出,今年 Amazon Bedrock 的上新动作,明显有着面向企业级负载的特色:

以 Claude3为例,该系列包含三个模型,延续了 Claude 系列的传统强项 —— 长上下文窗口,初始阶段即支持200K Token 上下文窗口。

相比于 Claude3Opus 的最智能和 Claude3Haiku 的速度最快、最紧凑,Claude3Sonnet 在智能程度与运行速度之间实现了理想的平衡。尤其是对于企业工作负载而言,与同类模型相比,Claude3Sonnet 以更低的成本提供了强大的性能,并专为大规模 AI 部署中的高耐用性而设计 —— 这对于企业用例来说非常重要。

基于亚马逊云科技与 Anthropic深厚的合作关系,Amazon Bedrock 成为了第一个提供 Claude3Sonnet 托管服务的平台。后续登陆 Amazon Bedrock 的 Cohere 基础模型 Command R 和 Command R+ 也都是功能强大且可扩展的大型语言模型(LLM),专门为现实世界的企业级工作负载而设计。

Amazon Bedrock 今年还迎来了一位全新的入驻厂商,就是有欧洲版 OpenAI之称的 Mistral AI 。这家公司将旗下最强大的 Mistral Large 发布到 Amazon Bedrock,Mistral Large 语言理解和生成能力很强,非常适合需要推理能力或高度专门化的复杂任务,如合成文本生成、代码生成、检索增强生成(RAG)或智能代理。同时,Mistral AI 也承诺亚马逊云科技的用户可以使用和访问 Mistral AI 未来发布的大模型。

当然,现实场景何其复杂,任何平台都不能保证自己能够提供用户所有所需的大模型,在这个过程中,用户还需要更高的灵活度。

因此,Amazon Bedrock 提供了根据业务需求定制生成式 AI 的功能 ——自定义模型导入。

对于已经对 LLM 进行了大量微调或想要从头开始训练自定义模型的用户,这是个很好的选项 。比如,用户可以将自己在 Amazon SageMaker 或其他工具上的定制模型搬运过来,至少 Amazon SageMaker 就提供了超过250个预训练基础模型,如 Mistral、Llama2、CodeLlama、Jurassic-2、Jamba、pplx-7B、70B 和 Falcon180B。

在这场峰会上,亚马逊云科技还公布了一个重磅消息:由百川智能提供的基础模型 Baichuan2-7B 即将登陆中国区域 SageMaker JumpStart ,由零一万物提供的基础模型 Yi-1.56B/9B/34B 正式登陆中国区域 SageMaker JumpStart ,在为中国企业提供丰富模型选择的同时满足了企业对安全合规、快速扩展、免运维的需求。

作为首批登陆中国区域 SageMaker JumpStart 的中文基础模型,Baichuan2和 Yi-1.5与亚马逊云科技托管服务深度集成,助力中国企业应用一流的生成式 AI 技术实现本土创新与业务转型。

高科科技股份有限公司

这意味着用户可以将自己在更丰富的开源模型架构上构建的自定义模型。随着本土开源大模型鼎盛时期的到来,未来必将会有更多来自中国大模型企业的基础模型登陆亚马逊云科技的平台,用户也能灵活调用这些中文能力更强大的模型基座。

大模型落地

目前能在网页中走完全流程了

提供了各种开源和闭源的模型 API 显然还不够,距离将 AI 应用在场景中还很遥远。

尽管大模型在很多项任务上的表现可以媲美人类,但还不足以直接推动生成式 AI 落地的爆发。经历了最初的百模大战,也见过激烈的参数、性能竞争,如今的用户心态已经进入不看数字看疗效的阶段。

目睹实际挑战的大模型厂商,过去这段时间也做了一系列探索,期望降低 AI 应用的门槛,提升用户的实际体验。

很早就预判到这一趋势的亚马逊云科技,在 Amazon Bedrock 设计之初就贯彻了一站式服务的核心理念:简化选择、简化定制、简化集成。

亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松。

首先,用户面临模型选择太多的问题,但最好的未必就是最合适的。每家的大模型都各有所长,有的大模型主攻上下文窗口,有的大模型主攻数学推理,用户也可能想在不同的使用场景调取不同的模型。然而,大模型性能的评估是一项繁重的工作。

Amazon Bedrock 提供的模型评估(Model evaluation on Amazon Bedrock)功能现在已经全面可用,且支持自动评估和人工评估两种方式,只需点击几下,用户就能使用特定数据集和评估指标对大模型进行基准测试和比较,还可以多次尝试和切换模型,最终选出最匹配需求的模型,极大地简化了选择过程。

流程很简单:首先,选择要评估的候选模型,可以是公共选项、导入的自定义模型或微调版本;然后,定义相关的测试任务、数据集和评估指标,如准确性、延迟、成本预测和定性因素;最终,Amazon Bedrock 会提供综合评估报告。

随着大模型落地范围的扩展,安全已经从一项前瞻议题变为在政策层面被提及的硬性原则。前段时间,在以安全、创新、包容为议题的人工智能首尔峰会(AI Seoul Summit)上,来自北美、亚洲、欧洲和中东地区的16家公司,包括亚马逊在内,已经就 AI 开发的安全承诺达成一致,并共同签署了前沿人工智能安全承诺。

在 Amazon Bedrock 平台中,与安全有关的功能设计一早俱备。用户可以在Guardrails for Amazon Bedrock中根据使用场景设置多种安全隐私控制,如禁止主题、过滤有害内容、屏蔽敏感信息等,以确保生成式 AI 应用的安全合规运行。

而 Amazon Bedrock 的这些关键功能,最终都将集合在一个网页之中。就像我们平时会通过 App 点餐、购物,但小程序其实也能完成大部分事情。

网页的名称是Amazon Bedrock Studio,这是一种新的基于网页的生成式 AI 开发体验,开发者可以使用企业的单点登录凭证(single sign-on)登录。

通过 Amazon Bedrock Studio,开发者可以快速访问和使用多种基础模型、Amazon Bedrock Knowledge Bases、Amazon Bedrock Agents、Amazon Bedrock Guardrails 等 Amazon Bedrock 内置服务和工具。

大模型进入实用时代

亚马逊模块介绍

亚马逊云科技已是 Next Level

企业需要有技术跟进的能力,但这种能力不需要从零开始构建,已经拥有完整生成式 AI 技术栈的亚马逊云科技,始终在为希望高效实现智能化转型的企业提供助力:

算力的竞争在今年同样激烈,亚马逊云科技的对策是与当前最顶尖的 AI 芯片供应商合作,完成了算力层的全新升级。英伟达2024年最新发布的 NVIDIA Blackwell 架构 GPU,第一时间就登陆了亚马逊云科技平台。

与此同时,大模型厂商们发现,人们并不追求复杂的功能和繁琐的操作,而是更需要简单、直观、易用的产品体验,甚至需要一个助手来帮助管理自己的模型和工具。而位于亚马逊云科技生成式 AI 技术栈最上层的 Amazon Q 担任的就是这样一个角色。具备专业门槛的 Prompt Engineering 终将成为过去,人类不需要亲自对接大模型。

去年的百模大战仿佛还在眼前,但2024年转眼到来,大模型的竞争已经是 Next Level。在这种转变中,亚马逊云科技生成式 AI 技术栈的价值,也被充分验证。

硅谷著名风险投资家、网景公司创始人马克・安德森(Marc Andreessen)曾提出 PMF(Product Market Fit)的概念,指出了产品市场匹配度的重要性。实现 Product-Market Fit 意味着产品能够在市场中获得成功,因为它满足了用户的需求,与竞争对手区分开来,并能够吸引和保留用户。

模型或价格只是企业用户选择服务的一部分因素,更重要的平台到底能不能满足千行百业企业用户的定制化需求。有了这些,一家大模型服务厂商才能立于不败之地。


返回网站首页

本文评论
650亿参数,训练飙升38%!LLaMA基础大模型复刻最佳实践开源,GitHub已获30k星
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】开源LLaMA神话再次复现!首个开源650亿参数大模型高性能预训练方案,训练加速38%,低成本打造...
日期:07-18
小米Civi 2发布:颜值超高 共有4种配色「小米Civi新品发布」
在小米新品发布会上,小米发布了Civi系列新机小米Civi 2。该机共有4种配色,分为冰冰蓝、怦怦粉、朦朦黑以及与Hello Kitty联合设计的特别款“小白裙,每款配色的颜值都非常的高。...
日期:09-29
麒麟970+双面玻璃+后置双摄,荣耀10上市一年,现在还值得买吗?
  自从荣耀手机被独立出来后,便因为超高的性价比优势迅速获得众多消费者的认可。根据最新消息得知,目前荣耀手机在线上渠道的销量,已经拿下国内第一的好成绩。如今随着一部...
日期:06-04
高层大换血!暴雪宣布新任女总裁:前《使命召唤》系列总经理_暴雪 使命召唤
快科技1月30日消息,日前,微软宣布大规模裁员1900人,主要涉及暴雪等部门,暴雪总裁Mike Ybarra和首席设计师Allen Adham也将离开公司。今日,暴雪娱乐宣布任命Johanna Faries为下一...
日期:01-30
广西烧烤竹签长1米8 主要是招待客人酒席时做的_烧烤竹签一般多长多粗的合适
近日,广西柳州,烧烤竹签就有 1 米 8 长,不仅气势惊人,做法还精细。拍摄者蓝女士介绍,这种烧烤主要是招待客人、办酒席时做的,其制作过程繁琐,需要腌制,还要用新鲜的竹签子串起来。全...
日期:06-06
火车上卧铺收费标准「火车卧铺女性拼团走红 收费标准10元每人」
近日,携程推出了火车卧铺女性拼团功能,引发了网友的热议。该功能收费标准为10元 / 人,拼团成功时保证同房间均为女性,拼团失败将退还费用。虽然目前列车上暂未设置专门的女性车...
日期:07-27
腾讯文档上架 Linux 麒麟应用商店_腾讯文件官方版
  1 月 21 日消息,近日,麒麟软件旗下银河麒麟桌面操作系统 V10 SP1 完成与腾讯文档的适配认证,并在麒麟软件商店正式上线腾讯文档。这不仅丰富了麒麟软件的应用生态,也为麒麟...
日期:11-28
快讯丨联想三季度全球PC出货量1600万台 全球市场占有率23.5%_联想出货量 中国区
网易科技讯,10月31日 据IDC最新数据显示,2023年第三季度,联想全球PC出货量达到1600万台,全球市场占有率达23.5%排名第一。2017年诺基亚手机小牛电池改造据悉,2023年9月,联想在中国...
日期:10-31
苏州一商场儿童推车中英文收费不同 商家称系印刷错误「商场儿童推车加盟」
最近,有人在网上分享了一段视频,指出苏州中心商场的儿童小推车租用价格有歧视性,中文和英文标示的费用不同。半小时的使用时间,中文标示要收 20 元,英文标示只要 10 元。 5 月 23...
日期:05-24
揭秘Sora:用大语言模型的方法理解视频,实现了对物理世界的“涌现”
声明:本文来自于微信公众号 硅星人Pro(ID:Si-Planet),作者:苗正 王兆洋,授权转载发布。当全球还沉迷在如何用文本生成文本,以及文本生成图片的时候,OpenAI就这么掏出来了一个视频...
日期:02-18
分享无人回应 爸爸退了家庭群:媒体点评称这是最起码尊重「怒退家长群的爸爸」
近日,有网友在小红书上发文称爸爸宣布退出家族群了!作者在文中写道,自己的父亲是一个爱分享的老头,平时遇到有趣的事、好看的内容都会第一时间发到家族群里,自己会给爸爸捧场,但家...
日期:04-28
钉钉总裁叶军卸任Teambition法定代表人_钉钉副总裁有几个
  天眼查App显示,9月26日,Teambition运营主体上海汇翼信息科技有限公司发生工商变更,钉钉总裁叶军卸任法定代表人、执行董事,均由傅徐军接任。第一艘登月火箭iphone12 pro成本...
日期:10-01
3690亿美元,美国史上最大气候法案获众议院通过_美国众议院通过1.9万亿美元
实习记者 | 南紫晗历时18个月,美国有史以来针对气候能源领域的最大投资计划即将落地。当地时间8月12日,美国众议院以220票赞成、207票反对通过了《降低通货膨胀法案》。该法案...
日期:09-28
特斯拉新车3天三次趴窝 买回来就开几小时要退/换车:官方回应「特斯拉多少天可以退车」
据黄金眼1818报道称,龚先生反映,22号提了一辆特斯拉MODEL Y,才开几个小时,就跳出故障提示,紧接着趴窝了。同样的故障,在之后两天连续出现,他要求退车或换车。我们列出了汽车三包法...
日期:12-04
17将淘汰iPhone 8、iPhone X等三款老机型 iOS
6月17日消息,一些被iOS 17淘汰的老机型,最近正在疯狂贬值,这情况也可以理解,毕竟得不到升级了。苹果A14成本在二手回收市场上,市场研究机构 SellCell 发布了一份报告,分析了来自40...
日期:09-23
天工SkyMusic体验入口 AI音乐生成软件工具下载使用地址_天工mud引擎官网
天工SkyMusic是一款基于昆仑万维天工3.0超级大模型打造的AI音乐生成大模型。它支持高质量的AI音乐生成、人声合成、歌词段落控制、多种音乐风格和音乐智能表达等功能。现在...
日期:04-03
截至2024年3月,中国移动5G-A新技术试验具体进展_中国移动深入实施5g+计划
通信世界网消息(CWW)5G-A(5G-Advanced的简称)是5G向6G发展的关键阶段,相较于5G,其具备更高速率、更大连接、更低时延等特点。5G-A通过引入通感一体、通算智一体、空天地一体等技术...
日期:04-03
游戏行业新闻_疫情冲击游戏行业:玩家回归现实世界 游戏公司销售滑坡
macbook 轻薄谷歌与facebook之战360智能摄像机小水滴1080p每日优鲜美国ipo首日开盘破发   讯 北京时间8月15日早间消息,据报道,近几个月,随着疫情后玩家逐渐回归现实世界,同时...
日期:08-16
半导体设备商东京电子预计2020财年营收达830亿元 同比增长15.3%_日本东芝半导体行业超越美国后崩盘
11月2日消息,据国外媒体报道,半导体制造设备厂商东京电子日前发布了公司最新的财务数据。东京电子预计2020财年公司营收达1.3万亿日元(约合人民币830亿元),同比增长15.3%。东京电...
日期:08-02
柠季获新浪2022科技风云榜年度最受关注创业企业奖
  讯12月16日下午消息,由新浪财经客户端、联合主办的“2022科技风云榜”线上年度盛典今日开幕,今年活动主题为“守正创新,科技向上”。朝鲜媒体报道访华  活动现场,来自各领...
日期:12-17