您的位置:首页 > 互联网

Karpathy看好的Agents学会自动退换货了!英伟达H100加持,给LLM插入最强外接大脑

发布时间:2023-08-02 10:14:55  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】全世界最有「料」的平台来了!Amazon Bedrock基础模型上新,商用Agents加快应用开发,矢量引擎赋予大模型记忆,亚马逊云科技凭借技术创新成为端到端的生成式AI领导者。

最近,AI圈依然是大事频发,几天一个爆炸性新闻。

Meta联手微软高调开源了Llama2,它在2万亿个token上训练,秒杀许多开源语言模型,并且还能免费商用。

OpenAI科学家Karpathy最近搞的明星项目「Baby Llama」,已经可以用C语言跑Llama27B了。

而就在几天前,Stability AI正式发布了下一代文生图模型——Stable Diffusion XL1.0。

这次的1.0版本是Stability AI的旗舰版生图模型,也是最先进的开源生图模型。

未来 科幻 脑机接口

在目前的开放式图像模型中,SDXL1.0是参数数量最多的。官方表示,这次采用的是全新的架构,基础模型的参数规模达到35亿,同时还有一个66亿参数大小的细化模型。

而如此强大的生图模型,已经可以在Amazon Bedrock上一键访问了!

基础模型全面上新

win10系统如何远程控制电脑桌面

就在上周,亚马逊云科技发布了一大波基础模型上新。

除了刚刚提到的SDXL1.0,Amazon Bedrock还增加了对Cohere基础模型以及ChatGPT最强竞品——Anthropic的Claude2的支持。

图片

Cohere研发的大语言模型Command,是一个能够接受用户个性化命令训练的模型,专注于提供文本搜索、文本分类和文本生成三大AI能力。

图片

另外,Anthropic推出的Claude2,其处理能力已经更新到10万个token。相较之前版本,Claude2在数学、代码、推理能力方面有明显的提升。

图片

同时,开发者还可以通过机器学习中心Amazon SageMaker Jumpstart,一键开发各类热门开源模型。

比如,Meta最新的Llama2、世界最大开源社区Hugging Face托管的Falcon、Flan等等。

图片

Agents改变游戏规则

不过,基础模型虽然在各种任务上有强大的泛化能力,但随着应用场景的不断扩展,仅靠模型本身已经很难去完成一些复杂的任务了。

比如预定航班或退回购买的商品这种简单的任务,开发者都必须经历多个步骤——通过提供特定的说明和配置、访问相关知识源、编写代码将任务分解,然后应用才能通过一系列API调用采取行动。

在这个过程中,开发者必须配置和管理基础架构,设置数据安全和隐私策略,繁琐又耗时。

而前段时间AutoGPT的爆火,则给了学界和工业界一个全新的探索方向——集成了大语言模型的Agents。

图片

Karpathy曾将AutoGPT称为快速工程的下一个前沿

概括来说,AI智能体可以通过最简单的形式运行循环,并且在每一次的迭代中,都会生成自主指令和操作。因此,它们既无需依赖人类来引导对话,还具有高度的可扩展性。

以AutoGPT为例,我们每分配一个任务,它都会给出一个相应的解决计划。

比如,需要浏览互联网或使用新数据,它便会调整其策略,直到任务完成。这就像拥有一个能处理各种任务的私人助手,如市场分析、客户服务、市场营销、财务等。

正如今年加入OpenAI的大牛、前特斯拉AI总监Karpathy所说:「Agents代表着AI的一种未来。」

亚马逊云科技也在这个领域进行了自己的探索,并且创新性地提出了全新的Amazon Bedrock Agents。

图片

基于Amazon Bedrock提供的Agents功能,开发者可以轻松创建各种生成式AI应用,来完成复杂任务,并根据专有知识源提供最新答案。

以往得耗费几个小时编码来实现的过程,现在无需任何手动编码,只要单击几下,Agents就能自动分解任务,创建计划。

这样一来,生成式AI应用程序分分钟就搞出来了。

图片

那么,Amazon Bedrock Agents是如何让基础模型加速工作流的呢?具体可分为以下四个步骤:

第一步:定义指令和编排,将复杂任务分解为多个步骤

第二步:检索增强生成(RAG),配置FM与公司数据互动

第三步:完成交互,执行API调用以满足用户请求

第四步:在云中安全托管

Amazon Bedrock Agents可以通过简单的API链接到公司数据,将其转换为机器可读的格式,就能生成准确响应。然后自动调用API,满足用户请求。

图片

基于Amazon Bedrock,用户可以任意选择适合自己用例的基础模型,然后用自然语言给它下指令。

比如告诉它,「你现在是一个智能体,需要帮助处理保险索赔和管理待处理文书的工作」。

图片

然后,对Agents发出命令「向所有有未结索赔和待处理文书工作的保单持有人发送提醒」,它马上理解了我们的请求,把任务分成多个步骤——收集未结保险索赔、查找索赔 ID、发送提醒,然后执行了相应的操作。

图片

而且,有了Amazon Bedrock Agents的功能,用于电商的AI程序不仅可以回答简单的问题,还能完成复杂的任务,比如更新订单、管理交易。

比如,客户发出想要退回一双鞋,可以直接说:「我想把这双黑色鞋换成棕色的」。

Agents收到信息后,就会连接到公司数据,自动将文本转换成机器可读格式,向模型提供相关信息,然后调用正确的API来满足这一请求。

图片

英伟达H100最强加持

然而,基础模型性能不断提升,所带来的是动辄几百万亿的参数。

这种复杂性的暴涨,也极大地增加了模型训练和微调的时间——最新的LLM需要数月的时间来进行训练。

与此同时,HPC领域也呈现出了类似的趋势。随着精度的提高,用户收集的数据集已经达到了Exabyte级别。

为了满足高性能和可扩展性的算力需求,亚马逊云科技全新推出了搭载英伟达最强GPU——H100的Amazon Elastic Compute Cloud(EC2)P5实例。

相较于上一代,Amazon EC2P5实例不仅可以将训练时间缩短高达6倍(从几天缩短到几小时),而且还能使训练成本降低高达40%。

图片

具体来说,Amazon EC2P5实例共搭载了8个NVIDIA H100Tensor Core GPU,配备640GB高带宽GPU显存,同时还有第三代AMD EPYC处理器、2TB系统内存、30TB本地NVMe存储,以及高达3200Gbps的总网络带宽。

堪称配置拉满的性能,为最苛刻、计算密集的生成式AI应用提供了支持,包括问答系统、代码生成、视频和图像生成、语音识别等,非常适合训练和运行日益复杂的LLM和CV模型。

基于全新的Amazon EC2P5实例,用户可以探索此前难以触及的问题,并且更快地迭代出解决方案。

图片

此外,为了满足用户对大规模和低延迟的需求,亚马逊云科技还推出了搭载有Amazon EC2P5实例的第二代EC2UltraClusters。

作为云中规模最大的ML基础设施,EC2UltraClusters可提供高达20exaflops的总计算能力,以及跨20,000多个NVIDIA H100GPU的低延迟。

图片

给模型插入「外接大脑」

从智能体的构建中我们不难看到,所有基于大模型搭建好的应用,想要获取实时数据,都需要建立在检索增强生成(RAG)之上。

而这一技术是向量数据库能够在AI应用中发挥重要作用的根本。

为什么这样说?那就得看看,检索增强生成能实现什么。

比如,当你问ChatGPT「芭比」电影好看吗?

图片

显然,ChatGPT是无法及时回复最新的相关信息。这对于企业来讲,用户咨询最新内容时,应用无法做出回应,大大降低了生产力。

有了检索增强生成,便能够补充特定领域的知识。大模型参数虽大,但无法记住许多长尾数据,还需要通过搜索召回相关领域的知识。

这里,对专业领域知识的补充就离不开,向量数据库、搜索引擎等。

图片

另一方面,大模型的知识很容易过时,仅靠微调模型,让知识更新是行不通的。

微调模型需要耗费大量算力、时间,关键是天天微调根本不现实。

要知道,对于企业来讲,业务数据必须是实时的。因此向量数据库、搜索引擎都能够帮助模型,获得新数据,同时重训模型周期也被拉长。

由于向量数据库对「高维嵌入」有强大的检索能力,与大模型结合较为简单,因此成为RAG最常用的数据存储形式。

图片

微软Build大会上,曾介绍了其产品如何将较少的上下文感知LLM与向量搜索结合起来,来创造更有吸引力的体验。

这其中基本的想法,也就是在LLM中,添加向量搜索,以进行检索增强生成。

而向量化,就是将数据转化为维度,如下你可以看到两种维度:大小,和类型。

其中大小有两个值(大和小),类型有2个值(树和动物)。这只是一个概念例子,还可以扩展到更多的值。

图片

除了图片,还可以进行单词/句子向量搜索,向量搜索能够捕捉到语义表示。

假设你有数百个,甚至数万个文档数据库作为背景,是无法放在ChatGPT提示框中,但可以通过向量搜索来缩小最有可能的包含答案的上下文。

图片

对于数据库,既可以储存文档和嵌入,也可以用来存储查询,并根据相关查询来找到最相关文档,这样就可以通过⽂档检索增强LLM。

今年英伟达GTC大会上,黄仁勋首提向量数据库,并推出了新库RAFT,用于加速索引、数据加载和近邻检索。

其重要意义在于,向量数据库是大模型的「海马体」,能够让LLM实时进行信息召回。

通过把实时资讯、市场行情等实时变化的信息置入模型中,就能使其提供更精准的结果。

Amazon OpenSearch Serverless向量引擎

同样在亚马逊云科技峰会上,首次推出了——Amazon OpenSearch Serverless向量引擎。

开发者们通过这个工具,就可以轻松使用向量数据库,快速构建基于大模型的搜索体验。

图片

总的来说,Amazon OpenSearch Serverless向量引擎引入了简单、可扩展和高性能的向量存储和搜索功能。

抖音雪雪雪

开发者可以快速存储和查询各种ML模型(包括Amazon BedRock提供的模型)生成的数十亿个向量嵌入,响应时间仅为毫秒级。

当前,生成式AI大爆发,所有垂直领域的企业都在转向这一热潮,并探索通过集成高级对话生成AI应用程序,以改变用户体验,以及和数字平台交互的方法。

亚马逊云科技推出的这项工具,通过使用向量嵌入,能够增强ML搜索和生成式AI。

向量嵌入在用户私有数据上进行训练,并能表示信息的语义和上下文属性。

这样做的优势在于,能够及时处理用户的查询,以查找最接近的向量,并将其与其他元数据组合在一起,进而无需依赖外部数据源或其他应用程序代码集成结果。

值得一提的是,向量引擎是基于Amazon OpenSearch Serverless构建,因此无需担心后端基础架构的大小、调整和扩展。

联发科今年会不会推出新芯片

所有数据都持久保存在Amazon Simple Storage Service (Amazon S3) 中。

当向量数量从原型开发时的几千个增长到生产时的上亿个甚至更多,向量引擎将无缝扩展,无需重新索引或重新加载数据来扩展基础架构。

图片

此外,向量引擎还为索引和搜索工作负载提供独立计算,因此开发者可以实时无缝地摄取、更新和删除向量,同时确保用户体验不受查询性能的影响。

借助对Amazon OpenSearch Serverless的向量引擎支持,开发人员将拥有一个简单、可扩展和高性能的解决方案,来构建机器学习增强的搜索体验和生成性人工智能应用程序,而无需管理向量数据库基础设施。

全球生成式AI领导者

随着数据量大爆发、可高度扩展算力的可用性、以及机器学习技术的进步,让生成式AI足以改变每个行业。

因此,越来越多的企业希望快速采用最新技术,创造价值。

选择正确的模型,使用公司数据安全定制模型,并将其集成到应用程序中是一个复杂的过程,都需要花费大量时间、和高度专业化的知识。

恰恰,亚马逊云科技Amazon Bedrock简化了这一流程,通过简单的API访问一流的基础模型。

通过Amazon Bedrock Agents这一完全托管的服务,开发者能够轻松创建基于生成式AI的应用程序,以完成各种用例的复杂任务。

其中Vector Database,能够帮助开发者的应用程序实时存储数据,及时召回信息,提供更好的用户体验。

Amazon EC2P5实例更是为模型训练节省大量时间和算力。

基于以上的创新,真正诠释了亚马逊云科技是端到端的生成式AI领导者,帮助企业开发者释放生成式AI的潜力,创造价值。

同时,亚马逊云科技不断降低生成式AI的门槛,更是致力于GenAI普惠的领导者。

前段时间,亚马逊云科技刚刚宣布了编程助手Amazon CodeWhisperer可用,能够使用底层基础模型帮助开发人员提高工作效率。

它可以根据开发人员使用自然语言留下的注释和IDE(集成开发环境)中的历史代码实时生成代码建议。

这次,Amazon CodeWhisperer首次与Amazon Glue Studio Notebooks实现集成,能够帮助用户优化使用体验,提高开发效率。

图片

通过Amazon Glue Studio Notebooks,开发人员用特定语言来编写任务,然后Amazon CodeWhisperer会推荐一个或多个可以完成此任务的代码片段。

Amazon CodeWhisperer针对最常用的API进行了优化,例如Amazon Lambda或Amazon Simple Storage Service(Amazon S3),使其成为构建应用程序开发者们的绝佳编码伴侣。

除此之外,亚马逊云科技还提供了7门免费的技能培训课程,帮助开发者以使用生成式AI。

国产化gpu现状及展望

其中,还联手吴恩达推出了「用大型语言模型构建生成式AI」新课程。

图片

医疗领域已有落地应用

今年这波AI大模型的浪潮,也激发了人们对生成式AI在医疗行业的应用的探索。

比如前几天,谷歌发布了一个「通才生物医学AI」——Med-PaLM M多模态模型。这个多模态生成模型能够利用医学的丰富数据,使用相同的模型权重集解释临床语言、医学图像和基因组学。

图片

同样,对于AI在医疗行业的应用,亚马逊云科技也同样有所行动,发布了一款面向医疗保健软件提供商的全新服务——Amazon HealthScribe。

Amazon HealthScribe通过使用使用生成式AI的机器学习模型和语音识别,能自动起草临床文档,帮助临床医生转录和分析他们与患者的对话。

它的自然语言处理功能,还可以从对话中提取复杂的医学术语,比如药物和医学状况。病史、要点、就诊原因,一应俱全。

Amazon HealthScribe中的AI功能,正是由Amazon Bedrock提供支持的,通过预训练模型,用户就可以从初创公司以及亚马逊自身构建生成式AI了。

图片

可以说,作为全球云计算的开创者,亚马逊云科技看到了AI浪潮当下,生成式人工智能的潜力和重要性。

生成式AI能够有改变每一个应用程序、每一个业务、甚至每一个行业。

数据处理、算力和机器学习的进步,正在加速许多企业从实验到部署的转变。

通过提供Amazon Bedrock等服务,以及与行业领导者的合作,这家公司正在普及对生成性人工智能的访问。

在不断创新的基础上,亚马逊云科技正在让开发者,让世界重新构想体验,把最好的产品带入生活。


返回网站首页

本文评论
比特币跌破19000美元_比特币跌破33000美元
9月 19日讯:截至发稿,比特币单枚价格跌破19000美元,大跌7.87%,暂报18478美元,价格创下了近两年来新低。当贝电视盒子黑屏...
日期:09-21
天猫平台获超1000万名会员数品牌已超40家_天猫过亿品牌
10月8日 消息:数据显示,在天猫获得超过1000万名会员的品牌已超过40家。2021年4月,天猫计划未来一年孵化40家会员数达1000万的品牌,当前目标已超额完成。三星QD OLED天猫公布的...
日期:10-09
双11去哪儿联合多家航空公司上线机票“次卡”「双十一飞机票」
11 月 8 日消息,双 11 活动开启,在线旅游平台去哪儿联合多家航空公司推出“次卡”,旅客可享受低价出行。除了北京-上海、北京-广州、深圳-成都、杭州-重庆等热门航线全覆盖外,也...
日期:11-15
高通被判违反垄断法 将改变全球智能手机格局_高通反垄断案的影响
  在赢得了与苹果专利纠纷胜利刚满一个月后,高通便收到了一纸败诉,受此影响,高通美股盘前股价暴跌12%。   据《华尔街日报》5月22日报道,美国加州圣何塞北区联邦法官在当...
日期:12-17
美国大学生追踪马斯克飞机推特帐号被封禁 博主大骂马斯克是“彻头彻尾的伪君子”
12月15日消息,美国大学生威尼因在推特创立机器人帐号追踪亿万富豪马斯克(Elon Musk)等名人的私人飞机动向,成为网络名人。但推特最近暂停了这一帐号。在得知自己的@Elonjet帐号...
日期:12-15
即信云通信参加农信高峰年会 助力打造智能融合新金融
  日前,第十五届中国农村金融机构信息化发展战略高峰年会在贵州贵阳顺利举行。即信云通信行业方案部产品总监朱敏出席会议,并与中国银行保险业监督管理委员会贵州监管局、...
日期:06-17
世纪睿科内部调整「世纪睿科宣布收购交个朋友!网友:老罗不讲两句么?」
快科技5月10日消息,今天下午,杭州世纪睿科控股有限公司发布公告,宣布完成了对交个朋友公司的全资收购。华为p58e跑分win716g内存这意味着,世纪睿科目前已经拥有了交个朋友”的核...
日期:05-11
服务人的「奥斯卡盛典」丨2023第四届班牛智服未来大会 来了!「牛班官网」
「进化·共生丨 2023 第四届班牛智服未来大会」将于 8 月 11 日在杭州重磅登场。班牛智服未来大会是由面向品牌商为消费者提供智能和个性化服务的数智化OS——班牛主办的一...
日期:06-30
贝壳找房IPO最新招股书显示:第二季度净利润16.1亿元_贝壳找房招股说明书
  北京时间7月24日晚,贝壳找房IPO正式开启,贝壳向美国证券交易委员会(SEC)提交了招股书。   8月8日凌晨贝壳找房再次向美国SEC更新招股书,公布发行区间为17美元到19美...
日期:07-15
高盛更新条款暗示Apple Card储蓄账户功能即将上线
  IT之家12月3日消息,高盛(GoldmanSachs)本周更新了AppleCard客户协议,修改的条款主要涉及即将推出的DailyCash储蓄账户功能。该功能原定随iOS16.1更新上线,但由于某些原因而推...
日期:12-12
亨通光电发布ESG报告,向全球证明可持续发展的承诺
亨通光电发布ESG报告,向全球证明可持续发展的承诺 通信产业网|2023-06-08 22:22:24作者:通文来源:通信产业网【通信产业网讯】6月5日,中国国际信息通信展览会(PT展)期间,亨通光电举...
日期:06-09
2022世界人工智能大会开幕,比邻星球邀您共建社交元宇宙_未来智能世界
2022 世界人工智能大会(WAIC2022)于 9 月 1 日- 3 日在上海举行,元宇宙作为虚实融合的下一代互联技术,成为本届大会的“硬核”亮点之一。比邻星球受邀参加本届大会,带来AI虚拟...
日期:09-11
苹果放弃今年增新款iPhone产量计划「苹果今年产量如何」
据彭博社报道,由于预期需求激增未能实现,因而苹果公司放弃了今年增加新款iPhone产量的计划。此前,天风国际分析师郭明錤表示,苹果已要求鸿海富士康将iPhone 14的生产线切换到iPh...
日期:09-29
小米13同规格!moto X40支持IP68防尘防水:总经理亲自潜水测试
昨晚,小米13系列已经正式发布,不仅标配第二代骁龙8,还同样全系标配了IP68防尘防水,是除了苹果第一个这么做的厂商。不过,第二家可能很快就要出现了。moto X40将在12月15日(本周四)...
日期:12-12
苹果6s现在价格「苹果6s价格二手价格」
苹果6s是苹果公司于2015年9月发布的一款手机,该产品一直备受推崇,被誉为2015年最成功的手机之一。目前,苹果6s已经作为一款老旧手机被淘汰,价格也随之下降。苹果6s现在的价格因...
日期:05-31
美国spacex发射火箭成功意味着什么_SpaceX正在大肆招聘 准备把加州发射火箭的数量增加一倍
SpaceX正计划大幅提高其从美国西海岸发射火箭的频率,这一信息来自于SpaceX的猎鹰9号运营经理为该公司在西海岸发射设施招募新员工的广告。SpaceX从三个地点发射任务,其中两个...
日期:08-23
火红色发型「专为魅友定制!魅族宣布QQ音乐Flyme版来了:今日上架」
此前,魅族曾宣布,将与QQ音乐达成合作,推出QQ音乐Flyme版。今天,Flyme官方账号宣布,QQ音乐Flyme版现已上架魅族应用商店,各位用户可以前往下载体验。贤济联盟互联网经济发展的意义...
日期:01-16
网易王诗沐加入腾讯「前腾讯新闻负责人王诗沐将加入百度?百度:尚无定论」
  相关新闻:消息称腾讯新闻前负责人王诗沐离职,将加盟百度担任AI产品总经理三星note20ultra是4k吗共享电动滑板车 bird  讯 8月16日下午消息,今日,有媒体报道称腾讯新闻前负...
日期:10-06
软通动力:打造新基建时代的“数字生态英雄”
  近日,以“新基建、新生态、新未来”为主题的中国数字生态英雄会举行。这场旨在打造国内数字生态领域厂商、方案商和创新企业汇聚的行业领袖思想盛会,聚集了当下中国数...
日期:07-14
爱奇艺10月1日起增设会员拉新分账、取消平台定级「爱奇艺新用户连续包月怎么取消」
  9月28日,爱奇艺宣布,10月1日起,爱奇艺剧集、动漫、儿童、纪录片领域将正式应用全新分账合作模式。新模式将在原会员观看时长分账基础上,增加会员拉新分账。同时,取消平台对内...
日期:09-29