您的位置:首页 > 互联网

微软亚研院新作:让大模型一口气调用数百万个API!_微软模型2020

发布时间:2024-03-28 22:11:12  来源:互联网     背景:

声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:金磊,授权转载发布。

近年来,人工智能发展迅速,尤其是像ChatGPT这样的基础大模型,在对话、上下文理解和代码生成等方面表现出色,能够为多种任务提供解决方案。

但在特定领域任务上,由于专业数据的缺乏和可能的计算错误,它们的表现并不理想。同时,虽然已有一些专门针对特定任务的AI模型和系统表现良好,但它们往往不易与基础大模型集成。

为了解决这些重要问题,TaskMatrix.AI破茧而出、应运而生,这是由微软(Microsoft)设计发布的新型AI生态系统。

其核心技术近期在《科学》合作期刊Intelligent Computing上发表的论文TaskMatrix.AI: Completing Tasks by Connecting Foundation Models with Millions of APIs中正式亮相,作者为微软亚洲研究院的段楠博士团队:

(详见链接:https://spj.science.org/doi/10.34133/icomputing.0063)

TaskMatrix.AI将基础大模型与数以百万计的应用程序编程接口(APIs)连接起来完成任务。

其核心思想是利用现有的基础大模型作为类似大脑的中央系统,结合其他AI模型和系统的APIs作为各种子任务解决者,以完成数字和物理领域的多样化任务。

微软亚洲研究院首席研究员

图源备注:图片由AI生成,图片授权服务商Midjourney

TaskMatrix.AI如何工作?

大疆农业发布植保无人机T20,农田果林成其新“战场”

TaskMatrix.AI的整体架构由以下四个关键组件构成:

  • 多模态对话基础模型(MCFM):负责与用户沟通,理解他们的目标和上下文(多模态),并基于API生成可执行代码以完成特定任务。MCFM能够处理文本、图像、视频、音频和代码等多模态输入,生成执行特定任务的代码。它还能够从用户指令中提取具体任务,并提出合理的解决方案大纲,帮助选择最合适的API进行代码生成。

  • API平台:提供一个统一的API文档架构,用于存储数以百万计具有不同功能的API,并允许API开发者和所有者注册、更新和删除他们的API。API平台通过统一的文档架构帮助MCFM更好地理解和利用各种API。

  • API选择器:根据MCFM对用户指令的理解,推荐相关的API。API选择器具备搜索能力,能够在拥有大量API的平台上快速定位到与任务需求和解决方案大纲相匹配的API。

  • API执行器:通过调用相关API执行生成的动作代码,并返回中间和最终的执行结果。API执行器设计用于运行各种API,包括从简单的HTTP请求到复杂的算法或需要多个输入参数的AI模型。

以上四个组件协同工作,共同构建了一个高效的系统。MCFM作为用户交互的主要接口,负责生成解决方案。API平台则提供了一个标准化的API文档格式,并作为一个集中存储库,容纳了数百万API。API选择器根据MCFM对用户需求的理解,从API平台中选取合适的API。

最后,API执行器负责执行由选定API生成的代码,并解决任务。

2022年组装电脑最佳配置清单

此外,TaskMatrix.AI还提供了两个可学习的机制,以更有效地将MCFM与API对齐:

  • 基于人类反馈的强化学习(RLHF):这是一种基础大模型的通用技术,它使用强化学习方法,利用人类反馈来优化机器学习模型。在TaskMatrix.AI中,RLHF利用这些反馈来增强MCFM和API选择器,从而在处理复杂任务时实现更快的收敛和更好的性能。

  • 向API开发者提供反馈:TaskMatrix.AI完成任务后,会将用户反馈以适当的方式传递给API开发者,指示他们的API是否成功用于完成任务。这种包含<用户指令、API调用和用户反馈>的三元组不仅展示特定API的使用情况,还可以作为API开发者改进API文档的参考,使文档对MCFM和API选择器更加友好和易于理解。

因此,TaskMatrix.AI可以被视为一个超级AI,同时也是一个生态系统,具有以下关键优势:

  • 能够通过使用基础大模型作为核心系统,首先理解不同类型的多模态输入(如文本、图像、视频、音频和代码),然后生成调用API完成任务的代码,来执行各种数字和物理任务。

  • 拥有一个API平台,作为各种任务专家的存储库。该平台上的所有API都有一致的文档格式,这使得基础大模型可以轻松使用它们,开发者也便于添加新的API。

  • 具有强大的终身学习能力,因为它的技能可以通过向API平台添加具有特定功能的新API来扩展,以处理新任务。

  • 能够提供更加可解释的响应,因为任务解决逻辑(即行动代码)和API的结果都是可理解的。

TaskMatrix.AI能完成什么任务?

TaskMatrix.AI能完成的任务非常广泛,小到文字、图像信息的基本信息处理,大到控制机器人平台、接入物联网(IoT)等通用平台任务,TaskMatrix都能胜任。

图像处理任务

TaskMatrix.AI可以执行图像处理任务,并且能够接受语言和图像作为输入。下图展示了TaskMatrix.AI的相关版本Visual ChatGPT,它不仅能够理解人类意图,还能处理语言和图像输入,以完成包括图像生成、问题回答和编辑在内的复杂视觉任务。

下图展示了使用多个API协作生成高分辨率图像的示例。在该例中,解决方案框架由3个API组成:图像问答、图像标题以及图像对象替换。

左侧框线部分展示了解决方案框架如何协助将图像扩展至2048×4096分辨率。通过迭代执行框架中的预定义步骤,TaskMatrix.AI可以生成任何所需尺寸的高分辨率图像。

办公自动化

TaskMatrix.AI能够通过语音指令理解并自动执行计算机操作系统、专业软件以及智能手机应用的操作。利用TaskMatrix.AI,可以快速上手复杂软件。

此外,它还能帮助用户在不进行搜索的情况下直接访问所需功能。以下是一个PowerPoint自动化的实例,TaskMatrix.AI能够根据用户指定的主题自动生成幻灯片,智能调整内容布局,插入和优化图像,并应用相应的设计主题,从而显著提升工作效率。

机器人和物联网设备控制

TaskMatrix.AI 可以连接机器人和物联网设备,实现对体力劳动和智能家居操作的自动化管理。通过集成先进的机器人技术,TaskMatrix.AI 能够执行一系列任务,如物体的拾取与放置以及对家庭物联网设备的智能控制。

此外,该平台还整合了多种流行的互联网服务,包括但不限于日历API、天气API和新闻API,提供了更加丰富和便捷的用户体验。

TaskMatrix.AI的挑战

尽管TaskMatrix.AI已经在各种任务中证明了其强大的功能和通用性,但仍面临以下几个挑战:

  • 多模态会话基础大模型:TaskMatrix.AI需要一个能够处理多种输入(文本、图像、视频、音频和代码)的强大基础大模型。这个模型需要能够从上下文中学习,使用常识进行推理和计划,并生成高质量的代码来完成任务。此外由于TaskMatrix.AI需要处理更多样化的输入模式,这要求确定一个最小模式集来训练MCFM。

  • API平台:构建和维护一个包含数百万API的平台需要解决文档生成、API质量保证和API创建建议等挑战。API文档的清晰性和API的质量对于TaskMatrix.AI的成功至关重要。此外,平台还需要根据用户反馈指导API开发者创建新的API来解决特定任务。

  • API调用:在处理大量API时,TaskMatrix.AI需要能够合理选择和推荐相关的API来完成任务。此外还涉及到在线规划,即在无法立即生成解决方案时,与用户交互并尝试不同的解决方案。

  • 安全和隐私:在API能够访问物理和数字世界时,确保模型忠实于用户指令并保持数据私密性是至关重要的。这要求在执行操作前验证模型的行为,并确保数据传输的安全性和数据访问的授权。

  • 个性化:TaskMatrix.AI需要个性化策略来帮助开发者构建定制的AI界面,并为用户提供私人助理。这包括降低扩展成本和使用少量示例来学习用户的偏好,以便生成符合用户需求的解决方案。


返回网站首页

本文评论
免费!开源Windows系统发布新版:添加大量实用功能(开源软件windows)
  开源Windows系统,听说过吗?   实际上,从1996年起,ReactOS项目就启动了,目的在于通过开源、免费的方式重建Windows NT内核以及系统层,日前,ReactOS 0.4.14发布下载。   ...
日期:06-04
以太币市值将挑战比特币 市场份额已上升至20.5%「比特币以太币行情」
9月14日 消息:加密货币市场要变天?据报道,以太坊正在推进一项非常重要的“合并”软件升级。如果开发者未来几天内完成升级,以太坊区块链的能源消耗将大幅降低。报道称,合并后,以...
日期:09-17
华为发布全屋智能3.0:智能五高全面升级_华为全屋智能家居解决方案
今年7月份华为推出了全屋智能2.0,11月2日的发布会上,华为又推出全屋智能3.0,全屋的智能体验再上一层楼,从之前的功能化、美化进入到了空间3.0时代,更加智能化。据华为介绍,全屋智...
日期:11-12
AI图像高清修复工具SUPIR 可根据文本提示智能修复_ai修复1080p
要点:怎么护理卷发不毛糙1、SUPIR通过增加模型的规模提升图像修复的能力,能够根据文本提示进行智能修复。2、SUPIR的主要功能包括图像修复和文本引导的修复,使用了模型放大、...
日期:01-26
Redmi发布210W机型 手机充电进入个位数时代_redmi移动电源20000
中关村在线消息:今日,一则"手机充电进入个位数时代"冲到了热搜第一名,昨晚Redmi发布了搭载210W神仙秒冲技术的Redmi Note 12探索版,最快9分钟就能充满手机电量,210W也是目前地球...
日期:11-01
双十一智能电视人气榜单大合集!当贝市场为你倾力推荐_双11电视推荐
  双十一又来了,相信不少朋友已经看准这个时机,准备买买买了!对于想要购买智能电视的用户来说,选择什么样的电视又是一大难题,今天就让当贝小编跟你一起看看双十一哪些电视值...
日期:02-03
含低码高清等能力 声网发布“实时高清·超级画质”解决方案
【】7月26日消息,随着硬件设备的持续迭代和网络基础设施的发展,互联网用户对于使用体验流畅、视觉效果更惊艳的 FHD 及 4K 高清画质的需求也随之增长。根据公开资料显示,爱优腾...
日期:09-19
Midjourney v6版本describe功能上线 生成的提示词更长更详细
3月8日 消息:Midjourney v6版本的 /describe 已经上线,上传图片后会生成更长更详细的提示词,同时更符合 V6模型的倾向。这意味着用户现在可以更加轻松地获取关于上传的图片的...
日期:03-08
权威认可!深信服超融合、信服云托管云获2021-2021年度可信云“最佳实践”
  2022年7月21-22日,由中国信息通信研究院(以下简称“中国信通院”)、中国通信标准化协会主办的“2022可信云大会”在北京举行。大会公布信服云托管云通过《可信云·托管...
日期:07-31
沙尘暴肆虐 美国一州际公路发生连环车祸:至少40车相撞、多人死亡
5月2日消息,据央视网报道,当地时间5月1日,美国伊利诺伊州南部55号州际公路因严重尘暴天气发生连环车祸,共约40至60辆汽车相撞,造成至少6人死亡,超过30人受伤。iphone12怎么买比较...
日期:05-02
终究还是打嘴炮!马斯克、扎克伯格笼中决斗黄了_马克-扎克伯格
快科技9月27日消息,马斯克和扎克伯格的笼中决斗怕是要成为泡影了,最终双方也是过过嘴瘾,让全世界看热闹的人看了个预热罢了。近日,扎克伯格接受采访时表示:与马斯克的笼斗不会发...
日期:09-28
扫描发展十年:拥抱新技术、发掘新功能,合合信息扫描全能王AI赋能亿万用户
日前,新华社发布《中国扫描十年发展图鉴》(简称《图鉴》),对扫描设备、技术、应用领域的发展历史进行了深入盘点。《图鉴》显示, 2013 到 2023 年的十年间,扫描技术在中国普及率...
日期:10-30
但对移民火星不感兴趣 OpenAI-CEO,马斯克教会我投资科技领域
5月25日消息,当地时间周四,人工智能研究公司 OpenAI 联合创始人兼首席执行官萨姆・奥特曼(Sam Altman)在伦敦大学学院发表演讲,谈到了他与埃隆・马斯克(Elon Musk)的关系。奥特曼非...
日期:09-27
“骁龙 8 Gen 2 for Galaxy”芯片曝光「骁龙8cx gen3」
IT之家 1 月 28 日消息,三星和高通预计已达成协议,即将推出的 Galaxy S23 系列将采用独家定制芯片,其官方名称为“Qualcomm Snapdragon 8 Gen 2 Mobile Platform for Galaxy”...
日期:01-28
诺基亚推出新手机!或为X系列「诺基亚 新机」
近日,诺基亚似乎将重心从高端智能手机市场转向了低价和功能手机市场。据诺基亚印度发布的预告视频,诺基亚将在9月6日在印度推出一款5G手机。目前,这款手机的具体型号尚未公布,但...
日期:09-04
一张嘴带货千万,快来直接套用美妆爆单必备话术!「口红带货话术」
声明:本文来自于微信公众号 蝉妈妈(ID:cmmshuju),作者:蝉妈妈,授权转载发布。据《蝉妈妈2021抖音直播电商分析报告》显示,美妆护肤成为2021年全平台销量最高的五大品类之一。作为...
日期:10-02
上百度约核酸立减6元,便捷更省钱
  临近春节,越来越多的“打工人”开始计划返乡。但很多人由于工作忙等原因无暇顾及研究核酸检测流程,急匆匆赶到医院,结果发现没预约做不了。别急,这里有一份核酸检测攻略,手...
日期:07-16
刷新游戏新体验|联想拯救者R27q电竞显示器重磅来袭_拯救者r7000显示器是什么的
不知不觉一年一度的双 11 购物节又要到了,各大电商平台都推出优惠活动,对于游戏爱好者来讲,无疑是一个入手心仪电子产品的好时期!那么有哪些电竞单品值得入手呢?对于想购入电竞显...
日期:10-31
充电宝界“焊门员”来了!CUKTECH酷态科10号天猫开售_酷客充电宝
10月13日,小米生态链品牌CUKTECH酷态科发布旗下数字系列的第四款旗舰级充电宝产品——10号超 级电能棒。沿袭小米系的一贯传统,此次的酷态科10号性价比拉满。10000mAh容量、TF...
日期:10-15
华为发布全新25万级问界M7_问界m5最新消息
9月12日 消息:AITO问界新M7系列车型今日正式上市,AITO问界新M7系列共推出五座、六座共五款车型,售价区间为24.98万元-32.98万元。新车具备宽敞的车内空间和出色的动力表现,同时...
日期:09-12