您的位置:首页 > 互联网

智能体是什么「被AI大牛押注的智能体,国内发展得怎样了?」

发布时间:2023-08-03 12:46:18  来源:互联网     背景:

声明:本文来自于微信公众号 AI新智能(ID:alpAIworks),作者:举大名耳,授权转载发布。

前段时间,前特斯拉总监、OpenAI大牛Karpathy的一句话,引起了业内的关注。

在7月初的一次开发者大会上,Karpathy声称:“我被自动驾驶分了心,AI智能体才是未来!”并表示将来会全力投入对智能体的研发工作中。

ai智能量体

其实,早在2016年,当Karpathy开始在OpenAI工作时,就已经锚定了智能体的方向,只是由于当时的研究方法还不成熟,所以Karpathy才转去做了自动驾驶。

那么,这所谓的“智能体”究竟是什么?为什么会让这位AI大牛长久地念念不忘?

如果用一句话来回答这个问题,我们可以说:

智能体的出现,不仅是AI发展的下一个方向,也是其真正走进人类生活的开始。

redmi各个系列定位

1

何谓智能体

到底什么是智能体?

如果我们将现在的生成式AI,比作一个人的话,那么它只具有了大脑(大语言模型),但却没有身体,因此只能躺在服务器上,做一些处理文字、生成图片的工作。

智能体,就相当于是大模型的“身体”,有了它,大模型才能在更多的领域施展身手。

那智能体究竟能做什么?

最近,一个名叫Fable的初创公司,发布了一个节目统筹智能体(Showrunner),如同一声惊雷炸响,让人们再次见证了智能体的强大。

ai智能量体

通过这样的智能体,Fable制作出了一集完全用AI拍摄的《南方公园》!

从编剧、动画、导演、语音、编辑……到剧集制作的全流程,都是由AI完成。

在整个制作环节中,通过自然语言,给不同的智能体分配了各自的目标,人类导演只需要给出一个高层次的构思提示(标题、概要、事件),这些AI智能体就会开始「自导自演」。

之后,人类几乎就不用进行任何干涉了!

智能体技术

在制作过程中,不同的AI智能体,担任了不同的角色,如演员、导演、剪辑等,它们彼此分工合作,互相配合,最终完成了整部影片的制作。

而同样的,类似的案例,也出现在前段时间清华团队的研究中。

7月19日,清华团队用ChatGPT打造了个零人工含量的“游戏公司”——ChatDev,只要你提出想法,从设计到测试的完整流程,都由AI帮忙搞定。

ai智能体育

Fable与制作《南方公园》的思路类似,在游戏开发的环节中,ChatDev的十多个智能体也分别担任了这个“公司”中的策划、程序员、设计师等不同的岗位。

在项目开始时,人类可以对这些AI提出一个大概的想法或创意。

之后,各个智能体之间就会进行一系列讨论、制作、测试的环节,整个过程完全不需要人类的参与全是自动进行的。

ai智能量体

由此可见,有了智能体之后,大模型就能根据人类给出的规则和策略来做出决策,而不需要人类的干预或指令。

在这个过程中,智能体还会通过习得的经验或知识,来改善自己的性能和适应性,并根据目标函数或奖励函数来评估自己的行为。

而这样的能力,是以往的大模型(LLM)无论如何都不具备的。

因此,LLM即使再聪明,也是一个没有身体的“大脑”,而正是智能体的出现,让LLM有了行动的能力,有了自主完成复杂任务的能力。

而这样的能力,正是LLM下一阶段进行在应用层面进行落地的关键。

2

国内智能体进展

既然智能体这么重要,那国内在这方面发展得怎样了呢?

在今年的2023世界人工智能大会上,联汇科技发布了基于大模型自主智能体(Auto AI Agent )——OmBot 欧姆智能体,并针对典型场景需求,推出了首批应用。

ei智能体

要想打造一个真正的智能体,最关键的地方,就在于让AI不依赖人类来指导命令,能够根据任务目标,主动完成任务。

而要想实现这点,就必须让AI具备认知、记忆、思考、行动等几大核心能力,使之能够感知环境、自主决策,并且模仿人类大脑工作机制。

在这方面,联汇科技多年的研究成果——欧姆大模型3.0,成为了孕育OmBot 欧姆智能体的摇篮。

智能体是什么

欧姆大模型3.0培养智能体的思路是:在智能体的诸多能力中,认知和思考能力是最关键的。

而要锻炼这样的能力,就要通过大量的开放识别、视觉问答等训练方式,来让智能体从被动的识别转为主动推理,并自主提出解决方案。

例如通过让智能体观看不同的图片、视频,并让其通过语义去理解和描述其中的目标。

ai智能体验

而之所以要选择开放识别、视觉问答为主的训练方式,是因为在各个行业中,都存在着大量的特定场景和任务,需要对视频中的内容进行精准的识别、分析。

但这些场景和任务,往往是非常细分和多样化的,难以用通用的模型和方法来满足,于是就造成了各行各业对智能识别的大量长尾需求。

在对这些视觉信息进行分析的过程中,欧姆大模型会通过多轮对话推理的机制,将图像、视频、以及相关的问题或反馈等输入转换为特征向量,并存储在一个记忆单元中,

之后,大模型的解码器就会负责根据记忆单元中的特征向量生成最终的回复。

智能体的案例

在对一张张图片,一段段视频的对话问答中,欧姆大模型会将视觉模型和语言模型进行细粒度的对齐,让其可以理解人类指令,并合理作答。

那么,这些经过了不同行业视觉数据历练的智能体,后来怎样了?能在实际场景中展现实力了吗?

iphone12 5699元

目前,欧姆智能体的主要应用场景,大致分为三类:智慧店长、文档处理、视频剪辑。

如果说,智能体最重要的能力是其是否具备自主分析、决策的能力,那么我们不妨将欧姆智能体在这三大场景中的表现,与传统手段进行对比,看看其是否具有了真正意义上的智能体的特征。

3

解决“落地焦虑”

简单来说,智慧店长主要就是通过与摄像头视觉信息结合,利用欧姆大模型智能识别店内发生的一切。

在这方面,传统的摄像头只能提供视频监控的功能,无法对视频画面进行智能分析、处理、交互和反馈。

而具备了智能体后,智慧店长就能通过与摄像头视觉信息结合,识别店内发生的一切,并自主决策提示交互信息。

例如实时监测和分析客流量、客户特征等数据,遇到突发情况时,还看自动报警和处置店内的安全隐患。

智能体的案例

在文档处理方面,按照联汇科技的说法,欧姆智能体最大的优势,是可以将专业知识有效集成到向量数据库,并存储记忆,形成专业机器人。

而一个具备了智能体的大模型,与传统的行业垂直类大模型相比,最独特的优势,是其持续学习和适应能力,而非依赖于静态的数据集。

vivox21uda屏幕指纹版

在这方面,只能说欧姆智能体具备了其持续学习的基础。

智能体是什么

因为向量数据库与传统数据库相比,采用灵活的数据结构,如多模态的数据支持,而将不同结构的知识进行整合,正是持续学习的基础。

但其是否真的具备这样的持续学习能力,也许还要进行长时间的观察。

而在视频剪辑方面,AIGC 小欧可以成为媒体、文化、游戏等行业的剪辑助手。通过 AIGC 实现媒体视频素材的一键成片。

可以说,这是智能体能力体现得最直接的一个方面,通过语言理解能力,智能体在剪辑过程中,可以自动依据文案内容,对不同镜头添加更加细节的视频镜头描述,从而省去了人工制作视频中,繁琐的文字与镜头之间的匹配工作。

从上述几点来看,欧姆智能体确实具备了一定的智能体特征,然而,即便如此,在其商业化落地的过程中,仍然会面临不少挑战。

从目前欧姆智能体的落地方向上来看,其本质上走的还是一种“松耦合”的技术路线。

所谓的“松耦合”,简单来说,不同任务分解,通过不同智能体来完成,最后通过大模型来完成自动化调度和协作。

比如语言大模型来学习对话、视觉大模型来识别地图。

这类智能体,虽然从不像人一样有综合智能,但从成本和可行性上,却能更快落地。

然而,这样的“松耦合”路线,由于技术壁垒并不高,在竞争中很容易遭到同类型智能体的挤压,进而导致毛利率不断下降,以至于技术红利很快走到尽头。

到了那时,一种端到端的,一个大模型就能包办所有的“紧耦合”路线,就会成为行业共同的期盼。

但这样一种集合了多种智能,能适应各种任务的智能体,必定蕴含了更多技术含量颇高的“硬科技”,而国内团队是否能一一攻破这些难关,仍是个未知数。


返回网站首页

本文评论
名创优品国外店铺分布「名创优品法国里昂首店开业 海外门店达2000家」
10 月 8 日消息,近日,名创优品位于法国里昂大都会圣热尼拉瓦勒的门店开业,标志着名创优品累计在海外市场门店总数突破 2000 家。 2022 财年名创优品营收100. 86 亿元,同比增长11...
日期:10-12
刚考科目二就买车开400公里高速 司机:我技术算不错的「科目二600公里」
5月13日,莆炎高速江西广昌西服务区,一名无证驾驶的男子被查获。经查,该男子在福建买了一辆二手车,但他刚考过科目二,本来想等朋友把车开回,但临时有事,觉得自己的驾驶技术还可以,便...
日期:05-30
百度公布文心一言的邀请测试方案
3月16日 消息:今日,百度在北京召开文心一言新闻发布会,百度创始人、董事长兼首席执行官李彦宏和百度首席技术官王海峰共同出席并现场展示了文心一言在文学创作、商业文案创作...
日期:03-16
ai绘画作品「“我,靠AI绘画月入过万”」
声明:本文来自于微信公众号 鞭牛士(ID:bianews8),作者:顾砚,授权转载发布。“看到ai画图流行了之后挺多画手朋友抵触情绪还蛮强的……画画这玩意不一直是谁画的好就学谁么?ai画...
日期:10-16
从售前到售后,得物(毒)APP让你购物无忧(得物是不是毒app)
  得物(毒)APP,一个常年占据AppStore排行榜前五十,稳居分类榜第一潮流APP,凭借其严格品控,坚持正品被众人所熟知,成为了年轻人最喜欢的新一代潮流网购社区之一。   在得物(...
日期:11-23
阿里88会员节将至(阿里88会员节优惠会大吗)
  (原标题:2019阿里88会员节满减规则内容 购物津贴怎么使用说明)   马上就是2019年的八月八日的阿里88会员节啦!这次的会员节会有一些什么满减的活动呢!想必很多小伙伴...
日期:03-25
ie浏览器将于明年6月"退役"_微软官宣!IE浏览器6月正式退役
  ITBEAR科技资讯3月18日消息,2021年初,微软曾表示将于2022年正式停用IE浏览器。今日,微软通过Windows消息中心再次向Windows用户提醒,IE浏览器将在今年在6月15日正式退出历...
日期:10-04
WAPI产业联盟发布团体标准《信息系统无线局域网密码应用基本要求》
通信世界网消息(CWW)日前,WAPI产业联盟(中关村无线网络安全产业联盟)发布了团体标准T/WAPIA 048—2023《信息系统无线局域网密码应用基本要求》。该标准首次明确提出了针对信息系...
日期:06-25
售价1.2万元!腾讯投资了一家深圳两轮电动车公司「售价1.2万元!腾讯投资了一家深圳两轮电动车公司怎么样」
电动自行车目前有多火?连腾讯都忍不住去入股。近日消息,据投资界报道,深圳市十方运动科技有限公司(简称十方运动科技”)最新发生工商变更,其中新增股东为广西腾讯创业投资有限公司...
日期:11-18
男子路边尝大爷樱桃没买被收2元直呼憋气 主动让尝:网友吐槽坑
近日,辽宁大连一男子路过樱桃摊被大爷请尝樱桃,因尝完没买被收2元。男子表示,吃完感觉很一般于是要走,大爷拿出了二维码让他扫2元,说不买就得扫钱,最后理论无果就付了钱,其实不是差...
日期:05-02
巧妙用米聊 iPhone使用更省钱_苹果手机能用米聊吗
  iPhone不仅是个用来接打电话的手机,它还是我们娱乐消遣的“游戏机”,是我们工作生活的百宝箱。如果能将iPhone巧妙使用,在充实生活同时,它还能让我们更省钱。打电话、发短...
日期:07-23
广东包揽民营企业发明专利榜前三,依次为:华为、腾讯、美的_华为的专利数
  10 月 11 日消息 今日,全国工商联发布了 2021 民营企业研发投入、发明专利榜单和民营企业研发投入前 1000 家创新状况报告。   2021 民营企业发明专利前 500 家榜单...
日期:03-04
深度体验金山T盘 感受1TB存储的震撼(金山t盘登陆)
  1TB,这个容量太无敌了!   近日,金山T盘开始了限量公测,笔者有幸获得了邀请码,于是马不停蹄开始了大容量、大数量文件上下传情况下的深度评测。   或许有些人,还在犹豫为...
日期:07-26
据亚马逊财报,2017年,AWS业务在总利润中的占「亚马逊第三季度营收1271亿美元 AWS云服务净销售额205.38亿美元」
10月28日消息:亚马逊公司今天发布了2022财年第三季度财报。报告显示,亚马逊第三季度净销售额为1271.01亿美元,与去年同期的1108.12亿美元相比增长15%,不计入汇率变动的影响为同...
日期:11-01
独家:原中国电信研究院院长何志强退休 担任二级正职干部超过15年
运营商财经 吴碧慧/文一加10发布时间表据中国电信集团内部下发通知,原中国电信研究院院长何志强到龄退休,而他在集团内的就职经历非常丰富,被称为“哪里需要搬哪里”的典型代表...
日期:07-03
埃隆马斯克推特事件「埃隆·马斯克的Twitter取证日程被推迟 因为其正在努力推进完成交易」
据英国《金融时报》和彭博社报道,埃隆·马斯克将不再于周四上午接受Twitter律师的质询,此前双方同意推迟此次取证日程,因为他们正在努力完成对该社交媒体网络440亿美元的收购。...
日期:10-08
第25届全国信息存储技术学术会议召开,紫晶存储吸引关注
  2019年9月18-20日,第25届全国信息存储技术学术会议在广东省深圳市召开。会议由中国计算机学会(CCF)主办,聚焦我国信息存储技术的专题研讨,集中展示国内外信息存储领域的最...
日期:07-18
父母不会用电脑打字怎么办?这键盘一分钟能“说”400字!(怎么教父母打字)
  对于我们这代的年轻人来说,想要玩转电脑是根本没问题的,各种功能稍微琢磨一下就能搞定,就算是不熟悉的功能,哪怕在网上找找攻略也能逐渐摸清。但是对于我们父母这辈人来说,...
日期:07-14
债多了不愁!ofo再成被执行人 已为2020年第24次_ofo未履行总金额超5亿元
  作为共享单车领域曾经的霸主,ofo有过极其辉煌的历史,成功开创了国内的共享单车这一商业模式。可是崛起的有多快速,衰败的就有多迅猛。从2016年到2017年火速扩张至顶峰,再到...
日期:09-20
BOSS直聘:预期A类普通股将于12月22日在香港联交所买卖
12月21日消息,今日早间,BOSS直聘在港交所发布公告称,公司以介绍方式在香港联合交易所主板上市,摩根士丹利和高盛为联席保荐人。BOSS直聘美国存托股2022年12月20日收市价为19.25...
日期:12-21