您的位置:首页 > 互联网

斯坦福团队发布全球首个超小型多模态AI代理模型Octopus V3,函数调用准确度媲美GPT-4

发布时间:2024-05-09 19:13:21  来源:互联网     背景:

近日,斯坦福大学的NEXA AI团队宣布推出全球首 个多模态AI代理模型Octopus V3,让AI代理更加智能、快速、能耗及成本降低。

今年四月份初,NEXA AI推出了备受瞩目的Octopus V2,该模型在函数调用性能上超越了GPT-4,减少了95%的推理时所需的文本量,为端侧AI应用带来了新的可能性。其专利性核心技术“functional token”通过创新的函数调用方式显著减少推理时所需的文本长度。

小米充电宝 5000mAh 口红版

这种方法使得模型能够在只有20亿参数的情况下实现高效训练,并在精度和延迟方面超越了GPT-4,适应了各种端设备的部署需求。

发布以来,Octopus V2在LLM社区获得了广泛关注,受到了AI领域大量前沿技术专家及研究者的赞赏,如Hugging Face的CTO Julien Chaumond、知名AI Newsletter Rundown AI的创始人 Rowan Cheung以及Figure AI的创始人Brett Adcock、OPPO边缘人工智能团队负责人Manoj Kumar,称其“开创了端侧AI技术新纪元”。

在知名开源AI平台Hugging Face上,Octopus V2下载量已经超过12000次。

在不到一个月的时间里,NEXA AI团队发布下一代多模态AI代理模型Octopus V3,展现进一步突破:具有图像处理和多语言文本处理能力,为智能手机等端侧设备真正走向AI时代铺平了道路。

一般窗套门套多少钱一米

AI技术突破:首 个参数量小于10亿的多模态AI代理模型

Octopus V3不仅拥有多模态能力,在函数调用性能上远超同类模型,可媲美GPT-4V+GPT4;而且模型参数量不到10亿,具有多语言能力。

也就是说,相比传统的大型语言模型,它体积更小,能耗更低,能够更加轻松地在各种小型端设备上运行,比如树莓派,并做到高速且准确的函数调用。

这意味着,未来AI代理能够广泛应用于智能手机、AR/VR、机器人、智能汽车等端侧设备,为用户交互体验更加流畅、智能。

另一方面,由于V3具有多模态处理能力,可同时处理文本和图像输入,再加上多语言能力,也将让用户体验更加丰富。

例如,在Instacart购物应用中,用户可以通过一张菠萝的图片及简单的对话指令,让AI代理自动为他们搜索商品,提高了效率和用户的体验。

再比如,在发送邮件等场景中,Octopus V3可以根据一张具有文字的图像,自动提取信息并填写邮件内容,为用户提供更加智能、便捷的服务。

Octopus系列模型的发布标志着端侧AI代理技术的重要突破,可能成为人工智能技术的新里程碑。

从软件交互到智能汽车,端侧AI潜力巨大

基于这些特性,Octopus V2及V3的应用场景丰富多样,具有广泛的应用前景。

除上文提到的手机场景,当Octopus V2应用在智能汽车上时,也能带来新的交互体验。目前的语音助手往往难以帮助车主完成较为复杂的任务,如在驾驶途中临时改变目的地、加入额外停靠点等。应用Octopus V3后,AI助手能够基于较为模糊简单的指令快速、精准地完成相应任务。

结合V2、V3的能力,从信息检索、到基于指令完成设计,用户可以在虚拟场景下获得流畅的AI体验:在一个社区用户的VR场景demo中,输入简单的语音指令后,AI代理能够帮助用户快速完成一个客厅设计,在弹指间替换沙发、改变颜色灯光等。在用户输入旅行指令后,用户快速来到了日本,而AI代理同样可以在简单的对话式交流中帮助用户搜索相应景点,提供丰富的信息。

数据显示,全球大型语言模型市场规模正在快速增长。Granview Research报告显示,全球大型语言模型市场规模估计为43.5亿美元,并预计从2024年到2030年的复合年增长率为35.9%。同样,边缘人工智能市场也呈现出蓬勃发展的势头——预计从2023年到2030年,全球边缘人工智能市场的复合年增长率为21.0%,到2030年将达到664.78亿美元。

酷狗在电视上怎么k歌

NEXA AI团队由斯坦福大学的杰出研究人员创立。创始人兼首席科学家Alex Chen(陈伟)正在攻读斯坦福大学的博士学位,拥有丰富的人工智能研究经验,并且曾担任斯坦福华人创业协会(Stanford Chinese Entrepreneurs Organization)的主席。联合创始人兼首席技术官Zack Li(李志远)也毕业于斯坦福大学,并在Google和Amazon Lab126实验室拥有4年端侧AI的一线研发经验,同样曾经担任斯坦福华人创业协会的主席。斯坦福大学副教授、斯坦福技术创业项目副主任Charles (Chuck) Eesley担任顾问,为团队提供指导和支持。

左:李志远;右:陈伟

目前,NEXA AI的独创性技术已申请专利保护。

NEXA AI的创始团队表示,他们将继续致力于推动端侧AI技术的发展,通过开源模型提升其创新技术的影响力,为用户创造更智能、高效的未来生活。


返回网站首页

本文评论
24岁湖北小伙搭17个顺风车到格鲁吉亚求婚引羡慕:女子同意 结婚不要彩礼
1月10日,一98年湖北小伙晒出自己与环球旅行途中娶到的外国媳妇一起穷游的甜蜜画面。特斯拉后续购买自动驾驶据悉,该小伙以徒步加搭乘顺风车的方式环球旅行,目标20国已游历17国,...
日期:01-12
小红书COO柯南:将近70%的月活用户在小红书有搜索行为
12月18日消息,昨日,小红书COO柯南表示,小红书的社区有商业,而且有非常繁荣,有活力的商业生态。小红书社区里已经催生出了丰富商业生态和需求,小红书正在构建原生的商业系统,帮助商...
日期:12-18
果粉幸福!iPhone被强迫要求植入后门 苹果直接硬扛放弃服务_苹果后门事件怎么解决的
快科技8月9日消息,为了不让iPhone被迫植入后门,苹果竟然在英国放弃了两项服务。据外媒报道称,英国政府正在推行一项立法,迫使苹果等公司在iMessage和FaceTime等端到端加密应用中...
日期:08-09
拿着瑞幸咖啡去星巴克「擅自在饮品中加茅台售卖系侵权 「瑞幸酱香拿铁火出圈」-官方」
【】9月5日消息,昨日,贵州茅台与瑞幸咖啡推出的联名咖啡“茅台瑞幸酱香拿铁”正式上架开卖,吸引不少用户下单尝鲜,相关话题冲上微博热搜。iphone14真正全面屏据了解,这是茅台与咖...
日期:09-10
商汤科技(西南)人工智能计算中心“点亮”,AGI基础设施加速产业数字化升级
通信世界网消息(CWW)10月24日,商汤人工智能计算中心(AIDC)深入西南地区,在“满天星”行动计划支持下正式在“山城”重庆点亮。* “满天星”计划指《重庆市软件和信息服务业“满天...
日期:10-25
华为MatePad Pro 13.2英寸体验:无边大屏带来平板生产力新体验_华为matepadpro多大屏幕
  市面上的绝大多数平板正面造型都很相似,粗粗的边框已经很久没有改变了。智能驾驶汽车试点  终于这次华为出手了,带来全新华为MatePad Pro 13.2英寸,业界首款柔性OLED屏幕...
日期:09-28
小米MIX Fold 3保外维修费出炉:换屏要3650元 够买台K60至尊版「小米mix fold屏幕保修吗」
快科技8月17日消息,小米新一代折叠旗舰小米MIX Fold 3正式开售,售价8999元起,根据官方数据,该机首销5分钟就达成了上一代销量的2.25倍,刷新小米折叠屏旗舰的首销记录,十分火爆。从...
日期:08-17
华为鸿蒙4.0陆续推送 P50等新机可升「华为发布鸿蒙系统p50」
华为Mate40、P50等系列机型,目前已经开始推送鸿蒙OS 4.0 beta版系统,体积超过了6G。智能网联汽车板块首批支持的机型还包含:华为Mate 50E、Mate 40、Mate 40 Pro、Mate 40 Pro...
日期:07-08
小米十亿像素手机「10月4日发布 小米款2亿像素手机要来了」
小米官宣10月4日举行全球发布会,发布会上将会发布小米12T和小米12T Pro至少两款新手机。魅族ceo李楠这两款手机的一大看点就是像素的提升,其中,小米12T后置主摄为1.08亿像素,小...
日期:10-04
NGINX社区线下Meetup第三期成功举办 感受成都开发者们的NGINX热情
  “我们举办NGINX社区线下Meetup的理念,是开放、包容、沟通、贡献,我们希望有越来越多的开发者们了解、精通、应用NGINX,用热爱的力量为NGINX的发展创造出新的成就。”7月1...
日期:04-28
不打算修!AMD EPYC Rome服务器芯片运行1044天必定死机_amd服务器cpu怎么样
快科技6月4日消息,一般而言,对于一款服务器处理器芯片来说,长期使用的稳定性都可以说是重中之重。但根据AMD近日发布的EPYC 7002 Rome”服务器芯片指南中的信息,第二代EPYC Rome...
日期:06-04
苹果赢得《堡垒之夜》开发商应用商店垄断案上诉:并非垄断者「堡垒之夜apple」
4月25日消息,当地时间周一,美国第九巡回上诉法院宣布维持一名联邦法官在2021年做出的一项裁决,该裁决主要支持苹果的应用商店政策,反对《堡垒之夜》开发商Epic Games发起的反垄...
日期:04-25
探访创高门窗成都北富森店,步入舒适人居新生活_成都创高自动化设备有限公司
近年来,高质量的系统门窗已经成为家居装修的点睛之笔。作为华南地区知名的门窗品牌,创高门窗历经二十余年的发展,创造了独属于自己品牌的门窗设计之美,并将其与前沿的门窗科技...
日期:10-19
金壮龙向工业和信息化部系统广大干部职工致以节日祝福
2023年9月28日,在中秋、国庆双节到来之际,工业和信息化部党组书记、部长金壮龙代表部党组看望慰问部机关干部职工,致以节日问候和美好祝福。部党组成员、副部长王江平参加活动...
日期:10-02
印度的电商平台SNAPDEAL_印度团购网站SnapDeal在最新一轮融资中募集1200万美元
  北京时间1月26日凌晨消息,印度最大团购网站SnapDeal在最新一轮融资中募集1200万美元。   SnapDeal母公司Jaspers CEO库奈尔·巴尔(Kunal Bahl)今天在德国慕尼黑数字生活...
日期:07-26
周鸿祎谈“企业数字化”:最大威胁是来自其它国家背景高级网络威胁攻击
  讯 12月16日上午消息,由新浪财经客户端、联合主办的“2022科技风云榜”线上年度盛典今日开幕。  周鸿祎表示,我们正在经历人类历史上最聪明的时代,数字技术爆炸、让智慧...
日期:12-16
#iphone15pro#「iPhone15Pro有望新增2TB选项 同时取消128GB版本」
8月9日 消息:据macrumors报道,来自韩国Naver博客上的一个新闻聚合账号“yeux1122”传言称,有供应商消息证实,iPhone 15 Pro和iPhone 15 Pro Max将提供比iPhone 14 Pro型号多一...
日期:08-09
爆火Sora背后的技术,一文综述扩散模型的最新发展方向_扩散效应理论模型
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。为了使机器具有人类的想象力,深度生成模型取得了重大进展。这些模型能创造逼真的样本,尤...
日期:02-22
2021年网络热词热句「2022老铁们最关注的10大热词,你pick哪一个?」
   12 月 20 日,基于快手平台搜索和热点指数综合排名,快手大数据研究院发布 2022 快手年度十大热词:二十大、乡村振兴、冬奥会、神舟十三号返航、女足亚洲杯夺冠、世界杯、俄...
日期:12-20
老鼠咬坏白酒桶醉倒在超市 直接少了半桶:网友感慨好酒量 超市回应
二锅头直接喝了半桶,这老鼠酒量可以啊....元宇宙电影 玩家9月3日,广东东莞。男子超市购物时发现,货架上的白酒少了半桶,结果当把酒桶拿开,一只老鼠已经喝醉趴着一动不动。这也引...
日期:09-04