您的位置:首页 > 互联网

超强Siri即将到来!苹果10篇重磅AI研究全总结,iOS 18关键一瞥_苹果siri功能都能干什么

发布时间:2024-05-08 12:49:32  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】一直以来,苹果在大模型、语音助手上的研究不断推陈出新,或许我们能够从中获得iOS18所具备AI能力的关键一瞥。

Siri太笨,根本无法与ChatGPT竞争,前苹果工程师John Burkey曾对Siri的评价如此不堪。

小米摄像头2云台

不过,诞生于11年的Siri,终于要迎来翻身的机会。

ChatGPT横空出世之后,微软、谷歌等科技巨头,甚至OpenAI、Anthorpic AI等初创,都在你追我赶激烈地角逐。

在AI竞赛上,苹果却一直姗姗来迟。

其实,早有传言和报道称,在过去几个月中,苹果实际上一直再等待一个时机,做出反击。

苹果没手写输入

先是与谷歌谈判被爆出,后是与OpenAI开展合作,预计将AI模型能力整合进下一代iOS18系统中。

除此以外,苹果研究团队也在一直开发自己的模型——Ajax。

而且,最近几个月,苹果在大模型等研究上的成果频出,意味着这些AI能力可能会成为现实。

距6月开发者大会WWDC,也就不过一个月左右的时间,或许我们可以从这些研究中,一瞥苹果的AI能力。

更小、更高效LLM装进iPhone

相信所有人的期望都是一样的——想要一个更好的Siri。

而现在看起来,换新的Siri即将到来,完成超强进化!

ChatGPT之后,大模型诞生的数量也是数不胜数,然而许多科技公司都希望LLM能够赋能虚拟助手,让其变得更优秀,更智能。

对于苹果来说,想要让Siri不再被人,说笨就需要尽快构建这些模型,让其能装进手机。

彭博最近报道,在iOS18中,苹果计划让所有AI功能,都运行在设备上,而且可以完全离线使用。

而现在的困难是,即便你有一个数据中心和数千个GPU组成的网络,要建立一个良好的多用途的模型,并装进手机,是非常困难的。

因此,苹果不得不发挥创意。

在一篇名为LLM in a flash: Efficient Large Language Model Inference with Limited Memory的论文中,研究人员设计了一个系统,可以将通常存储在设备RAM中的模型数据,存储到固态硬盘(SSD)上。

论文地址:https://arxiv.org/pdf/2312.11514

具体来说,研究证明了,在SSD上运行的LLM的大小,可以达到可用DRAM的2倍。

与传统的CPU加载方法相比,推理速度提高了4-5倍,而GPU提高了20-25倍。

他们发现 ,通过利用设备上最廉价的可用存储模型,模型可以运行得更快、更高效。

此外,苹果的研究人员还创建了,一个名为EELBERT的系统,可以将大模型压缩到更小的规模,同时不影响其性能。

通过对谷歌Bert模型进行压缩后,体积缩小了15倍,只有1.2兆字节,质量只降低了4%。

不过,这也带来了一些延迟问题。

论文地址:https://arxiv.org/pdf/2310.20144

总而言之,苹果正努力解决模型领域的一个核心矛盾:模型越大越好用,但在终端上耗电快运行慢。

苹果siri有什么好玩的功能

与其他科技公司一样,苹果正在这一点上找到平衡。

Siri完成超进化!

苹果研究AI终归解决一个至关重要的问题,如何让Siri变得更加出色。

在内部,苹果团队设想开发一种,无需唤醒词Hey Siri或Siri,就能使用AI助手的方法。

没有声音提示,那该如何让设备通过直觉判断一个人在讲话?

这一难题,比语音触发检测更具挑战性。

苹果研究团队不得不承认,这是因为可能没有一个主要的触发语,来标志语音命令的开始。

论文地址:https://arxiv.org/pdf/2403.14438

这也许就是,为什么另一组研究人员,开发出了一个系统可以更准确地检测唤醒词。

论文地址:https://arxiv.org/pdf/2309.16036

具体来说,作者提出了语音触发(VT)的多通道声学模型,将前端的多通道输出直接输入VT模型。

他们采用了TAC(Transform-Average-Conatenate)模块,并通过合并来自传统通道选择的通道,对TAC模块进行了修改,让模型能够在存在多个说话人的情况下关注目标说话人。

与基线通道选择方法相比,该方法的误拒率降低了30%。

而在另一篇论文中,研究人员训练了一个模型,以更好地理解不太容易被AI助手理解的罕见词。

新鲜智造打造中国首款互联网冰箱品牌

论文地址:https://arxiv.org/pdf/2310.07062

在这两种情况中,LLM的魅力在于,理论上它可以更快地处理更多信息。

例如,在关于唤醒词的研究中,研究人员发现,如果不试图摒弃所有不必要的声音,而是把所有声音都输入模型,让它来处理哪些是重要的,哪些是不重要的,那么唤醒词的效果就会可靠得多。

iphone siri功能

一旦Siri听到你的声音,苹果就会做很多工作,以确保它能更好地理解和沟通。

iphonese4将会采用全面屏

在另一篇论文中,苹果还开发了一个名为STEER系统,旨在改善用户与助手之间的交流。

论文地址:https://arxiv.org/pdf/2310.16990

苹果siri最新版本

在另一个例子中,它使用LLM来更好地理解模棱两可的问题,无论你怎么说,它都能弄清楚你的意思。

在不确定的情况下,智能对话智能体可能需要主动提出好的问题,从而更有效地解决问题,从而减少不确定性。

在另一篇论文也旨在帮助解决这个问题,研究人员利用大模型使助手在生成答案时不再冗长,更容易理解。

苹果每个应用,将被AI重构

除了关注原始的技术发展,苹果也非常关注人工智能的日常应用。

对于苹果来说,一个重点领域就是健康:

LLM可以帮助分析处理各种设备收集到的大量生物识别数据,并帮助理解这些数据。

苹果可以通过研究收集和整理你的所有运动数据,利用步态识别和耳机来识别你的身份,以及如何跟踪和理解你的心率数据,来监测你的身体状况,为你提供合适的安全建议。

苹果还把人工智能想象成一种创造性工具。

在2月发表的一篇论文中,苹果团队采访了一批动画师、设计师和工程师,并构建了一个KeyFramer系统。

这一系统,可以让用户迭代地构建和改进生成的设计。

用户只需要先输入一个提示,然后得到一个工具包,可以根据自己的喜好调整和完善图片的某些部分。

论文地址:https://arxiv.org/pdf/2402.06071

此外,苹果还有开发了一款名为MGIE的工具,可以让你通过描述内容来编辑图片(比如让天空更蓝、让我的脸不那么怪异、添加一些石头等等)。

论文地址:https://arxiv.org/pdf/2309.17102

论文中,研究人员表示,MGIE不需要简短但含糊的提示,便可以明确地推导出视觉感知的意图,从而实现合理的图像编辑。

最初的实验并不完美,但令人印象深刻。

未来,苹果还有可能将AI用在音乐中。

在一篇名为Resource-constrained Stereo Singing Voice Cancellation的论文中,研究人员探索了将歌曲中的声音与乐器分离的方法。

论文地址:https://arxiv.org/pdf/2401.12068

比如,像在TikTok或Instagram上那样混音歌曲,这个AI可能会派上用场。

随着时间的推移,苹果会在iOS 上,在自身的生态系统中内置一些功能,也会以API的形式提供给第三方开发者。

之前苹果一直在大肆宣传自己的硬件能力,尤其是与普通的安卓设备相比。

将所有这些功率与设备上注重隐私的人工智能相结合,可能会成为苹果一个很大的差异化优势。

这次iOS18强势来袭,网友一如既往地对苹果期待感满满。

值得一提的是,苹果在多模态大模型方面研究,也引来众多的关注。

Ferret堪称苹果最大型、最雄心勃勃的人工智能项目。输入提示之后,它可以关注你选择的特定事物,并理解周围的世界。

论文地址:https://arxiv.org/pdf/2404.05719

甚至,Ferret还可以帮助你导航应用程序、回答有关App Store评级的问题、描述你正在看的内容等等。

一旦这种技术得以应用,可能彻底改变每个人使用手机的方式,以及Vision Pro和智能眼镜的使用方式。

虽然目前这些都只是研究成果,但是如果能在今年春天开始顺利运行,那将是一项闻所未闻的技术成就。

WWDC大会即将发布的大型人工智能模型,必然会把技术狂欢推向新一轮的高潮。

苹果或会全面改版iPhone产品,也就意味着你的下一台iPhone不必是iPhone。

这一切都在库克的预料之中,接下来就等着瞧好吧。

参考资料:

https://www.theverge.com/2024/5/5/24147995/apple-siri-ai-research-chatbot-creativity


返回网站首页

本文评论
突破次元壁!全民小视频全新“一键动漫”功能,实现你的二次元梦想
  突破次元壁!全民小视频全新“一键动漫”功能,实现你的二次元梦想   每一个大人,都是有过二次元梦想的孩子。曾经的我们,是希望能变身成美少女战士的女孩,是希望成为...
日期:09-28
2023见-荣耀Magic5 Lite获DXO电池性能No.1_续航超三天 MWC
随着各大品牌对旗下开年巨作预热的火热开启,荣耀旗下首款第二代骁龙8旗舰新机——全新的荣耀Magic 5系列也即将与大家见面,此前有消息称该机将于2月27日亮相。距离发布时间的...
日期:09-19
快手电商上线信任购专区「快手电商官方网站」
2月9日 消息:快手电商宣布上线信任购专区。据介绍,信任购是快手电商打造的首个信任电商品牌,整合了多项商品和售后保障权益。在商品/直播间/店铺等渠道开通信任购,用户下单全链...
日期:02-09
三星宣布成功完成 8 纳米 5G 射频解决方案开发:功率效率提高 35%_5G射频关键技术
  三星官网今日发布消息称,该公司已推出了基于 8 纳米工艺的最新射频技术。   三星表示,这一先进的工艺技术有望提供专门用于支持多通道和多天线芯片设计的 5G 通信“单...
日期:07-12
vivo正式发布OriginOS 4 系统,新增两项无障碍功能_vivo无障碍按钮在哪
通信世界网消息(CWW)今日,在2023 vivo开发者大会上,vivo 正式发布了 OriginOS 4 系统,值得注意的是,该系统增加了 vivo看见和 vivo读谱两项无障碍功能。新增的vivo看见功能,是 vi...
日期:11-01
人才+产品+内容三重布局,智伴科技联合暨南大学华文学院探索AIED未来发展
  2019年9月6日,广州智伴人工智能科技有限公司(以下简称:智伴科技)与暨南大学华文学院的产学研校企合作本科实践教学正式启动。智伴科技内容副总裁苏战先生一行,与暨南大学...
日期:06-27
网友留言想要比小米13屏幕更小手机、雷军:支撑不了研发成本_小米屏幕较小的手机
4月25日消息,小米13系列三款机型已经全部发布,雷军针对不同机型还给出了相应的购买建议。此后还有网友在雷军微博下留言称,想要比小米13更小的小屏手机,雷军则表示,“小米13已经...
日期:04-25
字节赛马:抖音图文,内卷头条?_字节跳动今日头条抖音关系
声明:本文来自微信公众号“财经故事荟”(ID:cjgshui),作者:王红霞,编辑:陈纪英,授权转载发布。“ 舍不得孩子套不着狼”,这话用来形容字节的最新境况,再合适不过。在近日的2022年抖...
日期:10-17
中小企业网络营销如何进行品牌推广策划_中小企业网络营销如何进行品牌推广
    网络高速发展的今天,中国已经有超过四亿的网民,这使得目前大多的企业重视网络营推广了,但专业网络营销人才的缺乏和对网络营销的认识不足,很多企业虽然在网络里投了不少...
日期:07-22
sdk platform tools「SDK工具包Observe:可持续监控WebAssembly代码」
8月31日 消息:Observe是一个用于WebAssembly的可观测性SDK工具包,它可以持续监控WebAssembly代码在运行时的执行情况。该库包含所需的运行时 SDK 和适配器,以实现对WebAssembl...
日期:08-31
清明假期火车票「清明节放假3天调休1天 小长假前夜火车票今日开抢」
北京市人民政府办公厅于今日正式公布了2024年清明节的放假安排,旨在为市民提供清晰的假期规划。根据国务院办公厅的指导精神,清明节假期将从4月4日(星期四)开始,一直延续至4月6日...
日期:03-20
跌破3000大关 RTX4060 Ti显卡开售就破发
在上周RTX 4060 Ti终于开始销售了。不过现在已经出现了破发的情况,RTX 4060 Ti的起步价为3199元,但是许多玩家发现,已经跌破了3000元,而且目前货源比较充足,叠加618的优惠还是很...
日期:06-03
特斯拉价格下降「特斯拉中国降价欧美涨价:涨幅超15000元」
快科技3月17日消息,快科技3月17日消息,特斯拉Model Y又要涨价了。特斯拉官方宣布,将于3月22日在多个欧洲国家提高其Model Y电动汽车的价格,涨幅约为2000欧元(约合15660元人民币),或...
日期:03-17
支付宝直播的大v有钱吗?「支付宝直播带货再升级,带货直播间开播规模不到半年增长10倍」
11月30日 消息:支付宝直播带货又有新动作。11月30日,支付宝对外宣布了直播带货产品一系列升级:通过开放商品招商系统、升级“带货宝”达人选品中心以及简化开播流程等,进一步...
日期:12-01
国庆节期间大闸蟹怎么样「大众点评:国庆期间大闸蟹到店餐饮订单量同比去年增超四成」
10月10日消息,自9月底阳澄湖大闸蟹开捕以来,大闸蟹的消费热度不断攀升。为了更便捷放心地吃到优质大闸蟹,越来越多消费者选择去线下餐厅。大众点评数据显示,“十一”长假期间,大...
日期:10-13
通付盾荣获2019年度金融科技创新突出贡献奖(2020年度金融服务创新奖)
  昨日,由《金融电子化》杂志社主办的“2019中国金融科技年会暨第十届金融科技及服务优秀奖颁奖典礼”开幕。本次盛会以“致敬时代· 致敬创新”为主题,对过去一年在金融科...
日期:07-15
国家邮政局约谈极兔速递 后者回应:将全面梳理排查_邮政极兔什么意思
1月27日 消息:极兔速递近日因集装袋重金属超标问题被国家邮政局行政约谈。针对此事,极兔速递回应称将对现有的快递包装供应商进行全面梳理排查。极兔速递表示,将认真分析问题...
日期:01-27
苏宁易购全量商品入驻抖音,娱乐+购物双重快乐来了!_抖音上的苏宁易购能买东西吗
  2020年被称作电商直播元年,不仅抖音、快手等短视频平台大力开放直播带货入口,苏宁易购、淘宝、京东等电商平台也纷纷开启直播卖货模式;就连央视,也让“段子手”朱广权...
日期:07-14
张颂文、姚安娜主演!腾讯《猎冰》连续8日登顶网剧榜冠军
快科技2月29日消息,腾讯视频出品的网剧《猎冰》在21日正式开播,据灯塔专业版数据,该片连续8天成为网剧单日市占率冠军,遥遥领先同期其他网剧。该片最大的关注点就是阵容强大,反派...
日期:02-29
高德地图上线“运动导航”功能 骑车步行消耗卡路里同步显示
日前,高德地图推出运动导航”功能,可帮助用户在骑行、步行导航模式下记录卡路里的消耗情况,同时也可设置热量消耗目标,以及查看近期卡路里消耗的阶段性成果。即日起,高德地图用户...
日期:03-06