您的位置:首页 > 互联网

苹果开发出能看懂屏幕上下文的人工智能技术ReALM

发布时间:2024-04-03 20:40:16  来源:互联网     背景:

4月3日 消息:苹果开发出了一项能够实时理解和识别用户屏幕上显示内容的人工智能技术,而且无需依赖屏幕截图或图像数据输入。这项技术被称为ReALM(Real-time Analysis of Live Media),它使得在与用户交流的过程中,智能助手能够看到用户所看到的一切内容,并理解用户当前正在进行的活动,从而随时提供帮助。

华录易云总部

论文地址:https://arxiv.org/pdf/2403.20329.pdf

pixel Android12

ReALM技术通过将屏幕上的元素和布局转换为文本形式,然后利用这些文本信息来解析用户提出的与屏幕内容相关的查询或指令。比如用户可以说“打开我屏幕上显示的第一个应用”或“读取屏幕中央的新闻标题”,即使实际上该智能助手并未“看到”用户的屏幕。

这种能力特别适用于需要对屏幕上信息进行快速反应和处理的应用场景,比如虚拟助手和辅助技术等。通过ReALM技术,智能助手可以更加智能地理解用户的意图,并提供更加准确和个性化的帮助和服务。

这一举措预示着 iOS18将于2024年6月的 WWDC 发布,届时我们预计将推出全新的 Siri2.0,尽管目前尚不清楚该模型是否会及时集成到 Siri 中。这并不是苹果最近几个月在人工智能领域的首次尝试,公司推出了一系列新模型、工具以及合作伙伴关系,所有这些都预示着一家准备将人工智能作为业务中心的公司。

ReALM 是苹果快速增长的人工智能研究团队发布的最新消息,也是第一个专注于改进现有模型的消息,使其更快、更智能和更高效。

该公司声称,甚至在某些任务上优于 OpenAI 的 GPT-4。最新发布的详细信息来自苹果公司于周五发布的一篇新的开放研究论文,首次由 Venture Beat 在周一报道。对于它是否将实际成为 iOS18的一部分,苹果公司对此尚未置评。

ReALM 是如何工作的?

ReALM 与 GPT-4等模型相比要小得多。但这是因为它不需要做所有的事情。它的目的是为其他人工智能模型提供上下文,比如 Siri。

这是一个视觉模型,重新构建屏幕并标记每个屏幕实体及其位置。这创建了屏幕布局的基于文本的表示,可以传递给语音助手,为用户请求提供上下文线索。

在准确性方面,苹果表示,尽管体积更小、速度更快,ReALM 在一些关键指标上的表现与 GPT-4相当好。

这对 Siri 意味着什么?这意味着,如果未来版本的 ReALM 被部署到 Siri—— 甚至是这个版本 —— 那么当用户告诉它打开这个应用程序,或者告诉我这个图像中这个词的含义时,Siri 将更好地理解用户的意图。

它还将使 Siri 在不必完全部署像 Gemini 这样的大型语言模型的情况下具有更多的对话能力。当结合其他最近的苹果研究论文,允许 “一次性” 响应 —— 即 AI 可以从单个提示中获得答案 —— 这表明苹果仍在大力投资于 AI 助手领域,而不仅仅依赖外部模型。

2021年去桂林非常火的竹筏游漓江

人民日报评价spacex助推火箭回收


返回网站首页

本文评论
特斯拉目标每45秒造一辆车 计划未来每年生产2000万辆车_特斯拉一天生产多少辆车
特斯拉于3月2日在得克萨斯州超级工厂举办2023年投资者日活动,活动的主题是可持续能源。特斯拉CEO马斯克表示,特斯拉的宏图计划包括:储能电池240TWh、可再生电力30TWh、10万亿...
日期:03-02
全国铁路将实行今年第三季度列车运行图「今日起 全国铁路实行第四季度运行图:优惠、退票政策大变化」
根据中国铁路官方消息,今日零时起,全国铁路将实行第四季度列车运行图,调图后,全路开行旅客列车5286对,较现图增加21对;开行货物列车10829对,较现图增加41.5对。铁路方面的变化包括...
日期:10-12
京东宣布:华为Mate 60 Pro上架预售 6999元「华为mate60最新官方消息」
快科技8月29日消息,今天上午华为Mate 60 Pro突然提前公布,并且直接开售,打了所有人一个措手不及,甚至连友商的发布会都黯然失色。这次的Mate 60 Pro突然开售,不仅是普通用户没想...
日期:08-29
乘联会:价位无限接近的混动车 足以对燃油车形成致命一击「混联混动」
今年上海车展尤为热闹,150余款新车全球首发,而且诸多厂家展台是清一色新能源车,纯燃油车几乎没了存在感。乘联会表示,混动将接力纯电市场,领衔2023年新能源市场增速。ipad pro202...
日期:04-26
蔚来回应实习员工自称遭性侵犯 正对其实习留用流程进行调查_蔚来汽车工作人员
凤凰网科技讯 3月4日消息,近日,有网友称,自己入职蔚来的第一个月,被男同事试图强奸。目前该男同事已因强奸罪入狱。该网友表示,蔚来目前反馈不会留用自己。网友称被HR反馈:“她是...
日期:03-04
苹果 11 月开始将 iPhone 5c 和 iPad mini 3 列为过时产品_ipad mini5是哪一年的产品
10月9日消息:苹果公司在2020年10月将iPhone5c标记为陈旧产品,这意味着该公司及其服务提供商只能为该产品提供某些维修服务,但要视零件供应情况而定。iphone13磁吸充电宝好吗图...
日期:10-13
谷歌被指控窃取数百万用户数据训练人工智能工具「使用谷歌会被美国监控吗」
7月12日 消息:日前,谷歌面临一项广泛的侵权诉讼,指控这家科技巨头未经用户同意,窃取了数百万用户的数据,并违反版权法来训练和开发其人工智能产品。这起对谷歌、其母公司 Alphab...
日期:07-12
实用至上!丰田决定用机械钥匙替换智能钥匙:原因无奈「丰田老款机械钥匙」
10月29日消息,丰田汽车近日宣布,由于芯片短缺,其会将新车附赠的两把智能化数字钥匙其中一把暂时替换为机械钥匙,报道称,这一变化将适用于14款丰田车型,以及9款雷克萨斯品牌车型。...
日期:10-30
幻夜科技有限公司「幻霄科技概念片发布,AI沉浸式学习平台「线上学」带你探秘智境」
互联网快速发展以来,教育领域始终紧跟时代步伐不断升级,从互联网+教育到元宇宙+教育,再到AI+教育,每一个“+”前词语变化所代表的都是技术的进步和发展,为教育、培训行业注入了新...
日期:07-28
一到零点就断网_零点断网不能纸上谈兵  不了了之
昨天《成都晚报》报道,经过一年多的反复修改,省十一届人大常委会第二十三次会议将分组审议《四川省未成年人保护条例(修订草案)》。为杜绝网吧接纳未成年人,草案明确要求,互联...
日期:07-28
美版iPhone 14 Pro Max 256G仅售6000+ 但我并不推荐大家购买_11promax美版256g多少钱
苹果今年刚刚在9月秋季新品发布会上发布的iPhone 14系列大屏旗舰iPhone 14 Pro Max可以说是同系列中的天花板级的存在,A16处理器、巨大的6.7英寸屏幕、全新升级的4800万四合...
日期:10-16
余承东晒北京首家华为旗舰店开业盛况:开业第一天就迎接近万名顾客
快科技1月14日消息,昨日,华为旗舰店北京王府井盛大开业,这是北京首家华为旗舰店。今日,余承东在微博晒出新店开业盛况。他表示,这座城市客厅”位于热闹非凡、交通便利的王府井商...
日期:01-15
薇诺娜怎么火的「7000字复盘:薇诺娜“爆品陨落”的9件小事」
声明:本文来自微信公众号“刀法研究所”(ID:DigipontClub),作者:晶敏,授权转载发布。逆水行舟,不进则退。今年618,薇诺娜没能如愿重回国货第一。薇诺娜品牌包括儿童线在内,全渠道销...
日期:07-11
用“芯”突破视听边界,独家神经元量子点处理器开启智慧生活无限可能
6 月 8 日,三星电视在京举办 2023 年技术品鉴会,展示多款前沿电视产品及其创新技术理念。三星独 家神经元量子点处理器对画质、音效、智能交互等方面带来的多维提升备受关注。...
日期:06-09
RTX 4080 16GB/12GB性能对比:能差30%
今年NVIDIA同时首发了RTX 4080 16GB和12GB,规格上的区别较为明显,那么实际性能差异如何呢?苹果12暴跌的原因VCZ基于三款游戏《瘟疫传说:安魂曲(A Plague Tale: Requiem)》、《F1 2...
日期:10-24
应用工程师前景和待遇「企业月薪1万2半年只招到两人 应用工程师太难招人」
毕业季又到了,大多数毕业生会选择传统的招聘网站和校园招聘会来寻找自己理想的职位。不久前,#杭州一企业月薪1万2半年只招到两人#的话题在微博上热度上升,引起了许多网友的关注...
日期:06-20
海天酱油回应双标:不区分国内外市场、添加剂都有_海天酱油添加剂问题
最近,全国闻名的海天酱油因为添加剂问题闹得沸沸扬扬:国内售卖的含有食品添加剂,在日本售卖的却零添加,被质疑双标”。对此,海天味业曾发布公告,否认存在双标”,还指责有人借机炒作...
日期:10-14
重磅官宣!格之格全新品牌代言人朱亚文_格之格官网
3月11日,知名办公打印品牌格之格正式官宣朱亚文成为其全新品牌代言人,实力与实力携手,口碑与口碑加乘,正式开启格之格品牌升级全新战略元年!美股三大股指上周涨就在此前,格之格和...
日期:03-12
影像最好的天玑8200手机 OPPO Reno10 Pro发布:3499元起_天玑820手机价位
快科技5月24日消息,OPPO Reno10 Pro发布,16GB 256GB售价3499元,16GB 512GB售价3899元。该机主打人像摄影,OPPO在Pro版本上配备了一颗3200万像素超光影长焦镜头,传感器面积是1/2.7...
日期:05-24
ai图像生成器的使用「Meta 推出免费独立的 AI 图像生成器网站Imagine with Meta AI」
12 月 7 日消息:在谷歌推出 Gemini 之后,Meta 也不甘示弱,在网络上推出了基于其 Emu 图像合成模型的免费独立 AI 图像生成器网站——Imagine with Meta,允许用户通过自然语言描...
日期:12-07