您的位置:首页 > 互联网

“苹果入局大模型?我深挖到了一些细节”_苹果的模型

发布时间:2023-09-20 19:22:53  来源:互联网     背景:

声明:本文来自于微信公众号CSDN(ID:CSDNnews)),作者 | Jack Cook 译者|Ric Guan,授权转载发布。

在今年早些时候的 WWDC 上,苹果宣布即将推出的 iOS 和 macOS 版本将配备一项由 “Transformer 语言模型”提供支持的新功能,这个功能和很多 AIGC 工具一样,方便用户在输入文字时,提供由 AI 生成的文本建议。

听到这个消息后,我很好奇这个功能是如何工作的。尽管大多数竞争对手在过去几年里都在全力开发大型语言模型,但苹果公司并没有部署很多自己的语言模型。我认为这是因为苹果公司通常以前沿和追求完美而自豪,而现阶段的语言模型都相当粗糙和不完美。

因此,这是苹果首次公布大模型的消息,他们也有计划在最新的 iOS、MacOS 操作系统上率先试水。这让我对该功能产生了一些疑问,特别是:

  • 该功能的底层模型是什么?

  • 它的架构是什么?

  • 使用了哪些数据来训练模型?

在花了一些时间思考这些问题后,我找到了一些答案,但许多细节仍然不清楚。如果您能找到答案,请与我联系!

该功能如何运作?

安装 macOS beta 后,我立即打开 Notes 应用程序并开始打字。尽管尝试了许多不同的句子结构,但该功能的出现频率通常低于我的预期。它主要是完成单个单词。

该功能有时也会一次建议多个单词,但这通常仅限于即将出现的单词非常明显的情况,类似于 Gmail 中的自动完成功能。

ios模型有哪几部分组成

我们可以更深入地挖掘吗?

找到模型本身有点困难,但我最终发现 AppleSpell 使用了该模型,AppleSpell 是一个内部 macOS 应用程序,可以在打字时检查拼写和语法错误。在 xpcspy 的帮助下,我编写了一个 Python 脚本,该脚本可以监听 AppleSpell 活动,并在在任何应用程序中键入时从预测文本模型中传输最可能的建议。

不幸的是,我在夏天早些时候在第一个 macOS Sonoma beta 上编写了这个脚本。在随后的测试版之一(我不确定是哪一个)中,Apple 从 AppleSpell 发送的 XPC 消息中删除了未使用的补全。我无法从这些完成中收集太多有关模型行为的信息,但这仍然是一个很酷的发现。

模型在哪里?

经过更多挖掘后,我很确定我在 /System/Library/LinguisticData/RequiredAssets_en.bundle/AssetData/en.lm/unilm.bundle 中找到了预测文本模型。该捆绑包包含在键入时使用的多个 Espresso 模型文件(Espresso 似乎是在模型上运行推理的 CoreML 部分的内部名称)。我最终无法对模型进行逆向工程,但我相当有信心这是保存预测文本模型的地方。原因如下:

  • unilm.bundle 中的许多文件在 macOS Ventura (13.5) 上不存在,但在 macOS Sonoma beta (14.0) 上确实存在。两个版本中确实存在的文件都已在索诺玛中更新。

  • sp.dat 是 unilm.bundle 中的文件之一,存在于 Ventura 上,但已在 Sonoma beta 中更新。在该文件的更新版本中,我发现看起来非常明显像是标记器的一组标记。

  • sp.dat 中的标记数量与 unilm_joint_cpu.espresso.shape 和 unilm_joint_ane.espresso.shape(ANE = Apple Neural Engine)中输出层的形状相匹配,unilm.bundle 中的两个文件描述了 Espresso/CoreML 模型。这就是我们期望看到的经过训练来预测下一个标记的模型。

  • 预测文本模型的 tokenizer

    我在 unilm.bundle/sp.dat 中发现了一组15,000个标记,很明显它们构成了大型语言模型的词汇集。于是我编写了一个脚本,可以用它来亲自查看这个词汇文件。

    词汇表以 <pad>、<s>、</s> 和 标记开头,这些标记都是相当常见的特殊标记(roberta-base 和 t5-base 是两种流行的语言模型):

    接下来是以下序列:

    • 20个特殊 token ,名为 UniLMCTRL0到 UniLMCTRL19

    • 79次缩减(I’d, couldn’t, you’ve…)

    • 1个特殊 _U_CAP_ token

    • 20个特殊 token,名为 _U_PRE0_ 到 _U_PRE19_

    • 60个特殊 token,名为 _U_NT00_ 到 _U_NT59_

    • 100个表情符号

    11代酷睿 cpuz

    然后是一个看起来更正常的列表,包含14,716个 token,其中大多数后面跟着特殊字符 (U+9601),该字符常用于字节对编码 (BPE) tokenizer,例如 GPT-2tokenizer , 表示一个空格。

    我不得不说,这个词汇文件让我觉得非常独特,但对于在此设置中部署的语言模型来说,这绝对不是不可能的。我个人从未见过表情符号在语言模型的 tokenizer 中如此突出,但现有研究表明特定领域的模型和 tokenizer 可以极大地提高下游模型的性能。因此,经过训练用于文本消息等内容(其中会大量使用表情符号和缩写)的模型会优先考虑它们,这是有道理的。

    模型架构

    魔兽世界80级猎人天赋

    根据前面 unilm_joint_cpu 模型的内容,我们可以对预测文本网络做出一些假设。尽管它从2019年开始共享 Microsoft UniLM 的名称,但在我看来,它更像是基于 GPT-2的模型。

    GPT-2有四个主要部分:token 嵌入、位置编码、一系列12-48解码器块和输出层。unilm_joint_cpu 描述的网络似乎是相同的,只是只有6个解码器块。每个解码器块中的大多数层都有类似 gpt2_transformer_layer_3d 的名称,这似乎也表明它基于 GPT-2架构。

    根据我根据每层大小的计算,Apple 的预测文本模型似乎有大约3400万个参数,并且它的隐藏大小为512个单位。这使得它比 GPT-2的最小版本还要小得多。

    对于预测文本功能的有限范围,这对我来说是有意义的。苹果想要一种能够非常快速、非常频繁地运行的模型,而不会耗尽设备的大量电池。当我测试预测文本功能时,建议几乎在我输入时立即出现,从而带来了出色的用户体验。虽然模型的大小有限意味着它不能很好地编写完整的句子或段落,但当它对下一个或两个单词表现出非常高的置信度时,它们可能足以向用户提供建议。

    然而,通过我的脚本来监听 AppleSpell 的活动,我们无论如何都可以让模型写出完整的句子。如果我输入“今天”作为句子的第一个单词,并每次都采用模型的最佳建议,这就是我得到的结果:

    Today is the day of the day and the day of the week is going to be a good thing I have to do is get a new one for the next couple weeks and I think I have a lot of…

    不太鼓舞人心。我们可以将其与最小 GPT-2模型的输出进行比较:

    Today, the White House is continuing its efforts against Iran to help the new President, but it will also try to build new alliances with Iran to make more…

    或者最大的 GPT-2模型:

    Today, the U.S. Department of Justice has filed a lawsuit against the city of Chicago, the Chicago Police Department, and the city’s Independent Police Review Authority, alleging that the police department and the Independent Police Review Authority engaged in a pattern or practice…

    看到所有这些额外参数的效果真是太酷了!我很好奇这个功能在未来如何发展和演变,以及苹果是否决定保持其范围狭窄或有一天扩大其功能,这将会很有趣。

    如果您有兴趣亲自尝试其中任何一个,我的所有代码都在 GitHub:https://github.com/jackcook/predictive-spy


    返回网站首页

    本文评论
    ai癌症诊断龙头上市公司「AI并不“万能”:ChatGPT给出癌症治疗方案被指漏洞百出」
    快科技8月27日消息,近日,《美国医学会肿瘤学杂志》刊登的一篇研究报告指出,ChatGPT生成的癌症治疗方案漏洞百出,毫无参考意义。比亚迪 汉 风阻据悉,该研究来自哈佛医学院附属的布...
    日期:08-27
    华为5g芯片谁发明的「华为5G新手机芯片怎么来的?郭正亮曝“美国判断”」
    特斯拉黑色款model Y 华为官方虽然未在产品页面列出Mate 60 Pro的处理器信息,同时也并未说明是否支持5G网络,但是Mate 60 Pro实测已经到了5G的标准。对此,台湾地区前“立委”郭...
    日期:09-03
    一加Ace 2 Pro更多规格曝光:配备静音滑块,支持红外遥控「一加pro测评」
    据推特数码博主 @Yogesh Brar 爆料,一加 Ace 2 Pro 的规格几乎全部曝光。这款手机将拥有一块6.74英寸的1.5K曲面OLED屏幕(120赫兹),采用高通骁龙8 Gen 2处理器,最高内存可达16GB...
    日期:06-21
    北漂16年回家的文章「北漂逃回老家县城的同学,比我更敢花钱」
    声明:本文来自于微信公众号 五环外(ID:wuhuanoutside),作者:镜子,授权转载发布。县城消费大翻身今年春节期间,#被家乡县城的发展震惊#这一话题在社交媒体引发热议,县城商业面貌的...
    日期:02-10
    严把网络安全关|CIS 2020天威诚信精彩亮相
      12月29日,CIS 2020网络安全创新大会在上海正式开幕,本次大会由FreeBuf、赛博研究院、上海市信息安全行业协会联合主办。“数字转型,安全超频”——从FIT到CIS,再到CIS第二...
    日期:07-16
    俄媒:中国智能手机在俄销量激增(中国手机在俄罗斯销量)
    参考消息网8月13日报道 据今日俄罗斯电视台网站报道,俄罗斯《生意人报》11日援引行业数据报道,中国品牌已经挤掉世界最大智能手机销售商苹果和三星,占据了俄罗斯智能手机市场的...
    日期:08-15
    德邦二季度打了场“翻身仗” 管理层人员已开始调整「德邦副经理」
      21世纪经济报道记者曹恩惠 上海报道丰田皇冠SuV  8月24日晚间,“快运第一股”德邦股份(603056.SH)公布了上半年的业绩成绩单。  半年报显示,该公司报告期内实现营业收入...
    日期:08-27
    拒绝千篇一律!iQOO微信红包封面让新年祝福与众不同
      2021年2月3日,深圳——自古以来,红包可以说是春节期间必不可少的祝福方式,以此为家人或者朋友送去美好的祝愿。近年来,微信红包凭借有趣又生动的玩法,已然成为一种新型的发...
    日期:07-16
    iPhone 15系列四款机型标配三星M12材质:但Pro版独享高刷新率「a14三星5nm」
    快科技4月11日消息,据Elec报道,今年iPhone 15系列四款机型将全部使用三星最新的M12材质。乐视超级电视x50在上一代iPhone 14系列上,iPhone 14 Pro和14 Pro Max使用了三星M12材...
    日期:04-11
    工联院大模型测评:文心一言在工业领域表现超过GPT3.5「文心工作室」
    6月29日 消息:近期,中国工业互联网研究院针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。结果显示,百度文心一言表现超过GPT3.5,综合评价指数在国内排名第一...
    日期:06-29
    全球焕新企业战略和技术战略-推出新品牌形象 诺基亚宣布_诺基亚转型案例
    2月27日消息,在西班牙巴塞罗那举行的2023年世界移动通信大会上,诺基亚宣布重塑企业战略和技术战略,同时推出全新企业品牌形象。诺基亚总裁、首席执行官龙培凯(Pekka Lundmark)表...
    日期:09-19
    淄博张店烧烤店「淄博张店烧烤倡议高考停业三天 车辆尽量绕开考点」
    在高考即将到来之际,山东淄博张店区烧烤协会发布了《致全体烧烤经营业主的倡议书》。百度app元旦红包苹果新一代iphone降价传闻倡议书包括以下内容:从6月6日晚至9日晚,各烧烤...
    日期:06-06
    不让三星独美 索尼1亿像素传感器来了:可惜不是1英寸大底「索尼1亿像素相机」
    快科技4月23日消息,手机拍照传感器有2个技术方向,一个是高像素,一个大底,三星选择了前者,不仅推出了1亿像素,2亿像素的传感器都有了,而索尼选择了大底,1英寸大底传感器已经成为三大...
    日期:04-24
    苹果 Apple Music、Apple TV 和 iCloud 照片整合即将登陆 Windows 平台_苹果手机相册和icloud
    10月13日消息:微软宣布,专用的Apple Music和Apple TV应用程序将于明年在Windows设备上提供。该公司还宣布,iCloud照片整合将于今年晚些时候在Windows11设备的照片应用中出现。...
    日期:10-15
    虎扑下架为什么_虎扑App被下架
      (原标题: 原因未知)      3月24日,#虎扑App被下架#登上微博热搜榜,据众多网友反映,虎扑App在苹果App Store被下架,仅能搜索到虎扑旗下另一款应用“识货”。目前,虎扑App...
    日期:03-20
    llvm开源「LLM Guard:增强LLM安全性的开源工具包 安全使用各种等模型」
    文章概要:1. LLM Guard是一个旨在增强大型语言模型(LLMs)安全性的工具包,可轻松集成和部署在生产环境中。2. 它提供了广泛的评估器,用于LLMs的输入和输出,包括清理、检测有害语言...
    日期:09-19
    孩子感冒被药店开800多元药品 药店:已退款「药店小孩感冒药有哪些」
    6月26日消息,上海一女子称孩子感冒,药店给其开了八百多元药品。英特尔i9-13900k首发测试收据显示,药店共开了4盒口服液,5盒止咳合剂和3盒蓝芩颗粒。每盒药品单价约为46元到67元...
    日期:06-26
    核桃编程行业首发10后少儿编程学习者报告 解密中国少年的AI时代_核桃编程的课程
      3月25日,少儿编程教育机构核桃编程召开“10后真相线上发布会”,正式发布国内首份《新10后Coder观察报告》(以下简称“报告”),这是少儿编程行业首份以10后青少年学习者为...
    日期:09-12
    隧道 马斯克「马斯克为城市拥堵支招:隧道是答案」
    11月14日消息,马斯克在线上出席了印尼二十国集团工商峰会,演讲中,马斯克谈到了交通堵塞问题,他认为解决城市拥堵的唯一答案就是隧道。在汽车高速发展的今天,从燃油车到新能源汽车...
    日期:11-18
    女子高铁上嫌吵用热水泼小孩 广铁回应:孩子无红肿起泡 已将双方移交处理
    日前有网友爆料称,一名女子在高铁上嫌弃小孩吵闹,用热水泼小孩,随后还辩称水是列车上接的,烫也是列车烫的,引发众怒。今天中午,广铁集团广九客运段官微也发布了公告,提供了此次事件...
    日期:06-30