出品 | 科技
作者 | 张雅婷
伴随着华为、小米、vivo、苹果等手机厂商集体拥抱大模型技术,大模型究竟能为手机用户带来什么、又如何改变手机体验,成为了外界关注的焦点。
在大模型的应用落地上,小米无疑是跑得最快的手机厂商之一。一方面,小米创始人雷军表示小米将全面拥抱大模型技术,将这一技术提升到了集团战略高度。另一方面,小米成为全球首个在端侧跑通大模型的厂商。
与其他终端厂商类似,小米将语音助手作为大模型的首个应用场景。一旦全面开放使用,小米大模型也将广泛地影响小米终端用户。根据最新数据,小米语音助手小爱同学月活跃用户突破1.15亿,激活设备4.59亿。
对于终端用户而言,小米大模型有哪些应用场景?如何提升生活、工作效率?真的能让终端更智能吗?针对升级大模型的小米语音助手小爱同学,科技拿到内测资格,并对其表现进行了实测。
应用场景丰富,但差异化优势不明显
据了解,升级大模型版本的小爱同学尚未全面开放。自8月14日起,小米陆续开放了三批测试机型,包括小米数字系列、Civi系列,以及红米K系列等。用户将系统升级至MIUI14后,便可以在小米社区申请内测,下载相关安装包后即可使用。
科技内测时看到,在小爱同学的一级入口,便有“大模型探索”的字样。点进相关专区,可以发现小爱大模型共有职业扮演、知识问答、内容创作、休闲娱乐、提效工具、情感助攻等多个功能场景。
720健康科技和华为
对于小米用户来说,在大模型能力的加持下,可以更简单、高效地进行小红书微博文案创作、周报简历撰写、翻译等等。
虽然从体验场景来看,大模型版本小爱同学的应用非常丰富,不过与百度的文心一言、科大讯飞的讯飞星火等云侧大模型相比并没有较大差异。
(小爱大模型与文心一言、讯飞星火应用场景对比)
比如,下载百度文心一言App,用户也可体验创作、职场、学习、生活、情感等多个应用场景的大模型能力。
小爱同学的优势在于,能更好地打通不同应用之间的壁垒。比如,当笔者在小爱同学输入“帮我预定去海南的机票”时,可以自动跳转到携程旅行等App。而文心一言的回答是无法直接订购机票。
与云端相比,大模型运行在端侧在算力上不具备优势,但可以为用户带来更好的隐私保护、响应速度更快,适用于无网或者弱网的环境。
小米虽然已经在端侧跑通大模型,但还没有应用落地。目前升级大模型版本的小爱同学依旧使用的是云侧的能力,所以在未联网的情况下依旧无法使用相关功能。
小米AI实验室主任王斌曾向科技透露,目前小米做了两个模型,分别是64亿参数的小米大模型MiLM-6B,和13亿的端侧大模型。
从策略来看,小米依旧选择自研+合作“两条腿走路”。王斌表示,做这些模型是从零开始,包括模型、数据、算法都是自己重头去做,但在做的过程中也有和第三方进行合作。
而或许要等端侧大模型落地后,用户才能更好地感知到体验上的差异。
相较于小米更“青睐”华为品牌,计算、推理能力需提高
应用场景丰富度之外,小米大模型能力到底如何,科技通过文本生成、计算推理、偏见歧视、实时消息等维度对其进行了测评。
上海诺基亚贝尔5G
在文本生成能力方面,小爱同学能生成古诗、情书等多种题材的文章。但科技在测试中发现,小爱同学会出现一些错误。
比如,笔者命令小爱同学用“瞒天过海”做一首藏头诗时,该模型显示对话中断,并表示无法继续回答。
笔者命令小爱同学生成一份简历时,相关答案出现了乱码。一大模型研发人员告诉科技,这意味着模型学习不够好,训练数据存在相关语料,模型把它们拼接到一起了。
点击“表白神器”标签,小爱同学可立即生成情书。当笔者希望小爱同学,根据相关人物特征,写更个性化的情书时,小爱同学也能进行相应的润色。
对于计算能力,科技用一道错误的鸡兔同笼问题考验小爱同学——如果笼子里有9个头,40只脚,应该有多少只鸡,多少只兔子?
小爱同学的答案是2只鸡、7只兔子,一方面,小爱同学没有识别出提问者的问题存在错误,另一方面这个回答也不符合题目,因为每只鸡有2只脚,每只兔子有4只脚,答案里脚的数量总和才32只。
作为对比,ChatGPT(基于GPT-3.5大模型)给出的回答是,问题表述中出现了错误或遗漏了信息。
此外,科技还给小爱同学出了一个等量代换逻辑的数学题,题干为:“1个苹果=2个梨,3个梨=4个橙子,6个橙子=7个香蕉,56个香蕉等于多少个苹果?”
不过,小爱同学的解题思路与分析均出现了错误,正确答案应该是18个苹果。
在涉及到价值观的多个问题上,小爱同学表现出色。
比如,在涉及到婚育问题上,小爱同学认为“并没有最适合结婚的年龄”,是否生育应基于个人意愿。在涉及到人种问题上,小爱同学也表示每个人都有自己独特的天赋,不应该收到种族歧视或者刻板印象的影响。
科技在与孔子对话的功能中发现,小爱同学似乎对于“华为”品牌有特别的青睐。当被问到会用华为还是小米手机时,小爱同学回答“小米亦佳,但吾更喜华为。”
在实时消息方面,小爱同学的消息似乎不太灵通。比如,iPhone 15已经于北京时间9月13日凌晨发布,但小爱同学仍不知道具体的发布时间。
整体来看,在大模型能力加持下,小爱同学更加智能、功能也更加丰富,不过在实时消息更新、逻辑及推理等方面能力还有不小的提升空间。
手机厂商集体拥抱大模型,将带来颠覆性变革?
小米之外,国产手机厂商华为、OPPO、vivo、荣耀均表示正在布局大模型技术。
最新消息显示,荣耀即将推出的全新操作系统将引入大模型技术,荣耀100 Pro有望成为首款搭载这款新系统的设备。vivo已经向中文AI大语言模型测评网站C-Eval提交了70亿参数的大模型vivo_Agent_LM_7B。
OPPO在上个月宣布,基于AndesGPT打造的全新小布,即将开启大型体验活动,并且此次升级后的小布助手将具备AI大模型能力。据了解,AndesGPT是OPPO 安第斯智能云团队打造的基于混合云架构的生成式大语言模型。
华为表示,鸿蒙4接入了盘古大模型,让华为语音助手“小艺”的能力得到更大提升。目前,华为盘古大模型版小艺已经开启众测招募,首批支持机型为Mate 60/P60系列手机。
在消费电子市场下行的背景下,大模型被视为对手机行业的一大颠覆性变革,可以为用户带来更智慧化的体验。
从应用情况来看,所有手机厂商都将语音助手视为首要落地场景。不过,不同手机厂商在大模型的投入上存在差异,在模型算法、架构等方面的技术能力不同,或许也会在体验上拉开差距。
利用亚马逊做代购
而与百度、阿里等互联网厂商推出的大模型相比,手机厂商做大模型的优势在于可以更好的打通应用之间的互动壁垒,并且还有大量的用户数据训练模型,可以更加贴合用户的日常使用习惯,
不过目前来看实际应用场景没有太大差异,诸如自动生成简历、代码、周报等功能,用户或也更多会考虑在PC端、网页端进行操作,而非手机App。
ios15.0.1正式版bug
可以说,如何打造差异化卖点,将成为手机厂商的挑战。手机厂商要带来所谓的颠覆性体验变革,或许还需要做好端侧、云侧模型能力的协调互补,挖掘更多应用场景。