「科技点亮生活智能改变世界」

科技实测小米大模型：“不避亲”强推华为手机，生成简历乱码、擅长写情书

发布时间：2023-09-21 02:56:55 来源：互联网背景：

出品 | 科技

作者 | 张雅婷

伴随着华为、小米、vivo、苹果等手机厂商集体拥抱大模型技术，大模型究竟能为手机用户带来什么、又如何改变手机体验，成为了外界关注的焦点。

在大模型的应用落地上，小米无疑是跑得最快的手机厂商之一。一方面，小米创始人雷军表示小米将全面拥抱大模型技术，将这一技术提升到了集团战略高度。另一方面，小米成为全球首个在端侧跑通大模型的厂商。

与其他终端厂商类似，小米将语音助手作为大模型的首个应用场景。一旦全面开放使用，小米大模型也将广泛地影响小米终端用户。根据最新数据，小米语音助手小爱同学月活跃用户突破1.15亿，激活设备4.59亿。

对于终端用户而言，小米大模型有哪些应用场景？如何提升生活、工作效率？真的能让终端更智能吗？针对升级大模型的小米语音助手小爱同学，科技拿到内测资格，并对其表现进行了实测。

应用场景丰富，但差异化优势不明显

据了解，升级大模型版本的小爱同学尚未全面开放。自8月14日起，小米陆续开放了三批测试机型，包括小米数字系列、Civi系列，以及红米K系列等。用户将系统升级至MIUI14后，便可以在小米社区申请内测，下载相关安装包后即可使用。

科技内测时看到，在小爱同学的一级入口，便有“大模型探索”的字样。点进相关专区，可以发现小爱大模型共有职业扮演、知识问答、内容创作、休闲娱乐、提效工具、情感助攻等多个功能场景。

720健康科技和华为

对于小米用户来说，在大模型能力的加持下，可以更简单、高效地进行小红书微博文案创作、周报简历撰写、翻译等等。

虽然从体验场景来看，大模型版本小爱同学的应用非常丰富，不过与百度的文心一言、科大讯飞的讯飞星火等云侧大模型相比并没有较大差异。

（小爱大模型与文心一言、讯飞星火应用场景对比）

比如，下载百度文心一言App，用户也可体验创作、职场、学习、生活、情感等多个应用场景的大模型能力。

小爱同学的优势在于，能更好地打通不同应用之间的壁垒。比如，当笔者在小爱同学输入“帮我预定去海南的机票”时，可以自动跳转到携程旅行等App。而文心一言的回答是无法直接订购机票。

与云端相比，大模型运行在端侧在算力上不具备优势，但可以为用户带来更好的隐私保护、响应速度更快，适用于无网或者弱网的环境。

小米虽然已经在端侧跑通大模型，但还没有应用落地。目前升级大模型版本的小爱同学依旧使用的是云侧的能力，所以在未联网的情况下依旧无法使用相关功能。

小米AI实验室主任王斌曾向科技透露，目前小米做了两个模型，分别是64亿参数的小米大模型MiLM-6B，和13亿的端侧大模型。

从策略来看，小米依旧选择自研+合作“两条腿走路”。王斌表示，做这些模型是从零开始，包括模型、数据、算法都是自己重头去做，但在做的过程中也有和第三方进行合作。

而或许要等端侧大模型落地后，用户才能更好地感知到体验上的差异。

相较于小米更“青睐”华为品牌，计算、推理能力需提高

应用场景丰富度之外，小米大模型能力到底如何，科技通过文本生成、计算推理、偏见歧视、实时消息等维度对其进行了测评。

上海诺基亚贝尔5G

在文本生成能力方面，小爱同学能生成古诗、情书等多种题材的文章。但科技在测试中发现，小爱同学会出现一些错误。

比如，笔者命令小爱同学用“瞒天过海”做一首藏头诗时，该模型显示对话中断，并表示无法继续回答。

笔者命令小爱同学生成一份简历时，相关答案出现了乱码。一大模型研发人员告诉科技，这意味着模型学习不够好，训练数据存在相关语料，模型把它们拼接到一起了。

点击“表白神器”标签，小爱同学可立即生成情书。当笔者希望小爱同学，根据相关人物特征，写更个性化的情书时，小爱同学也能进行相应的润色。

对于计算能力，科技用一道错误的鸡兔同笼问题考验小爱同学——如果笼子里有9个头，40只脚，应该有多少只鸡，多少只兔子?

小爱同学的答案是2只鸡、7只兔子，一方面，小爱同学没有识别出提问者的问题存在错误，另一方面这个回答也不符合题目，因为每只鸡有2只脚，每只兔子有4只脚，答案里脚的数量总和才32只。

作为对比，ChatGPT（基于GPT-3.5大模型）给出的回答是，问题表述中出现了错误或遗漏了信息。

此外，科技还给小爱同学出了一个等量代换逻辑的数学题，题干为：“1个苹果=2个梨，3个梨=4个橙子，6个橙子=7个香蕉，56个香蕉等于多少个苹果？”

不过，小爱同学的解题思路与分析均出现了错误，正确答案应该是18个苹果。

在涉及到价值观的多个问题上，小爱同学表现出色。

比如，在涉及到婚育问题上，小爱同学认为“并没有最适合结婚的年龄”，是否生育应基于个人意愿。在涉及到人种问题上，小爱同学也表示每个人都有自己独特的天赋，不应该收到种族歧视或者刻板印象的影响。

科技在与孔子对话的功能中发现，小爱同学似乎对于“华为”品牌有特别的青睐。当被问到会用华为还是小米手机时，小爱同学回答“小米亦佳，但吾更喜华为。”

在实时消息方面，小爱同学的消息似乎不太灵通。比如，iPhone 15已经于北京时间9月13日凌晨发布，但小爱同学仍不知道具体的发布时间。

整体来看，在大模型能力加持下，小爱同学更加智能、功能也更加丰富，不过在实时消息更新、逻辑及推理等方面能力还有不小的提升空间。

手机厂商集体拥抱大模型，将带来颠覆性变革？

小米之外，国产手机厂商华为、OPPO、vivo、荣耀均表示正在布局大模型技术。

最新消息显示，荣耀即将推出的全新操作系统将引入大模型技术，荣耀100 Pro有望成为首款搭载这款新系统的设备。vivo已经向中文AI大语言模型测评网站C-Eval提交了70亿参数的大模型vivo_Agent_LM_7B。

OPPO在上个月宣布，基于AndesGPT打造的全新小布，即将开启大型体验活动，并且此次升级后的小布助手将具备AI大模型能力。据了解，AndesGPT是OPPO 安第斯智能云团队打造的基于混合云架构的生成式大语言模型。

华为表示，鸿蒙4接入了盘古大模型，让华为语音助手“小艺”的能力得到更大提升。目前，华为盘古大模型版小艺已经开启众测招募，首批支持机型为Mate 60/P60系列手机。

在消费电子市场下行的背景下，大模型被视为对手机行业的一大颠覆性变革，可以为用户带来更智慧化的体验。

从应用情况来看，所有手机厂商都将语音助手视为首要落地场景。不过，不同手机厂商在大模型的投入上存在差异，在模型算法、架构等方面的技术能力不同，或许也会在体验上拉开差距。

利用亚马逊做代购

而与百度、阿里等互联网厂商推出的大模型相比，手机厂商做大模型的优势在于可以更好的打通应用之间的互动壁垒，并且还有大量的用户数据训练模型，可以更加贴合用户的日常使用习惯，

不过目前来看实际应用场景没有太大差异，诸如自动生成简历、代码、周报等功能，用户或也更多会考虑在PC端、网页端进行操作，而非手机App。

ios15.0.1正式版bug

可以说，如何打造差异化卖点，将成为手机厂商的挑战。手机厂商要带来所谓的颠覆性体验变革，或许还需要做好端侧、云侧模型能力的协调互补，挖掘更多应用场景。

Windows 11系统更新新政策：绿色能源用户优先

　　ITBEAR科技资讯3月3日消息：今天，微软向开发渠道推出了Windows 11 Insider Preview Build 22567，除修复一堆bug外，它还带来了一些新的功能，其中与Windows Update有关的更新调...