您的位置:首页 > 互联网

科技实测小米大模型:“不避亲”强推华为手机,生成简历乱码、擅长写情书

发布时间:2023-09-21 02:56:55  来源:互联网     背景:

出品 | 科技

作者 | 张雅婷

伴随着华为、小米、vivo、苹果等手机厂商集体拥抱大模型技术,大模型究竟能为手机用户带来什么、又如何改变手机体验,成为了外界关注的焦点。

在大模型的应用落地上,小米无疑是跑得最快的手机厂商之一。一方面,小米创始人雷军表示小米将全面拥抱大模型技术,将这一技术提升到了集团战略高度。另一方面,小米成为全球首个在端侧跑通大模型的厂商。

与其他终端厂商类似,小米将语音助手作为大模型的首个应用场景。一旦全面开放使用,小米大模型也将广泛地影响小米终端用户。根据最新数据,小米语音助手小爱同学月活跃用户突破1.15亿,激活设备4.59亿。

对于终端用户而言,小米大模型有哪些应用场景?如何提升生活、工作效率?真的能让终端更智能吗?针对升级大模型的小米语音助手小爱同学,科技拿到内测资格,并对其表现进行了实测。

应用场景丰富,但差异化优势不明显

据了解,升级大模型版本的小爱同学尚未全面开放。自8月14日起,小米陆续开放了三批测试机型,包括小米数字系列、Civi系列,以及红米K系列等。用户将系统升级至MIUI14后,便可以在小米社区申请内测,下载相关安装包后即可使用。

科技内测时看到,在小爱同学的一级入口,便有“大模型探索”的字样。点进相关专区,可以发现小爱大模型共有职业扮演、知识问答、内容创作、休闲娱乐、提效工具、情感助攻等多个功能场景。

720健康科技和华为

对于小米用户来说,在大模型能力的加持下,可以更简单、高效地进行小红书微博文案创作、周报简历撰写、翻译等等。

虽然从体验场景来看,大模型版本小爱同学的应用非常丰富,不过与百度的文心一言、科大讯飞的讯飞星火等云侧大模型相比并没有较大差异。

(小爱大模型与文心一言、讯飞星火应用场景对比)

比如,下载百度文心一言App,用户也可体验创作、职场、学习、生活、情感等多个应用场景的大模型能力。

小爱同学的优势在于,能更好地打通不同应用之间的壁垒。比如,当笔者在小爱同学输入“帮我预定去海南的机票”时,可以自动跳转到携程旅行等App。而文心一言的回答是无法直接订购机票。

与云端相比,大模型运行在端侧在算力上不具备优势,但可以为用户带来更好的隐私保护、响应速度更快,适用于无网或者弱网的环境。

小米虽然已经在端侧跑通大模型,但还没有应用落地。目前升级大模型版本的小爱同学依旧使用的是云侧的能力,所以在未联网的情况下依旧无法使用相关功能。

小米AI实验室主任王斌曾向科技透露,目前小米做了两个模型,分别是64亿参数的小米大模型MiLM-6B,和13亿的端侧大模型。

从策略来看,小米依旧选择自研+合作“两条腿走路”。王斌表示,做这些模型是从零开始,包括模型、数据、算法都是自己重头去做,但在做的过程中也有和第三方进行合作。

而或许要等端侧大模型落地后,用户才能更好地感知到体验上的差异。

相较于小米更“青睐”华为品牌,计算、推理能力需提高

应用场景丰富度之外,小米大模型能力到底如何,科技通过文本生成、计算推理、偏见歧视、实时消息等维度对其进行了测评。

上海诺基亚贝尔5G

在文本生成能力方面,小爱同学能生成古诗、情书等多种题材的文章。但科技在测试中发现,小爱同学会出现一些错误。

比如,笔者命令小爱同学用“瞒天过海”做一首藏头诗时,该模型显示对话中断,并表示无法继续回答。

笔者命令小爱同学生成一份简历时,相关答案出现了乱码。一大模型研发人员告诉科技,这意味着模型学习不够好,训练数据存在相关语料,模型把它们拼接到一起了。

点击“表白神器”标签,小爱同学可立即生成情书。当笔者希望小爱同学,根据相关人物特征,写更个性化的情书时,小爱同学也能进行相应的润色。

对于计算能力,科技用一道错误的鸡兔同笼问题考验小爱同学——如果笼子里有9个头,40只脚,应该有多少只鸡,多少只兔子?

小爱同学的答案是2只鸡、7只兔子,一方面,小爱同学没有识别出提问者的问题存在错误,另一方面这个回答也不符合题目,因为每只鸡有2只脚,每只兔子有4只脚,答案里脚的数量总和才32只。

作为对比,ChatGPT(基于GPT-3.5大模型)给出的回答是,问题表述中出现了错误或遗漏了信息。

此外,科技还给小爱同学出了一个等量代换逻辑的数学题,题干为:“1个苹果=2个梨,3个梨=4个橙子,6个橙子=7个香蕉,56个香蕉等于多少个苹果?”

不过,小爱同学的解题思路与分析均出现了错误,正确答案应该是18个苹果。

在涉及到价值观的多个问题上,小爱同学表现出色。

比如,在涉及到婚育问题上,小爱同学认为“并没有最适合结婚的年龄”,是否生育应基于个人意愿。在涉及到人种问题上,小爱同学也表示每个人都有自己独特的天赋,不应该收到种族歧视或者刻板印象的影响。

科技在与孔子对话的功能中发现,小爱同学似乎对于“华为”品牌有特别的青睐。当被问到会用华为还是小米手机时,小爱同学回答“小米亦佳,但吾更喜华为。”

在实时消息方面,小爱同学的消息似乎不太灵通。比如,iPhone 15已经于北京时间9月13日凌晨发布,但小爱同学仍不知道具体的发布时间。

整体来看,在大模型能力加持下,小爱同学更加智能、功能也更加丰富,不过在实时消息更新、逻辑及推理等方面能力还有不小的提升空间。

手机厂商集体拥抱大模型,将带来颠覆性变革?

小米之外,国产手机厂商华为、OPPO、vivo、荣耀均表示正在布局大模型技术。

最新消息显示,荣耀即将推出的全新操作系统将引入大模型技术,荣耀100 Pro有望成为首款搭载这款新系统的设备。vivo已经向中文AI大语言模型测评网站C-Eval提交了70亿参数的大模型vivo_Agent_LM_7B。

OPPO在上个月宣布,基于AndesGPT打造的全新小布,即将开启大型体验活动,并且此次升级后的小布助手将具备AI大模型能力。据了解,AndesGPT是OPPO 安第斯智能云团队打造的基于混合云架构的生成式大语言模型。

华为表示,鸿蒙4接入了盘古大模型,让华为语音助手“小艺”的能力得到更大提升。目前,华为盘古大模型版小艺已经开启众测招募,首批支持机型为Mate 60/P60系列手机。

在消费电子市场下行的背景下,大模型被视为对手机行业的一大颠覆性变革,可以为用户带来更智慧化的体验。

从应用情况来看,所有手机厂商都将语音助手视为首要落地场景。不过,不同手机厂商在大模型的投入上存在差异,在模型算法、架构等方面的技术能力不同,或许也会在体验上拉开差距。

利用亚马逊做代购

而与百度、阿里等互联网厂商推出的大模型相比,手机厂商做大模型的优势在于可以更好的打通应用之间的互动壁垒,并且还有大量的用户数据训练模型,可以更加贴合用户的日常使用习惯,

不过目前来看实际应用场景没有太大差异,诸如自动生成简历、代码、周报等功能,用户或也更多会考虑在PC端、网页端进行操作,而非手机App。

ios15.0.1正式版bug

可以说,如何打造差异化卖点,将成为手机厂商的挑战。手机厂商要带来所谓的颠覆性体验变革,或许还需要做好端侧、云侧模型能力的协调互补,挖掘更多应用场景。


返回网站首页

本文评论
Windows 11系统更新新政策:绿色能源用户优先
  ITBEAR科技资讯3月3日消息:今天,微软向开发渠道推出了Windows 11 Insider Preview Build 22567,除修复一堆bug外,它还带来了一些新的功能,其中与Windows Update有关的更新调...
日期:03-13
抖音电商一年成交额「抖音电商:过去一年优质内容创作者增长484%」
2月8日消息,抖音电商披露最新数据,截至去年10月,抖音电商优质内容创作者数量较年初增长484%;平台挖掘优质短视频超147万条,助力超26万名创作者人均流量增长56%,GMV提升5%-10%。抖...
日期:02-09
男子卖3套房换别墅 刚到手就后悔 隐藏成本太高了「卖出去一套别墅会提成多少」
一房东称,他的租客在租住他的公寓后,将自己、父母和妻子的房子全部卖掉,打算购买一套三层别墅。然而,租客在购买了别墅后却后悔了,主要原因是装修费用高、防虫问题、日常维护费用...
日期:07-07
美股周五:三大股指连跌三周,英伟达再跌逾2%,拼多多5天涨25%_美股连创新高今天
美国时间周五,美股收盘主要股指全线下跌,三大股指本周均下跌3%以上,且连续第三周下跌。此前美国公布了8月非农就业数据,并未改变美联储将在9月底大幅加息的预期。道琼斯指数收于...
日期:10-07
oppo手机a1参数「1999元!OPPO A1手机开启预售:120Hz高刷高亮屏 12GB大运存」
OPPO A1 5G手机已经开始同步在线上线下预售,售价为1999元。这款手机拥有多种特点,包括素皮材质、5000mAh大电池和67W超级闪充等功能。网络创业培训电商vivox90标准版是什么芯...
日期:04-11
就地过年春节活动_就地过年氛围组已就位,一起打卡最特别的春节
今年过年不问对象不问房,只问: 核酸做了吗? 机票火车票退了吗? 还回家过年吗?   受疫情影响,今年春节的返乡之旅注定要经历“九九八十一难”。即使排除万难,成功回家跟父母团...
日期:07-10
美股集体收高!纳指涨超2%「美股周三:纳指跌超1.5%,主要中概股普跌,小鹏跌逾10%」
美国时间周三,美股收盘主要股指全线下跌,科技股领跌。美国10月份零售销售强劲,再次引发人们对美联储加息步伐的担忧。道琼斯指数收于33553.83点,下跌39.09点,跌幅0.12%;标准普尔50...
日期:11-29
乌尔善导演电影票房破50亿:其中《封神》票房超25亿_乌尔善封神三部曲投资
9月17日消息,灯塔专业版数据显示,乌尔善导演电影票房突破50亿。dram涨价概念股每日优鲜订单存在风险被取消据悉,乌尔善执导主要作品包括《封神第一部》、《寻龙诀》、《画皮2》...
日期:09-17
马化腾内部邮件反思3Q大战:要超越眼前得失(马化腾谈3q大战)
  9月30日消息,持续约有两年的3Q大战昨日正式终审宣判,腾讯公司董事局主席兼首席执行官马化腾随后在公司内部邮件中谈及此事,号召员工在这场纷争中反思,学会倾听、接受批评,超...
日期:07-23
董宇辉回村放烟花 衣服烧了几个洞 网友:过年开心就好
去年,因为知识型带货风格,东方甄选的主播董宇火出圈。对饮食业,商业,娱乐业举办的啤酒屋tcl收购中环集团对tcl是利好吗马斯克退出推特除夕夜,董宇辉在微博晒出自己回到农村老家...
日期:01-24
2022天猫双十一养猫活动入口在哪  双11养猫活动玩法及红包攻略_双十二有养猫活动吗
今年双十一,天猫不玩盖楼了,改玩养猫游戏。通过玩这个游戏,用户可以领到不少红包优惠券福利。双11养猫活动入口:1、打开手机淘宝app,在首页即可看到“双11喵果总动员”活动入口,...
日期:11-01
我闯进每日优鲜 见到讨债讨薪和继续坚守的人
来源:亿邦动力网   文丨董金鹏 陈凯乐   [亿邦原创]烈焰照耀着喜马拉雅,雪山像披肩一样搭在身上,皓白,安谧,明澈,如同从天堂坠落的钻石。突然,一声巨响,倾泻而下,雪崩了。用放大...
日期:07-31
华为y511_华为Y511-U00
是一款华为公司在2013年推出的智能手机,该手机备受消费者的追捧,主要是因为其绝佳的性能和优良的外观设计。下面我们将针对的相关特点做一些详细的介绍。首先,从外观设计方面来...
日期:05-31
吴声年度演讲:对话时代,具体生活大于想象「吴声2021」
来源:吴声造物2023年8月6日,一年一度的立秋演讲「新物种爆炸·吴声商业方法发布2023」,在751·D Park北京时尚设计广场97罐举行。第7届新物种爆炸主题为「风再起时」,场景方法论...
日期:08-06
有没有单胎变双胞胎的「单胎、双胞胎变三胞胎孕妇懵了 专家科普罕见现象」
据报道,宁波黄女士和她丈夫在发现怀孕之后本来很高兴,然而医院检查之后又让他们很担心,第一次B超发现是单胎,第二次发现是双胞胎,第三次又变成了三胞胎。但是三胞胎中有一个已经...
日期:06-07
意大利jc「继短暂禁用 ChatGPT ,意大利监管机构审查其他AI系统」
5月23日 消息:一名高级官员表示,意大利数据保护局Garante计划审查其他人工智能平台,并聘请人工智能专家。该机构在3月份暂时禁止ChatGPT后,加强了对这项强大技术的审查。Garant...
日期:05-23
二手行业标准再上新台阶,闪回科技参与起草的多项团标正式发布
7 月 20 日,由电信终端产业协会(TAF)牵头起草的《循环移动终端系列测试方法》系列团体标准正式发布,这一系列标准的发布将推动二手行业标准再上新台阶,让循环回收商品市场向着...
日期:07-24
AI芯片需求强劲 台积电再投资28亿美元建厂「台积电芯片产能」
7月25日 消息:据CNBC报道,半导体制造公司台积电计划在中国台湾省新投资近900亿新台币(约28.7亿美元)建设一个先进的芯片封装厂。这是台积电寻求利用人工智能热潮的举措之一。台...
日期:07-25
鲸算科技直播助农,单场销售1200箱黄果柑
  2020年3月7日-9日,鲸算科技联合中国扶贫基金会线上直播销售黄果柑,助力灾后重建地区之雅安石棉县农户致富。   黄果柑,也被称为“阳光金果”,在石棉县,这里的年日照时长...
日期:02-12
将投放花在刀刃上?你需要重新思考Last Click_什么要花在刀刃上
  “我知道我的广告费浪费了一半,问题是我不知道浪费掉的是哪一半”,约翰·沃纳梅克提出的这个问题困扰了广告业整整一个世纪。秒针系统在今年3月发布的《2020中国异常...
日期:10-28