您的位置:首页 > 互联网

鸿蒙4里的大模型,能否撑起华为的野心?「鸿蒙4.0」

发布时间:2023-08-14 18:06:51  来源:互联网     背景:

声明:本文来自于微信公众号 AI新智能(ID:alpAIworks),作者:举大名耳,授权转载发布。

一个以大模型作为终极操作系统(AIOS)的AI时代,终将会统合分裂的物联网市场。

这几天,关于鸿蒙4的文章、报道,可谓沸沸扬扬。

一时间,就算是不关注AI赛道的人,都听说了这个新系统里有个大模型,它大致相当于被升级、强化后的Siri。

ie证书错误怎么解决

鸿蒙q4

比如能帮你生成点文章摘要、图片,或是自动订个酒店什么的。

但是,华为的野心,可不止是在手机里干点生成图片、文字的小花活。

人家可是把万物互联的梦想,都寄托在了这个小小的AI之上了呢。

具体来说,就是以手机上的大模型为起点,不断将智能化技术扩散到智能家居、智能汽车、甚至是智能城市之上。

如此,最后就能形成一个“万物互联”的超级终端。

其实,这不只是华为的野心,苹果、高通、荣耀等大厂都进行了类似的布局。

毕竟,大模型与终端的结合,是下一阶段AI战场必争的阵地。

然而,要知道,现在有点竞争力的通用大模型,体量和参数,往往都是一千亿规模往上的。

要想把这么一坨“庞然大物”塞进小小的手机,还要能保证性能,绝非易事。

如果关键的技术问题没处理好,大模型终端化的梦想,最终将难免会沦为镜花水月。

1

可靠性问题

要让大模型进入终端,首先要解决的问题之一,就是输出的可靠性问题。

毕竟,任何使用过大模型的人,几乎都见识过各种各样的幻觉和谬误,而这样的幻觉一旦出现在终端侧,产生的损失和后果,往往比处理“案头工作”时要严重得多。

例如,在鸿蒙4的发布会上,华为就介绍到:大模型AI小艺,会根据你的地点数据等信息为你个性化推荐信息。

以出国旅行为例,在出发前小艺会提醒你出行信息,出发后小艺会给你推荐翻译等实用功能,到目的地后,则会展示当地的美食和地点导航。

然而,倘若处理不好可信、可控问题,一个可能出现的情况是:由于信息过时或错误,小艺告诉了你一个已经变迁或不存在的地点。不知情的你被“带偏”后,才恍然自己走了不少冤枉路。

同样地,在智能驾驶领域,倘若车辆上的大模型在终端侧输出不可靠,就会导致规划决策结果出现不合理、不符合交通规则的情况,影响车辆的行驶效率和安全性。

类似的情况,如果出现在2B端,只要存在1%的偏差,都将给企业埋下风险的种子,成为落地的门槛。

目前,关于大模型可信、可控方面的问题,学术界没有完美解,只能在各个环节逐步逼近。

但有一点却是业内的共识,那就是:预训练数据越多、越广,就越可以提高大模型的泛化能力和鲁棒性,从而减少生成幻觉和错误的可能性。

在之前披露的信息中,华为对外宣称自身的盘古大模型涉及项目超过1000个,除了学习大量通用知识外,盘古还深耕金融、政务、气象、医疗、健康、互联网、教育等行业,每个行业数据量超过500亿tokens。

从数据层面来看,可谓涵盖面甚广。

但需要注意的是,盘古大模型实际上分为了四个版本,分别是100亿参数、380亿参数、710亿参数和1000亿参数。

鸿蒙q4

考虑到手机的硬件性能和运行环境,鸿蒙4中搭载的,很有可能是100亿参数版本的盘古大模型。

想在这100亿的数据规模上,保障大模型的准确性、可靠性,可能吗?

对于这个问题,华为有两种可能的解决方案:

首先一种,是直接将鸿蒙4中的大模型,变成一个看似通用的“专用”大模型。

这样的思路,其实是一种小而精的策略。

因为在某些特定场景,预训练数据的质量和相关性,远比其数量和范围要重要得多。

鸿蒙mo

具体到手机方面,由于人们使用手机的场景、用途,都是相对比较固定的,例如查天气、导航、订外卖、订酒店等,因此华为可以根据这些特定的“手机场景”,针对性地搜集相应的高质量数据。

而经由这种高质量、高相关性数据训练出来的紧凑型语言模型,有可能在特定任务和场景上表现得比大参数模型更出色。

而第二种方式,则是通过“压缩”的方式,在不牺牲性能和精度的情况下,降低模型的参数。

2

化大为小

可以说,压缩功力的强弱,直接关系到了端侧大模型的可靠性、质量。也是大模型走向端侧的必要条件。

因为只有把模型压缩到了完全能在终端侧运行,摆脱云端计算的地步,大模型才能适应更多对延迟性要求高的边缘场景。

例如,智能汽车对于模型运行的可靠性和延迟要就非常高,在实时变化的路况中,如果在云端运行大模型,并且使用网络把结果传送到终端,肯定无法满足智能汽车的需求。同时,完全终端化、本地化的运行方式,也是出于对用户数据、隐私方面的一种考虑。

这也是为什么,颇为重视隐私的苹果,也宣布自己将要发布的AppleGPT将采取完全本地化的方式运行。

同样地,在鸿蒙4上,华为表示AI“小艺”相关的数据和学习的都是在端侧推理,以保障用户的安全和隐私。

既然“压缩”是大模型终端化的必要条件,那么目前在这方面,华为和其他大厂的差距究竟如何呢?

在之前的WAIC大会上,高通展示的手机大模型,已经能做到在安卓手机上,直接运行参数规模超过10亿的StableDiffusion,而且生成效果也还过得去。

而这背后,靠的正是不俗的模型压缩能力。

通过量化、压缩、条件计算、神经网络架构搜索和编译,高通在不牺牲太多精度的前提下对AI模型进行了缩减。

比如在在量化方面,高通将FP32模型量化压缩到INT4模型,实现了64倍内存和计算能效提升。

在这方面,华为自身的昇腾模型压缩工具,也提供了一系列的模型压缩方法,根据量化方法不同,分为基于calibration的量化和基于retrain的量化。

而上述两种量化方法,根据量化对象不同,分为权重量化和数据量化。

鸿蒙模块

而具体来说,权重量化对模型影响不大,而数据量化对模型影响比较大。

这样的影响,可以用一个形象的比喻来说明:

泡泡玛特IP营销

压缩大模型就像切西瓜,而权重量化就像是把西瓜的种子变成整数,数据量化就像是把西瓜的果肉和果汁变成整数。

一般人吃西瓜的时候,更在乎的往往是果肉,而不是种子。

同理,权重是模型的一部分,但不是最重要的部分,我们运行模型的时候,主要关注的是输入输出数据的准确性和多少。

2021第二季度汽车销量

也正因如此,在用户可感知到的范围内,权重量化对模型性能的影响是较小的。

而这也是为什么,谷歌、腾讯、百度等在将模型压缩技术结合到移动端时,使用的也大多是权重量化。

例如腾讯提出的NCNN和MNN模型,主要就是存储模型中各层的权重值。ncnn模型中含有扩展字段,用于兼容不同权重值的存储方式。

在科技发展的路径上,有一条真理,那就是:正确、合理的技术,往往都存在着一种趋同化的“最优解”,很少会存在什么“秘技”。

说到这里,问题来了:既然在可预见的未来,各个大厂在模型压缩、量化方面的技术,大体上都是趋同、相近的,那么在这场“终端AI”竞赛中,真正决定性的制胜因素,究竟是什么?

3

总结

在终端大模型的较量中,除了模型压缩、端侧芯片外,最主要的因素,就剩下了终端软件生态的搭建。

由于端侧芯片实在是一个太大的话题,受于篇幅所限,此处不再赘述,将来会单独用一整篇的内容加以分析。

这里主要重点说下终端软件生态。

一个可以预见的未来是:由于终端设备的多样性,碎片性,将来的终端大模型,必定会出现针对不同应用场景的“智能助理”。

例如,音箱中的智能助理,可以帮助我们管理智能家居;在工作场合,耳机中的智能助理可以作为秘书帮助处理会议纪要等工作。

在这种情况下,谁若能率先取得多模态方向上的突破,针对不同场景微调,提供多样化、专属化的智能助理,谁就能在终端大模型的长跑中,处于领先优势。

此外,考虑到手机、智能家居等终端设备,具有很强的“私有性”,因此,如何根据用户的个人喜好和使用习惯,进行自适应学习,并提供个性化的建议和服务,就成了终端大模型能否长期陪伴用户的关键因素。

而倘若上述问题,都得到了较好的解决,那么一个以大模型作为终极操作系统(AIOS)的AI时代,就迟早会到来。

到了那时,分散、割裂、碎片化的物联网应用市场,也终将被大模型AIOS统合。


返回网站首页

本文评论
十大平板电脑_十大平板电脑是哪些牌子十大平板电脑
平板电脑现在已经成为越来越多人生活中必不可少的设备之一。随着市场的不断发展,各大品牌都推出了自己的平板电脑,使得消费者在选购时更加犯难。今天我们就来看看目前市场上排...
日期:05-29
没有新车!这一次,马斯克双手插兜,眼里全是对手!_马斯克藏了两年的牌
作者:普子胥 栏目:《态度》 马斯克变了!“我们许多竞争对手,在生产电动车时遭受了巨大的亏损,但我们却没有。”5月17日特斯拉股东大会上,那个曾经双手插兜、眼中没有对手的钢铁...
日期:05-17
登陆别人icloud对方显示双重认证「苹果称 95% 的 iCloud 用户开启了双重认证」
IT之家 8 月 28 日消息,随着今年秋季推出的下一轮软件更新,苹果 iOS 16 和 macOS Ventura 等将集成对 passkey 标准的支持。该标准被描述为独特的数字密钥,旨在通过简化的跨设...
日期:09-05
红米k30pro支持66w快充吗「红米K60硬件配置曝光,标配30W无线快充」
中关村在线消息:10月8日,据相关爆料,即将在明年第一季度发布的红米K60系列详细参数已经曝光,新机共将为大家带来两款产品,一款为标准版一款为超大杯,二者均搭载骁龙8+处理器,但在续...
日期:10-14
华为mate xs
华为的mate系列一直都备受消费者的关注,而mate xs便是mate系列的最新力作。延续了mate系列一贯的产品理念,强调性能强大和视觉体验良好。同时该机在屏幕方面做了大量改进,更加...
日期:05-29
购燃油车就送粤A蓝牌!广汽集团在广州推限时购车补贴「广州汽车优惠」
快科技5月4日消息,日前,广州市促进消费提档升级若干措施正式发布、在政府补贴基础上,企业也持续加码,将优惠进一步放大。以广汽集团为例,即日起到2023年6月30日,购置广汽集团旗下...
日期:05-04
亚马逊暂停招聘 预计将持续数月「亚马逊停止入驻」
11月4日消息,据国外媒体报道,继苹果之后,另一科技巨头亚马逊公司也表示,在目前不确定的经济环境下已停止招聘工作。据悉,上个月亚马逊已经宣布要冻结零售业务招聘,现在连其它部门...
日期:11-05
华为最新升级名单「华为爆出大动作!将有重大升级,事关AI」
近日,在华为开发者联创日深圳首站上,华为AI技术规划专家王琛表示,当前我们正处于第二代人工智能向第三代人工智能交替的阶段。与第二代人工智能相比,现在的人工智能是“知识+数...
日期:06-23
全国移动用户数破9亿 小灵通用户仅2476万_中国移动小灵通
近日,工信部发布2011年4月通信业运行状况。数据显示,1-4月份,全国移动电话用户累计净增4138.6万户,总数突破9亿户。小灵通用户减少387万户,达到2476.2万户,在固定电话用户中占比...
日期:07-28
360安全中心:网上看盗版《新三国》要警惕木马陷阱_新三国免费观看
  近日随着《新三国》的开播,四大名著老戏新拍又掀起一轮收视热潮。而在网上,优酷、土豆、56等大型视频网站由于版权问题无法在线播放《新三国》,一些挂马网站趁机以   这...
日期:07-29
IE浏览器安全警告_研究人员发布IE攻击代码 可绕开Win7安全措施
  安全研究人员已经发布了利用一个尚未修正的IE缺陷、绕开Windows 7中的安全措施的攻击代码。微软可信赖计算集团主管戴夫·福斯特洛姆(Dave Forstrom)在一份声明中称,“微...
日期:07-25
高德地图推出“运动导航”功能 可记录骑步行消耗卡路里
3月4日消息,近日,高德地图推出“运动导航”功能,可帮助用户在骑行、步行导航模式下记录卡路里的消耗情况,同时也可设置热量消耗目标,以及查看近期卡路里消耗的阶段性成果。三星平...
日期:03-04
尹烨 肠道菌群_尹烨回击饶毅质疑背后:万能的益生菌与难寻的肠道菌群
  记者/陈杨   编辑 /谢欣   在首都医科大学校长饶毅接连几天炮轰华大集团CEO尹烨之后,7月28日,尹烨在其微信公众号“尹哥聊基因”发文回应。   相较于此前仅“谢谢...
日期:07-31
央视记者王冰冰性感「央视美女记者王冰冰时隔10月首更视频:古装美如画中仙」
4月5日消息,央视美女记者王冰冰更新了自己B站账号吃花椒的喵酱”最新一期视频,上次更新还是去年6月,已经过去10个月了。据了解,这是央视频和王冰冰合作拍摄的《国之大雅二十四节...
日期:04-05
360提醒:网上办加油卡充值谨防被“钓鱼”
  网上充值快捷方便,但要小心别被钓鱼网站诈骗钱财。近期,360安全中心截获多家打着“中石化加油卡充值”旗号的钓鱼网站,这些网站通过诈骗短信或搜索引擎诱骗车主访问,其网址...
日期:07-24
湖南00后实地翻拍他是谁名场面 网友:氛围感绝了「湖南00后明星有哪些」
近期,张译主演的犯罪剧《他是谁》正热播。除了观众追剧,也有很多人去拍摄电视剧的取景地——湖南株洲和湘潭。微软已经宣布放弃IE更新了其中,一位00后小伙在株洲的取景地进行了...
日期:03-24
新药研发中的人工智能「AI制药来了!有患者接受由生成式人工智能发现和设计药物治疗」
6月29日 消息:目前,AI药物研发公司Insilico Medicine已向II期临床试验中的患者注射了第一剂一种由生成式人工智能药物。该化合物名为INS018_055,已完成了0期和I期人体安全性研...
日期:06-29
突破3200万!Steam同时在线再创新高
去年10月,Steam的同时在线人数首次突破3000万,创下了新纪录。今天,根据Steam官方最新数据,Steam的同时在线人数再次创下新高,超过3200万,达到了3216万2987人,正在游戏中人数突破100...
日期:01-08
阿里告别“张勇时代”「阿里新董事长张勇」
作者|闫妍出品|网易科技《态℃》栏目组今日,张勇发布全员信宣布,将于今年9月10日卸任阿里巴巴控股集团董事会主席兼CEO职务。张勇此后将专职担任阿里云智能集团董事长兼CEO,专注...
日期:06-20
北京市委副书记、市长陈吉宁一行参观中关村软件园“互联网+”大赛交流中心西人马项目
  2月26日,北京市委副书记、市长陈吉宁一行参观中关村软件园“互联网+”大赛交流中心,西人马作为优秀获奖项目在大赛交流中心进行展示并向陈吉宁市长汇报西人马在北京的落...
日期:07-16