您的位置:首页 > 互联网

大模型 ai「专家特稿:大模型加速终端全栈式颠覆」

发布时间:2023-09-01 14:38:11  来源:互联网     背景:

专家特稿:大模型加速终端全栈式颠覆 通信产业网|2023-08-28 10:38:22作者:饶少阳来源:通信产业网

【通信产业网讯】(文 | 中国电信研究院战略发展研究所所长 饶少阳)7月6日,高通在2023世界人工智能大会上演示了文生图模型Stable Diffusion、图生图模型ControlNet在手机上独立运行的过程,加速大模型向终端转移。5月10日,谷歌发布最新版通用大模型PaLM 2的多个版本,其中轻量级版本可用于移动端,开启了大模型从云端到终端的新空间。

终端性能的持续提升,大模型的云-端协同模式,可以实现手机、汽车等终端应用个性化定制,兼顾用户隐私保护,未来将成为大模型切入公众市场,实现万物智能的重要方式。

将引发终端新变革

将大模型部署到终端,更有利于大模型应用获得规模推广,实现创新迭代。除了移动网络代际能力提升以外,智能手机的普及也是加速移动互联网发展的重要原因,汽车、手机终端、XR计算性能持续提升,为大模型实现云-端协同创造了条件,未来几年基于大模型的终端应用将实现快速发展。

目前,搜索引擎、办公效率工具的大模型加持多是基于办公环境和PC终端,虽然OpenAI推出iOS手机ChatGPT应用,并快速霸占AppStore应用下载榜首,但大模型与手机终端的深度集成应用仍然处于发展初期。全球有超过60亿智能手机,打造真正的个人智能助手,是大模型真正实现大规模应用推广和持续迭代创新的基础。

大模型的端侧运行具备成本、安全、个性化和便捷性等优势。

apple watch升级系统

一是通过终端独立运行以及云-端协同承担计算负载,可大大降低云端算力需求及能耗成本。如生成式AI搜索的成本是传统搜索的10倍,随着用户数量和查询次数的增多,大模型推理的运营成本将是一个天文数字,借助终端自身算力可以降低云端资源消耗。

二是大模型在终端侧的部署(推理)可以增加用户在“弱网”“溢云”等极端场景的使用,保证低时延、高可靠性。

三是大模型终端凭借数据本地化处理优势,能在保护用户隐私(例如个人图片、视频、通话记录、通信录和位置等)的同时生成用户使用习惯画像,打造个性化和定制化应用,提升体验。

四是终端具有自然语言语音交互的天然优势,可以便捷地获取图片、照片、视频、位置等信息,具有丰富的个人立体化数据,有利于未来多模态大模型的发展。

大厂布局抢占生态和入口

高通:借助终端芯片优势,打造终端侧AI软硬件全栈式能力,加强大模型市场布局

高通基于硬件、软件、算法,及模型等创新,实现全栈式AI优化。高通在手机上演示的ControlNet用例,可在12秒内生成一张AI图像。此外,高通对量化、压缩、编译、神经网络等领域也有研究,如将FP32模型量化压缩到INT4模型,实现64倍内存和计算能效提升。

高通预测,未来几个月内随着终端侧处理能力的提升,将支持拥有100亿或更高参数的模型运行,并且生成速度将大幅提升。

谷歌:依托Android生态优势,加快云-边-端体系化大模型产品的布局

谷歌依托大模型研发能力,正不断横向扩展产品类型、纵向打造应用生态,旨在重现Android生态发展的黄金十年。谷歌推出适合云-边-端的大模型PaLM 2,同时开发边缘端大模型Gemini,适配基于自研芯片Tensor G2的各类终端,进军边缘端大模型市场。

阿里云:以智能家居为切入,意欲抢占基于大模型应用的智能交互入口

阿里云已开启天猫精灵音箱大模型终端操作系统内测,包括知识探索、共情互动、生活妙招和灵感启发四类对话场景。据悉,该版本对大部分的存量智能硬件也适用,可几十秒内在线升级,并将陆续覆盖眼镜、智慧屏等终端设备,集合了达摩院NLP、语音、视觉、3D构建驱动,大模型团队及天猫精灵AliGenie交互系统专家智慧,旨在打造一个多模态大模型数字人以接管未来智能交互入口。

华为:以手机应用为导向,聚焦终端侧大模型轻量化应用

华为最新发布的P60系列升级了智慧搜图功能。基于多模态大模型技术,智慧搜图对亿级图文数据进行预训练,支持包含颜色、形状、物体、行为、时间和地点等多信息组合的自然语言搜索,通过在手机端侧对模型进行小型化处理,华为在业界率先实现了自然语言手机图库搜索体验。

三举措实现终端最佳部署

各大主流厂商、云商纷纷加快大模型从云端向到终端转移,以终端为锚点,云端仅作为分流承载终端无法充分运行的AI任务,如模型训练等。目前业界主要从大模型轻量化减小部署成本,全栈化AI软件简化管理及部署难度,提升硬件性能三个方面进行升级改造,以实现大模型在终端的最佳部署。

大模型轻量化

通过量化、参数剪枝、知识蒸馏等手段,减少大模型的资源消耗,降低大模型对推理算力的需求,以便在计算、内存等资源有限终端部署和运行。高通实验数据表明,通过量化感知训练,生成式AI模型可以量化至INT4模型,与INT8相比,性能提升约90%,能效提升约60%。

常见的模型加速方法

AI软件全栈化

AI软件栈是集成了AI框架、开发者库、操作系统的整合平台,是实现大模型在终端侧高效率部署、AI应用多终端复制的关键,旨在为OEM厂商和开发者提供完整的AI解决方案。AI软件全栈化。如高通AI软件栈支持所有主流开发框架(含TensorFlow、Pytorch和ONNX等)和操作系统,可执行底层硬件的全栈AI优化,同时具备“一次开发,多终端使用”的特点,支持AI应用由单一手机终端扩展到PC、车载等多种终端。

硬件性能提升

以高通、Intel等为代表的硬件厂商,加大终端高性能芯片或硬件平台,以支撑大模型在终端侧实现本地化运行。例如,高通第二代骁龙8平台能够支持 Stable Diffusion 这一超过 10 亿参数的模型在终端侧运行,实现在 15秒内完成 20步推理,生成饱含细节的图像。未来几个月内,高通将有望支持参数超过 100 亿的模型在终端侧运行。

趋势判断

随着大模型的技术演进以及应用规模化发展,在终端侧轻量化大模型的部署将成为把控智能交互新入口的关键,将成为面向公众市场的新蓝海。

大模型厂商与各类终端厂商将联手抢占智能交互入口。终端大模型软硬件厂商,安卓、麒麟等主流操作系统提供商,将联合Vivo、Oppo、联想、智能穿戴、智能音箱、车载系统等终端厂家,共同探索终端与大模型的深度集成应用,抢占用户的第一入口,推动大模型终端市场的成熟发展。

运营商作为云网算力提供商,将重点发力云-端协同。运营商将联合产业上下游,推出基于大模型的智能手机、智能穿戴、车载智能驾驶等定制化终端,提供云网边端的一体化产品及服务。

人机交互模式发生变革,App应用市场将带来颠覆性重构。大模型将成终端操作系统的核心组件,用户交互方式将从基于多点触摸和键盘输入转移到基于自然语言的交互模式,手机的设置、通话、短信,以及数以万计的App将基于大模型进行深度重构。

作者简介

饶少阳

北京邮电大学计算机应用博士,高级工程师,中国电信研究院战略发展研究所所长,长期研究云计算技术、业务和产业发展。

荣耀70 上市时间

责任编辑:晓燕


返回网站首页

本文评论
宇信科技金融云业务助力金融机构稳定运营_宇信科技 银行
  近年来,以人工智能为代表的新技术与新服务不断发展,持续重塑金融市场结构和生态。作为国内金融科技解决方案市场的领军品牌,宇信科技成立以来,以云计算、区块链、人工智能...
日期:10-15
“算力+运力”扇动双翼,制造算力时代的蝴蝶效应
8月18日-20日,第二届中国算力大会在宁夏银川成功举办。今年以来,随着大模型、AIGC等新技术的火爆,站在舞台中央的算力承载了无尽的期待,发展数字经济需要以算力基础设施为前提,社...
日期:08-29
淘宝商城提价引来攻击 分析称或为上市铺路(淘宝提价风波)
  淘宝商城10月12日针对11日晚间部分商户遭到的恶意攻击发布公告称,“攻击是一群号称‘淘宝小店家’的人士在刻意操纵,企图逼迫淘宝商城改变刚公布的2012年度商家招商续签...
日期:07-23
身怀绝技!小羊学狗叫吓懵同伴:连动作都像狗
羊学狗叫是怎样一种体验?最近,一直身怀绝技”的羊火了。据时间视频消息,10月1日,辽宁铁岭一只羊学会了狗叫,冲着同伴不停发出汪汪汪”的声音,连动作也很标准,很像一只小狗。它的同...
日期:10-04
这台高画质大屏幕电视,满足了我对沉浸感的想象_大屏电视推荐2020
自从走上了剧本创作这条路,写作之余我平时要看各种影视剧作品寻找灵感。既然是找灵感,电视就得足够大、画面和音效足够好,这样才有沉浸感,能细细品味作品的精髓。话虽这么说,但我...
日期:05-02
iPhone 15 Pro外观设计曝光,去掉所有物理按键
中关村在线消息:iPhone一直是数码届的顶流,虽然iPhone15在9月份发布,但是iPhone15已经有了非常多的爆料。笔者为大家汇总了一些比较靠谱的爆料信息,看看未来的iPhone15是否依旧...
日期:01-22
跨越观感边界 绽放视听盛宴 紫光展锐首颗AI+8K超高清智能显示芯片平台M6780亮相MWC上海
通信世界网消息(CWW)6月28日,紫光展锐首颗超高清智能显示芯片平台M6780亮相MWC上海展。该芯片平台支持8K解码与HDR全格式,拥有高度集成的CPU、GPU,NPU、VDSP、ADSP带来强劲AI算力...
日期:06-28
华人团队颠覆CV!SEEM模型可一键分割图像和视频
4月23日 消息:继Meta的「分割一切」之后,又一个颠覆CV的模型来了!近日,威斯康辛麦迪逊、微软、港科大等机构的研究人员提出SEEM模型,通过不同的视觉提示和语言提示,一键分割图像...
日期:04-23
苹果天气app设置「苹果 iOS 16 更新,天气 App 新功能盘点」
IT之家 8 月 31 日消息,苹果在 iOS 16 中对天气应用进行了一些改变,包括新的通知类型,并增加了一些信息,从湿度、温度到能见度全方位为你提供服务。此外,新版天气 App 中的许多新...
日期:09-19
百度文心一格联合京东618 打造电商行业首个AI线下广告
6月15日 消息:据百度官方消息,今年618期间,京东联合百度文心一格,将 AIGC 应用于电商营销,进行了首次大规模线下广告尝试,打造电商行业首个 AI 线下广告。在此次京东与百度的合作...
日期:06-15
京东联盟将于10月29日全面恢复与快手外链合作「快手如何绑定京东联盟」
10月28日 消息:今日,京东联盟宣布将与快手全面恢复商品外链合作,目前已完成产品灰度测试,于10月28日逐步开放京东商品在快手直播间挂车功能,10月29日将正式全面恢复完成。京东表...
日期:10-29
待机长的智能手机「手机待机长的手机」
随着智能手机的普及,待机长成为越来越多用户关注的焦点。智能手机在待机状态下能够使用多长时间,是许多消费者选择购买手机时考虑的一个重要因素。在这篇文章中,我们将讨论关于...
日期:05-31
巨人网络与阿里云达成合作 共建“游戏+AI”智算平台_巨人网络集团创始人
7月14日 消息:今日,巨人网络与阿里云宣布达成“游戏+AI”全面合作。根据合作备忘录,阿里云与巨人网络将共建“游戏+AI”智算平台。基于巨人网络的游戏研发平台、阿里云通义千...
日期:07-14
宝德“暴芯”套路:英特尔芯片定制,目标行业市场,可行吗?_宝芯科技
5月初,国产服务器厂商宝德计算系统股份有限公司(以下称“宝德计算”)发布的“Powerstar”(暴芯)P3-01105给半导体行业投下了一个大石头,溅起不少关注和质疑的浪花。没有芯片研发背...
日期:06-03
如何选择性价比高的国内CDN网络服务商_如何选择性价比高的国内cdn网络服务商品牌
作为一个网站运营管理员,为了提升网站的访问速度和用户体验,选择一家性价比高的CDN网络服务商非常重要。在国内,有很多CDN网络服务商可供选择,但是如何选择一家性价比高的呢?下...
日期:03-10
移远通信发布新款5G/4G、LPWA和GNSS天线,进一步优化物联网终端性能_移远通信生产什么的?
通信世界网消息(CWW)2023年7月17日,全球领先的物联网整体解决方案供应商移远通信宣布,再次推出三款新型天线产品,以更优的通信和定位性能,满足各类物联网终端在5G/4G、LPWA和GNSS...
日期:07-18
ps4模拟器怎么玩「PS4模拟器渐入佳境:能玩30多款游戏了」
尽管不少PS4独占甚至第一方游戏已经原生登陆PC平台,但数量并不能算多。所以对部分玩家来说,还有不少人寄望模拟器越做越好。目前以ePSXe、PCSX2为代表的PS3模拟器效果已经相当...
日期:11-05
荣耀CEO赵明:折叠屏进入主力机时代 对标苹果旗舰_荣耀折叠屏手机屏幕供应商
凤凰网科技讯(作者/贾楠)荣耀于近日推出了折叠屏新品荣耀Magic Vs系列,相比此前的荣耀Magic V,此次荣耀的折叠屏新品在重量、续航、工艺等方面均有改善,并将售价控制在7499元起。...
日期:12-02
20%的一代iPad用户希望升级到iPad 2(苹果平板ipad2能升级到什么程度)
  RBC Capital Markets分析师Mike Abramsky公布了调查数据表明,大约15-20%的iPad 1用户希望升级到iPad 2,并且他预计本年度iPad产品的销量将高达2800万台,第一个周末的销量...
日期:07-26
AI哨所 | AI不受约束或成“噩梦” 这八大风险不容忽视_aciv哨兵
凤凰网科技讯 北京时间4月16日消息,尽管人工智能(AI)技术的主流应用令人兴奋不已,但是如果不加以约束,一些科幻小说式的场景也会成为噩梦。AI安全专家、AI安全中心主任丹亨德里...
日期:04-16