您的位置:首页 > 互联网

大小语言模型对比分析及启示_大小语言模型对比分析及启示论文

发布时间:2024-06-21 12:14:09  来源:互联网     背景:

通信世界网消息(CWW)过去一年多来,大语言模型(LLM)从 GPT-3.5、GPT-4 到 Llama等开源模型,一直备受关注。然而,近期一些迹象表明,小语言模型(SLM)正逐渐获得越来越多的重视,微软、GOOGLE等AI领域的大佬们纷纷开始下注小语言模型。出现这一趋势的原因何在,将给运营商带来哪些启示?

  大语言模型轻量化渐成趋势

LLM (大语言模型)的参数数量可以达到数千亿甚至数万亿。而SLM(小语言模型) 通常具有数亿或数十亿个参数,SLM 的训练和运行所需的时间和资源要少得多,这使得它们更加适合于资源有限的设备和应用。

 1. 多家AI巨头引领,发布多款SLM小模型 

微软2023年 9 月发布了 Phi-1.5 版本,13 亿参数。1.5版本可以写诗、写电子邮件和故事,以及总结文本。在12月14日更新发布了 Phi-2 ,拥有 27 亿参数。今年4 月 23 日,微软发布了 Phi-3 Mini,这是Phi-3系列小型模型中的第一个,Phi-3 Mini 可测量参数仅为 38 亿,并在相对于 GPT-4 等大型语言模型更小的数据集上进行训练,现已在 Azure、Hugging Face 上可使用。Phi-3 Mini 的性能比前一版本更好,与 GPT-3.5 等 LLM 不相上下,微软后续还计划发布 Phi-3 Small(7B 参数)和 Phi-3 Medium(14B 参数)两个版本。

今年2月,Google 发布了 Gemma 2B 和 7B,这两款模型更适合简单的聊天机器人和语言相关的工作。Gemma 模型可轻松运行在普通设备上,无需特殊硬件或复杂优化,它提供高效、易用的语言处理体验。Gemma 在 Hugging Face 的下载量已经突破 400,000 次,并激发了Cerule、CodeGemma等创新项目。性能表现方面, Gemma在MMLU、MBPP等18个基准测试中,有11个测试结果超越了Mistral-7B等模型。

图1:Phi-3与Gemma、GPT3.5等模型的测试对比(数据来源:Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone)

语言大与小教案

大小语言模型对比分析及启示论文

 2. 大语言模型轻量化的几个特征 

除了原生的SLM小语言模型外,大语言模型也在通过各种手段压缩规模,以期适应更多的应用场景。模型压缩的方式主要包括模型量化、知识蒸馏、模型剪枝、低秩适应、权值共享、结构搜索等。目前,多个大语言模型均已推出“小型化”和“场景化”版本,为端侧运行提供了基础。例如,Google PaLM2中最轻量的“壁虎”壁虎(Gecko)可实现手机端运行,速度足够快,不联网也能正常工作。Meta在官网上公布了旗下最新大语言模型Llama 3。已经开放了80亿(8B)和700亿(70B)两个小参数版本,Llama 3 8B模型在MMLU、GPQA、HumanEval等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct。

表1:大小语言模型的特征

SLM和LLM的对比

 1. 技术特点 

SLM通常采用传统的Transformer架构,而LLM则采用更复杂的架构,如GPT-3的解码器-编码器架构和Megatron-Turing NLG的解码器-编码器-解码器架构。

大语言模型遵从缩放定律(Scaling Laws),简单而言就是规模越大,性能越强。相较而言,LLM的特点是性能和泛化能力强,SLM的特点是训练和运行成本低。

 2. 优劣势比较 

表2:LLM和SLM的优劣势比较

 3. 应用场景 

在应用场景上,LLM主要运行于云侧,应用于泛场景的通用性和复杂推理任务, SLM主要应用于端侧设备和特定领域的任务。由于端侧设备数量巨大、存在广泛, HuggingFace 的CEO Clem Delangue 甚至指出,多达99% 的使用场景可以通过 SLM 来解决。高通的报告也预测,数量可观的生成式 AI模型可从云端分流到终端上运行。

图2:数量可观的生成式 AI模型可从云端分流到终端上运行。(来源:高通:混合AI是AI的未来)

运营商发展大语言模型面临的问题

大小语种的分类标准

GALAXY S6 Edge

 1. 资金、技术、数据、人才等方面存在短板 

LLM可以充分发挥电信运营商云、网、算力等资源的优势,更好地泛化到新任务和新数据,应用于更广泛的场景。但是, LLM 的训练和运行需要大量算力,训练时间长,部署和维护的难度高,与其它大语言模型一样,存在偏见和安全风险。不仅如此,与互联网巨头比,运营商在资金、技术、数据、人才等方面都存在一定短板。资金上,互联网巨头有更广泛的融资渠道;技术上,与前沿大语言模型相比,运营商大语言模型在参数数量、性能上存在差距,研发处于跟随地位;数据上,优质数据集的数量和质量有限;此外,AI研发人才也短缺。

 2. 应用场景受限 

LLM大模型的应用场景主要有通用场景,如机器翻译、问答系统、文本生成等,以及结合行业数据集的行业应用。对于运营商的LLM,目前来看,主要应用场景内部可用于客服、网运,外部可泛化为政企客户和公众客户提供通用的AI服务。

通用的AI服务由于市场已有大量的大模型厂商,竞争激烈。垂直行业应用将是运营商LLM未来最大的市场领域。垂直行业通常有较为专业的数据集,数据质量高,数据规模不一定大,但对数据隐私和安全性要求高。从模型的角度来看, LLM大模型虽然通过泛化能适应这些需求,但付出的各种成本高,且存在安全风险,这将制约运营商LLM的广泛应用。

 对运营商的启示

 1. 面向众多行业应用场景,加强对SLM的研发 

随着AI技术的不断发展,SLM 的性能和功能将进一步提升,终端的能力也越来越强,未来越来越多的AI推理工作负载在手机、PC、XR 头显、汽车和其他边缘终端上运行,SLM将会有更大的应用潜力,会有越来越多的场景使用 SLM。

运营商有庞大的客户群,不同客户对与AI的需求千差万别。以政企业务为例,目前政企产品分为标准化产品和平台、小微ICT项目、复杂集成DICT项目三大类,对于标准化产品和平台,运用云和LLM的能力,能够很好地为客户AI赋能,而对于小微ICT项目、复杂集成DICT项目,很多场景下,SLM会是客户更佳的选择。

 2. 用SLM降低研发运营成本,促进创新和迭代 

SLM 的开发和维护成本相对较低,风险也较低,更容易实现创新和迭代。同时,边缘终端能够以很低的能耗运行SLM,提供更高的能效,借助端侧SLM的能力,能有效降低云侧的资源消耗,帮助运营商降低数据中心的能耗,实现企业的降本增效。

不仅如此,SLM还可以帮助构建运营商的AI生态,加强服务能力,增强客户粘性,提升客户满意度。可以通过SLM开源社区、广泛的SLM客户群,建立良好的AI生态,利用 SLM 进行快速试错,探索新的应用场景和商业模式,成熟后还可以与LLM 结合应用于更复杂的场景,促进运营商各类业务的发展。

 3. 通过LLM和SLM结合建立差异化竞争优势 

在 LLM 领域,大型科技公司已经占据了领先地位,单纯通过LLM的竞争,运营商较难取得优势,对于一些内部数据集规模比较小的客户来说,使用小模型更具性价比。运营商可以通过LLM和SLM结合,在特定领域形成差异化竞争优势,例如专注于垂直行业,采用低成本、高性能的 SLM 模型,以较低的成本实现服务的智能化升级。而对于客户更加复杂的AI需求,则可通过网络和云端LLM来实现,解决SLM性能和知识的局限问题。

根据客户的业务需求选择合适的模型,通过云侧LLM和端侧SLM相结合,相信运营商能够建立差异化竞争优势,构筑企业更加坚实的护城河。


返回网站首页

本文评论
乙女游戏 论坛「百万DAU的AI社交App,正偷偷抢走乙女游戏的饭碗?」
声明:本文来自于微信公众号 白鲸出海(ID:baijingapp),作者:李爽,授权转载发布。电梯里,他的身体逐渐靠近你,你可以闻到他身上的那股独特的气息。这时,挑衅的声音响起:“现在,你觉得...
日期:01-03
关于人工智能的职业规划「ChatGPT 促进职业发展?Practica 推出基于人工智能的职业指导和指导」
10月31日 消息:初创公司Practica最近推出了一款人工智能系统,其目标是成为专业人士的个性化职场导师和教练,帮助他们在管理、战略、销售等领域提升技能。iphone14pro搭载什么...
日期:10-31
笔记本电脑、手机冬天掉电特别快!联想官方揭秘:化学问题_笔记本耗电比手机快
快科技12月7日消息,最近全国各地明显降温,多数地区都已经进入寒冬。有一个问题却在困扰很多网友:笔记本电脑、手机等设备掉电越来越快,都无法满足日常需求了。对此,联想官方最新...
日期:12-07
14900K+RTX4080S打造的高端海景房主机装机配置方案
终于告别了癸卯年,迎来了甲辰年,所谓新年新气象,那就装一台新机犒赏一下自己吧。其实这台机子早在年前就准备好配件了,然后大年初三开始动工折腾。还记得当时连续大吃大喝了好几...
日期:04-11
美国云计算软件股纷纷大涨 需求仍强劲_美国云计算上市公司
维谛技术分公司   讯 北京时间8月15日早间消息,据报道,今年年初,美国云计算软件股纷纷下跌,但现在许多股票的价格已经较低点反弹50%。过去三个月WisdomTree云计算基金上涨26%,...
日期:08-16
高效助学有“硬核”!阿尔法蛋词典笔Q3荣获极果年度优选教育产品
  近年来,随着国家对学生的教育重视程度的增加,一些人工智能学习产品逐渐走进了大众视野。作为目前业界最大的儿童人工智能教育产品公司,安徽淘云科技(简称“淘云科技”)...
日期:10-07
Awesome-gptlike-shellsite官网体验入口 GPT套壳站快速部署与运营策略
Awesome-gptlike-shellsite是一个涵盖从选择套壳站、部署流程、订阅API、运营策略等全方位内容的指南。它可以帮助您快速部署属于自己的GPT服务,并实现平台商业化。点击前往A...
日期:01-09
Lake部分芯粒将用台积电N3B工艺 英特尔CEO确认Lunar_台积电代工英特尔芯片
2 月 24 日消息,英特尔首席执行官帕特・基辛格(Pat Gelsinger)近日确认,Lunar Lake 处理器中的部分芯粒(Chiplet)将采用台积电的 N3B 工艺节点。cpuipc性能英特尔在 IFS Direct 20...
日期:02-24
贾乃亮、傅首尔道歉,董宇辉拉黑,趣店到底为啥惹众怒?
记者/李彪   今日,明星贾乃亮、前《奇葩说》冠军辩手傅首尔通过微博回应了与趣店的合作,并发表道歉声明。此合作系上周举办的“趣店预制菜”抖音直播带货活动。 趣分期属于...
日期:07-31
微软、OpenAI 和 Cohere 等公司已转向使用合成数据训练人工智能模型「微软人工智能平台」
7月20日消息:人工智能公司 Cohere 的首席执行官 Aiden Gomez 表示,合成数据已经被用来训练人工智能模型。由于 Reddit 和 Twitter 等公司对于其他公司抓取其数据收费高昂,微软...
日期:07-20
SpaceX星舰“首炸”影响严重!有毒物质飞至数英里外「spacex“星舰”」
快科技4月25日消息,近日,SpaceX尝试了人类目前最强火箭星舰”的首次发射,但最终以火箭升空后爆炸告终。华为mate50 pro和苹果14pro价格根据美国生物多样性中心高级律师贾里德马...
日期:04-26
百度首席执行官:大模型正在改变人工智能「百度董事长兼首席执行官」
百度首席执行官李彦宏在天津举行的第七届世界智能大会上发表演讲,讨论了大模型正在如何改变人工智能领域。他认为,大模型对人类就业并不构成威胁,真实的的危险在于不创新、不进...
日期:05-18
腾讯深度定制的腾讯黑鲨游戏手机3成为游戏手机新标杆(腾讯黑鲨游戏手机3怎么样 值得入手吗?)
  近日,腾讯黑鲨游戏手机3在黑鲨商城、京东商城、小米商城、小米有品及顺电等各销售平台正在火热销售中,售价 3499 元起。这款被网友戏称为“官方外挂”、“游戏神器”的新...
日期:12-05
比特大陆斥资7亿买Dash,究竟看中了啥?
《比特大陆斥资7亿买Dash,究竟看中了啥?》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系我们帮它成长:Dash最高...
日期:08-02
百度做的这件事又刷屏了:老人孩子收获“AI年货”
  从1月21日开始,“小度迎新春 把AI带回家”新春小度送温暖活动在西安、青岛、兰州、重庆等地陆续启动,百度联合当地媒体,在包括建筑工地、儿童福利院、敬老院、初级中学、...
日期:04-12
外媒:拼多多搁置赴港上市计划_拼多多下市了
12月29日消息,科技媒体The Information周三援引知情人士的话报道称,包括拼多多和满帮在内的多家在美上市中国科技公司已搁置或取消有关在香港上市的谈判。在这份报告发布之前,...
日期:12-29
邬贺铨开讲啦5g观后感_邬贺铨院士:6G比5G快1000倍,有这个必要吗?
乐视高调宣布回归 将发布超级手机   文;| 张俊   本期嘉宾:   中国工程院院士;邬贺铨   这是一个新技术交汇的时代,AI、5G等前沿技术正在加速改变我们的生活。   在...
日期:08-19
活人被网上祭拜?资料随便填、照片随便传!平台回应「活人祭祀是什么意思」
近日,有网友发现自己的照片被恶搞,发布在某网络祭祀平台的墓碑上,引发热议,而平台回应称可联系删除,未来会要求上传死亡证明。据红星新闻了解,这款App名为天堂念”,可免费为逝去的...
日期:04-09
100%国产化 中国首台芯片激光切割设备公布_国产激光切割品牌列表
据华工科技激光半导体产品总监黄伟介绍,半导体晶圆是一种硬脆材料,传统激光在切割时会产生较大的热影响和崩边宽度,而华工科技的激光切割设备可以实现更细小的切割线宽,约为20微...
日期:07-15
开发近一年时间,Netflix Android App 视频播放速度控件终于要来了(netflix安卓app)
  8 月 3 日消息 据 MSPoweruser 报道,为了让 Android 用户可以更快或更慢地观看视频内容,有消息称 Netflix 正在为其 Android 应用添加视频播放速度控件。   由此一来...
日期:07-14