您的位置:首页 > 互联网

大模型混战,阿里百度华为谁将成就AI时代的“新地基”?_华为阿里对标

发布时间:2023-04-14 20:33:56  来源:互联网     背景:

声明:本文来自于微信公众号 奇偶派(ID:jioupai),作者 |叶子 编辑 |钊,授权转载发布。

自2022年stable diffusion模型的进步推动AIGC的快速发展后,年底,ChatGPT以“破圈者”的姿态,快速“吸粉”亿万,在全球范围内掀起了一股AI浪潮,也促使了众多海外巨头竞相发布属于自己的大模型。

而在国内,实际上很久之前,阿里、华为、腾讯等公司便早已有所布局:2019年,阿里开始布局大模型研发,去年9月发布“通义”大模型系列的众多大模型;华为在2021年基于昇腾AI与鹏城实验室联合发布了鹏程盘古大模型;而腾讯的思路也与阿里相似,发布了混元AI大模型;第二梯队的京东、网易、360、字节跳动等企业,也纷纷官宣了自己在AI大模型方面的布局。

而进入2023年以来,随着文心一言的发布,成为了中国第一个类ChatGPT产品后,各家的大模型也纷纷亮相,一时间,国内仿佛陷入了“大模型之战”中。

截至目前,百度文心大模型、华为盘古大模型、商汤大模型、阿里大模型都已亮相,而后还有许多大模型正在准备粉墨登场。

那么,在这匆匆发布的背后,是真的技术成熟,还是鱼龙混杂?各个大模型的实力又是怎样?

本文将从语言大模型、算力与技术底座与具体应用层面状况三大角度,来分析和研究目前已经发布的大模型的技术基础、应用场景和用户生态,看看哪些大模型更有可能在这混战中成功突围。

1

ChatGPT不该止于C端

ChatGPT,作为最早出圈的大模型产品应用,其问答的流畅程度与准确程度,可以很好地体现NLP模型的水平。

而目前,国内厂商百度、阿里也都发布了类似模型,那么,相比之下,文心一言与通义千问的表现如何?

首先是最近对话式AI们经常出现的一个典型问题,面对自己知识库中没有,或本身就是错误的提问时,仍能对着错误描述侃侃而谈,简称一本正经的胡说八道。

于是,我先问了通义千问这样一个问题:你知道唐僧为什么要上梁山吗?

通义千问在思考后,给出了这样的回答:它首先简单对唐僧进行了介绍,然后将其带入了《水浒传》中宋江的角色,但最后却又回到了《西游记》中,还讲“这一情节体现了唐僧的坚定和决心,也反映了他作为一个有信仰的人物的形象。”

阿里 华为

吓人!大量吃橘子会变成小黄人

而同样的问题给了文心一言,却得到了一个更加简短但同样荒谬的答案:唐僧上梁山的原因是因为他被迫出走,被唐朝通缉,无路可走,只能上梁山。

华为阿里对标

本次测试中,通义千问与文心一言都犯了同样的错误,不过,在我指正之后,通义千问也进行了积极地认错,展现出了良好的连续问答能力,而文心一言则并没有“听懂”我的指正。

接下来,我又问了它们一个经典的数学问题——鸡兔同笼,“鸡兔同笼,头共10,足共28,鸡兔各几只?”

通义千问在得到提问后,快速做出了回答,为我列出了计算该问题所需要的方程式,还贴心地在后面备注上了方程式的由来。

阿里投资华为5000亿

而文心一言就显得更加直接,回答了我的问题。

阿里巴巴投资华为3000亿

而在这两个问题之外,我还让它们两个一起编写了代码、赏析了诗词、撰写了文章。

总的来说,在面对用户提出的问题时,通义千问与文心一言在绝大多数情况都可以给出较为正确的回答,在面对C端用户的提问时,两个产品显示出了不相上下的实力。

而在C端的势均力敌之下,阿里却祭出了同类竞品难以比拟的B端服务能力。

通义千问在C端用户之外,专门针对企业用户发出了邀请共测,企业可基于通义千问打造专属大模型,在企业专属的大模型空间中,既可以调动通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。

具体而言,除了通用场景之外,企业由于业务特性的不同,对于大模型服务有特殊需求和要求,希望让通用的大模型变成企业专属的大模型,支撑企业各式各样的应用与服务。

阿里云希望通过产品化的方式,满足企业专属大模型从生成到部署全生命周期的需求。

在发布会当天,阿里云就宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。

同时,中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业也表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。

或许,在竞争激烈的C端之外,面向企业端的大模型构建能力,才是通义千问真正的优势所在。

而相关专家也在交流中表示,通义千问将会在企业各自深耕的领域中为他们提供构建大模型方面的帮助,带来更好的生态系统与商业模式。

2

大模型背后的算力之争,谁占先机?

纵观国内发布的大模型,可以发现,相对于国外尖端的AI企业来说,国内还像是蹒跚学步的孩童,在这条道路上刚刚起步。

而在大模型发展的道路上,最重要的实际上还是最基础的算力资源的多少与怎样利用算力的能力,那么国内顶尖大模型企业在算力上的储备几何?

首先是近日同样发布了大模型的商汤科技,在前段时间的交流中,商汤科技内部的相关专家对公司的算力情况进行了交流。

国内能拿到最尖端的显卡是来自英伟达的A100GPU,商汤科技在美国对华禁售之前,便提前囤积了上万张A100芯片,是国内算力资源比较充足的厂商。

除了来自英伟达的显卡之外,商汤还在采购国内的GPU,并且专家表示,早在去年以前,就已经在大装置中适配了许多寒武纪与海光信息的GPU卡,但在当下商汤仍旧面临着如何将国产GPU卡进行大模型训练适配的问题。

在商汤之外,华为的盘古大模型也引起了众人瞩目,但在算力资源方面,华为却略显窘迫。

因为受到美国的长期制裁,华为只得使用全部国产的加速芯片,而目前昇腾系列最先进大幅使用的型号昇腾910,也只有A10070%的性能,从长期来看,将会制约大模型的发展。

而算力的短缺也直接影响了华为的发展策略,选择性地放弃了C端的发展,主攻B端工业大模型应用。

而说起算力资源储备最多的企业,莫过于云时代中独占鳌头的阿里。

但从阿里云上的角度来看,当前云上至少拥有上万片的A100GPU,从整体来说,阿里云的算力资源至少能够达到10万片以上。如果继续抬眼,从整个集团的算力资源来说,将会是阿里云5倍的这样的一个量级。

而在英伟达的芯片之外,阿里云也拥有众多国产化的GPU芯片,而最近的项目中,便选择了寒武纪MLU370,其性能基本过关(A100的60-70%),检测合格,厂商态度积极,愿意与阿里对接,并且已经用在了CV等小模型的训练和推理上。

在2023年,阿里云算力资源的增速也将达到30%-50%。

得益于云时代的绝对领先,让阿里拥有了远超其他企业的算力资源,也让其在AI时代里天生就占得了上风。

但是,动辄超千亿参数的大模型研发,并不能靠简单堆积GPU就能实现,这是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要AI-云计算的全栈技术能力。

而阿里是全球少数在这几个领域都有深度布局、长久积累的科技公司之一,也是为数不多拥有超万亿参数大模型研发经验的机构。

AI算法方面,阿里达摩院是国内最早启动大模型研究的机构之一,2019年便开始投入大模型研发,在中文大模型领域一直处于引领地位,2021年阿里先后发布国内首个超百亿参数的多模态大模型及语言大模型,此后还训练实现了全球首个10万亿参数AI模型。

智能算力方面,阿里建成了国内最大规模的智算中心“飞天智算平台”,千卡并行效率达90%,自研网络架构可对万卡规模的AI集群提供无拥塞、高性能的集群通讯能力。基于飞天智算的阿里云深度学习平台PAI,可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍,覆盖全链路AI开发工具与大数据服务,深度支持了通义大模型的研发。

阿里云全栈AI技术体系,更是从机器学习平台、大模型即服务、产业智能三个层面,不断丰富AI服务,并通过全栈技术驱动千行百业的AI发展与应用。

阿里巴巴投资华为3000亿

可以说,阿里在云时代的成功,在一定程度上延续到了AI时代,与那些算力资源相对不足的竞争者来说,阿里在算力与技术底座方面,有着无可比拟的巨大优势。

3

大模型带来业务集合式飞跃

在拥有了算力资源与技术底座后,大模型能力若想要普惠大众,触达到每一个人,就需要应用层面的生态建设,而这,也正是众多厂商“刺刀见红”的战场,众多厂商也依据企业发展的不同,做出了不同的选择。

比如,华为盘古大模型,受算力资源不足与公司业务导向的影响,选择了指向B端的打法。

在盘古大模型发布会上,华为没有着墨于NLP模型,而是着重强调了CV大模型与科学计算大模型的应用范例。

盘古CV大模型主要应用于智能巡检、智慧物流等场景。

例如,在与能源公司合作的盘古矿山大模型中案例中,矿井现场是一个40米长的采掘机,宽度仅2米左右,传统相机很难一下子捕捉到全部画面,只能用图中的九宫格视频画面。而通过5G+AI全景视频拼接综采画面卷,传输到地面,地面工作人员将来可以实现地面控制机器进行采矿,实现矿下无人少人安全作业。

而盘古气象大模型,也在气象预测方向上超过了传统数值的计算方法。

盘古气象大模型在气象预报的关键要素和常用时间范围上精度均超过当前最先进的预报方法,同时速度相比传统方法提升1000倍以上。如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模型可以降低20%以上的位置误差。

而对阿里而言,其在国内领先的大模型能力与众多的业务板块,让阿里大模型在各个领域都能一展拳脚。

阿里云智能集团CEO张勇在峰会上表示,阿里巴巴所有产品未来都将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。

阿里华为合作

以阿里起家的电商赛道来说,大模型就有许多应用场景。

苹果qq音乐怎么调歌词速度

对商家而言,大模型最切合实际的应用场景莫过于智能客服。随着电商行业逐渐成熟,消费者对服务质量的要求日益提高,客服这个岗位有着极为巨大的降本增效需求。

而经过通义千问的改造后,能听懂消费者的话、明白消费者诉求的聪明客服机器人也将上线,将基于机器学习、大数据、自然语言处理、语义分析和理解等多项人工智能技术,为消费者提供最优质的服务。

对于平台而言,大模型可以有效提升用户的购物体验。比如,用户可能有时不清楚自己的明确需求,但通过与AI导购员交流,可以得到相当多的指引信息以及购物清单,比如开一个生日party需要哪些方面的准备,化妆需要购买哪些工具等。

在电商场景之外,接入通义千问后的办公场景,也将实现多项全新功能。

例如在钉钉文档中,可借助通义千问自动配图、创作文章、撰写邮件、生成方案;在会议中,可以完成记录、总结、生产待办事项;甚至还能帮助总结未读群聊信息中的要点......

知乎李大海简历

关于华为百度阿里员工相互跳槽

可以说,无论是对B端的企业还是C端的用户,只要有阿里系产品存在的地方,在接入通义千问后,其智能水平与易用水平,都将快速提升一个档次。

而对阿里来说,作为国内最大的商业集团之一,有了通义千问的加持,得到的提升将不会仅仅局限于某个业务线或是某个方向,而将是整体实力的飞跃。

4

写在最后

AI大模型的浪潮,开启了一个新的时代,将所有的互联网厂商都重新拉到了同一起跑线上。

在2023阿里云峰会上,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇也说出,“面对AI时代,所有产品都值得用大模型重做一次。”

而在一切应用重建后的AI时代里,核心竞争力究竟是什么?也成为了厂商们需要思考的首要问题。

在我看来,坚实的算力基础与良好的用户生态,将成为AI时代里成功的两个必要条件。

而国内,谁拥有最多高端算力资源与强大的算法进化能力,在这场大模型之战中,就有着其他企业无法比拟、得天独厚的优势。


返回网站首页

本文评论
大几十万够赔?全新劳斯莱斯库里南撞上限宽路障:直接断轴
很多人结婚时会去租赁一些豪车来开,充门面,不过驾驶这些动辄几百万的豪车时,千万要多加注意。鸿蒙系统比安卓系统内存大吗realme新机官宣首批搭载天玑1200近日,有博主爆料称,一台...
日期:01-17
千库无忧能量站24号起航 多个无忧站点互动等你来参与
  4月24日至4月25日,千库网将带着它的吉祥物库宝走进松江大学城,在上海视觉艺术学院打造一场快乐轰趴——千库无忧能量站。现场会设置无忧空间站、无忧时光博物馆、无忧知...
日期:09-21
数字藏品交易要注意知识产权问题_数字藏品是实物吗
转自:经济参考报 iphone13pro max美国售价   平面设计师Beeple的作品《每一天:最初的5000天》。资料图片   2021年3月,一件名为《每一天:最初的5000天》的NFT艺术品以超6900...
日期:08-20
iPad、iPhone等iOS设备专用32GB移动U盘亮相(苹果iPad可以插U盘吗)
【IT168报道】每一次iPad的更新,都会有很多人抱怨iPad没有USB接口,不能外接优盘。那么这一次PhotoFast可以满足你了,而且不仅仅是iPad哦,iPhone,iPod touch等iOS设备都可以。在C...
日期:07-28
KS“耐撕大会”:达少从容演讲深情献唱 辛巴现身官方直播间送祝福
  最近快到春节,不少综艺节目真的是有“百花齐放”、“争奇斗艳”的感觉了。前不久就有不少的节目陆续定档了,而最近《吐槽大会》刚播出,又有一个KS小年夜“耐撕大会”来袭...
日期:07-16
戴尔高管:像Facebook等一些高科技公司价值严重被高估(Facebook高管)
  戴尔公司CEO迈克尔·戴尔于当地时间周三在达沃斯论坛上表示,目前像Facebook等一些高科技创业公司的价值存在被严重高估的现象。   今年初,投行高盛和俄罗斯互联网投资...
日期:07-26
马斯克欲在推特上线余额宝功能  网友:未来是不是还要搞推呗「马斯克在推特上推的币」
11月10日 消息:最近,马斯克的一系列动作让网友觉得马斯克买推特的原因可能是因为喜欢微信和支付宝。马斯克今天表示,他准备在计划把推特打造成一个可以购物,甚至提供货币市场账...
日期:11-15
京东工业 上市「京东拟分拆京东工业、京东产发于港交所主板独立上市」
3月30日晚消息,京东在港交所公告,京东拟分拆京东工业、京东产发于香港联交所主板独立上市。据公告,拟议分拆完成后,公司将继续间接持有京东工业、京东产发50%以上的股权,因此,京东...
日期:03-30
阿里云大模型“通义千问”开始邀请测试
4月7日消息,刚刚,阿里云官宣大模型开始邀请测试。从发布的文字来看,阿里云大模型名称为“通义千问”,官网地址:tongyi.aliyun.com已开启企业邀测。乐视电视x55proiphone最新充电...
日期:04-07
ipadmini4能插sim卡吗_苹果:第4代iPhone和iPad不能互换SIM卡
  据国外媒体报道,苹果近日证实,即将上市的第四代iPhone手机和iPad平板电脑不能互换SIM卡。   本月初,苹果CEO史蒂夫·乔布斯(Steve Jobs)发布了第四代iPhone手机,从6月15...
日期:07-30
远光软件:用 SpreadJS 搭建电力行业“企业应用管理软件”的数据中台
  自从业界神话阿里巴巴引入“中台”的概念后,“中台”一词迅速在国内各行业间持续发酵,并催生出一系列全新的项目开发模型。   中台架构可极快满足客户需求,提高项目交付...
日期:02-17
企业百家号,一个不能被忽视的私域流量富矿
  “私域流量,还是死于流量?”在私域流量发展如火如荼的同时,人们也开始发出这样的诘问。   作为近年来广告营销行业的热词,私域流量这一概念受到追捧的背后反映出了全新...
日期:07-14
百度联盟携手去哪儿网打击机票诈骗和山寨现象
  机票诈骗和山寨现象,一直是中文在线旅行网站面临的困扰之一。去哪儿网副总裁戴政表示,消费者通过搜索引擎进入山寨的去哪儿网的网站进行机票预定,结果预付了费用,钱款遭遇...
日期:07-28
12306怎么不好使了「12306这功能很贴心 但希望你永远用不上」
出门在外,遗失物品往往在所难免。如果是在火车上不慎丢了东西,有三种方法可以找回:1、及时联系所处车站或列车工作人员详细说明遗失物品的信息、乘坐车次座位信息以及可能丢失...
日期:11-13
阿里2020第三季度营收「阿里:第三财季来自创新战略和其他营收为8.23亿元,同比下滑20%」
  讯 北京时间2月23日晚间消息,阿里巴巴(NYSE: BABA;HKEX: 9988)今日发布了截至2022年12月31日的2023财年第三季度财报(注:阿里巴巴财年与自然年不同步,从每年的4月1日开始,至第二年...
日期:02-25
旧手机卖之前怎么样能防止数据泄露「卖旧手机又不想泄露数据,只恢复出厂设置可不行」
较真要点01仅通过手机恢复出厂设置不能保障信息安全,稳妥的办法是在手机恢复出厂设置并重启后,通过多次拷贝视频、下载软件等方式,把原有手机存储内存占满,覆盖掉原有数据,然后再...
日期:09-15
腾讯抛售1600亿美团股票 王兴回应:双方会继续合作_王兴持股美团
本月中旬,腾讯宣布抛售美团的股票,所持有的价值约1600亿港元的美团股票将会分配给股东,同时腾讯总裁刘炽平也辞任美团非执行董事,并立即生效。空气净化器气态污染物2021年底,腾讯...
日期:12-02
香港恒生指数大跌原因「香港恒生指数开盘跌1% 汽车股涨跌不一」
  财联社10月3日电,香港恒生指数开盘跌1%,恒生科技指数跌0.78%,汽车股涨跌不一,吉利汽车跌近3%,蔚来涨超1%。地产股上涨,碧桂园涨近5%,绿城中国涨超4%。小米集团跌超2%,哔哩哔哩跌...
日期:10-05
瑞欧盈-埃非索2021年工业4.0奖正式启动 源自德国的行业标杆
  欧洲知名管理咨询集团瑞欧盈-埃非索近日启动了2021年度工业4.0奖的申报窗口,成为了最近工业届热门议题。   工业4.0 奖是由德国瑞欧盈-埃非索管理咨询公司(ROI Cons...
日期:12-15
病毒频现Google官方应用商店 12万部Android手机疑染毒_google检测到病毒
  6月3日,据国外媒体报道,Google官方Android市场发现24款应用被恶意植入病毒代码。受此影响,全球约12万部Android设备中毒,Google方面已经删除了这些应用。中毒Android手机隐...
日期:07-28