您的位置:首页 > 互联网

但已服务国内七成大模型厂商 字节参战_火山引擎明确不做大模型

发布时间:2023-10-02 07:55:21  来源:互联网     背景:

【】“火山引擎自己是不做大模型的,我们首先服务好国内做大模型的厂商,等他们把大模型做好之后,我们再一起合作开展对外的服务。”火山引擎总裁谭待向等表示。

随着ChatGPT的爆火,国内人工智能领域也风起云涌,互联网科技公司纷纷开启大模型军备竞赛。百度、阿里、360等大厂,以及MiniMax、智谱AI等创业公司,都已相继推出自己的大模型产品,与此同时云市场也在加速变革。

作为字节跳动旗下云服务平台,火山引擎明确不会做大模型,但发布了大模型训练云平台。谭待表示,AI大模型有巨大潜力和创新空间,火山引擎会服务客户做好大模型,共同推动各行业的智能化升级。

值得一提的是,在集团层面,字节跳动并未放弃自己做大模型。字节跳动副总裁杨震原在采访中透露,“公司在做一些学习和研究,现在还没有什么结果,未来这方面有了进展再同步。”

小米note稳定版刷开发版

火山引擎明确不做大模型

火山引擎是字节跳动于2021年6月推出的云服务业务板块,被外界称为“字节云”,它和协同办公平台飞书共同构成字节跳动对外的To B服务体系。在百度、阿里等大厂相继推出大模型产品之后,有业内人士猜测,火山引擎可能也会推出自己的大模型产品。不过,这一消息被火山引擎方面明确否认。

4月18日,火山引擎原动力大会举办。在会后的采访中,火山引擎总裁谭待明确表示,“火山引擎自己是不做大模型的。”火山引擎将接入多家大模型深度合作,为大模型厂商提供服务。

这个思路与亚马逊类似。日前,亚马逊AWS宣布推出生成式 AI(AIGC)工具“全家桶”,包括用于生成文本、分类、开放式问答和信息提取等任务的生成式大语言模型以及文本嵌入大语言模型等,AWS瞄准的也是企业客户。

谭待表示,国内很多科技公司投入到大模型建设中,他们有优秀的技术团队,也有丰富的行业知识和创新想法,但往往缺乏经过大规模场景实践的系统工程能力。火山引擎要做的就是为大模型客户提供高稳定性和高性价比的AI基础设施。

值得一提的是,虽然火山引擎不做大模型,但在集团层面,字节跳动并未放弃自己做大模型。

今年2月,据36氪报道,字节跳动已经从语言和图像两种模态上布局大模型。其中,语言大模型团队在今年组建,由字节搜索部门牵头,探索方向主要为与搜索、广告等下游业务的结合;图像大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。

3月底,有消息称,阿里M6大模型的前带头人杨红霞已加入字节跳动AI Lab(人工智能实验室),参与语言生成大模型的研发,并在语言生成大模型团队中处于领导地位,直接向字节跳动副总裁杨震原汇报。

对于上述市场消息,字节跳动方面当时均未予以回应。

在火山引擎原动力大会的采访中,杨震原透露,“大模型方面,其实公司也在做一些学习和研究,现在还没有什么结果,等未来这方面有了进展再同步。”

如何满足大模型厂商需求?

大模型需要大算力才能做出来,此外还需要很好的工程能力,去解决千卡甚至万卡并行的训练,去解决好网络问题,以及包括在训练过程中怎样使人可以更早地干预、观测等。

“对火山引擎来说,一方面是算力的供给,另一方面是云原生机器学习平台,以帮助企业应用好算力,进一步提升效率,把大模型训练的又快又稳定。”谭待如此说到。

据介绍,火山引擎机器学习平台经过抖音等海量用户业务长期打磨,支持单任务万卡级别的超大规模分布式并行训练场景。GPU弹性计算实例可灵活调度资源,随用随取,最高可以为客户节省70%的算力成本。

MiniMax是目前国内少数已经推出自研大模型产品的AI技术公司,拥有文本、视觉、声音三种通用大模型引擎能力。据MiniMax联合创始人杨斌介绍,MiniMax与火山引擎合作建立了超大规模实验平台,实现千卡级常态化训练;超大规模推理平台有万卡级算力池,支撑单日过亿次调用。

据谭待透露,国内大模型领域,七成以上已是火山引擎客户,包括智谱AI、昆仑万维等。

会上,火山引擎还宣布与字节跳动国内业务并池。基于内外统一的云原生基础架构,抖音等业务的空闲计算资源可极速调度给火山引擎客户使用,离线业务资源分钟级调度10万核CPU,在线业务资源也可潮汐复用。

日本的混动

只是,字节跳动的国内业务本身,用户数据已经很多,虽然有空闲的计算资源,字节本身也在做大模型的尝试,有多少算力能分到外部?对此,杨震原表示,“并池”实际上是一个技术问题,并不是资源问题。云计算本来就有很多客户,可以去调度一些资源,去错峰互用,把运力提上去。

一嗨出行品牌代言人

“比如抖音,其实也有波峰和波谷,晚上或深夜用的人少,这种资源就很适合科学计算的能力,因为这个是批量的,并不需要非常实时的来做这个事情。这个例子也说明了为什么通过资源的混部能够更好降低云计算的成本。”杨震原进一步解释说。

大模型不会一家独大

蛋壳公寓案件如何判的

有评论称,大模型将成为云厂商弯道超车的机会。谭待对此表示,大模型还在发展初期,面临数据安全、内容安全、隐私保护、版权保护等许多问题需要努力解决。但可以预见,大模型将带动云上AI算力急剧增长,AI算力的工作负载与通用算力的差距会越来越小,这会为各家云厂商带来新的机会,同时也会对数据中心、软硬件栈、PaaS平台带来新的挑战。

以数据中心的算力结构为例,谭待表示:“大模型需要大算力,虚拟化会带来资源损耗,规模越大就损耗越多。未来3年内,大规模的算力中心,都将形成’CPU+GPU+DPU’的混合算力结构,CPU负责通用计算,GPU负责AI计算,DPU负责资源卸载、加速和隔离,提升资源效率”。

此次原动力大会上,火山引擎发布了新一代自研DPU,实现计算、存储、网络的全组件卸载,释放更多资源给业务负载。现场数据显示,火山引擎自研DPU的网络性能高达5000万pps转发能力、延迟低至20us。

谭待认为,在大模型及下游应用发展推动下,无论传统企业还是初创企业,对AI算力都有迫切需求,企业使用多家云服务将成为常态。同时,各行业有自己高质量的私有语料,大模型不会一家独大,而是会在千行百业生长,形成多模型共生甚至协作的生态。


返回网站首页

本文评论
腾讯新总部将建科技馆 打造一棵人类百年“科技树”
11月6日,2022腾讯科学WE大会十周年如期举行。十年前,马化腾在首届WE大会上种下一颗种子,希望助力基础科学普及。WE大会历经十年,展现了人类科学的前沿突破,见证了中国科技十年的...
日期:11-08
台积电1nm制程晶圆厂选址确定 投资额逾万亿新台币_网易订阅_台积电晶圆厂在哪
【手机中国新闻】1月22日,手机中国注意到,据消息人士透露,台积电已决定在嘉义科学园区建设1nm晶圆厂,并向相关管理局提出了100公顷的用地需求。这一决策标志着台积电在先进制程...
日期:01-22
齐向东:内生安全框架要立足解决未来20年网络安全_齐向东谈网络安全
  8月12日,以“并肩应对威胁挑战”为主题的2020中国网络安全年会在网上成功召开。奇安信集团董事长齐向东在会上发表了题为《新形势 新机遇 推动安全产业再上新台阶》的主...
日期:07-15
鼎桥通信亮相2023MWC上海世界移动通信大会,助力5G时代行业互联
通信世界网消息(CWW)6月28日-30日,2023MWC上海世界移动通信大会在上海新国际博览中心举办。本次大会以“时不我待”为活动主题,鼎桥展台携物联网、行业无线、定制终端三大产品线...
日期:07-01
董宇阳简历「董宇辉进退维谷,俞敏洪一败涂地?」
文丨普子胥出品|网易科技《态℃》栏目尽管在12月16日东方甄选的直播间里,最终达成了一种除当事人外都不尴尬的和解,可俞敏洪的不轻松、不自然,董宇辉的神色拘谨、心事重重,仍给东...
日期:12-17
美国科技巨头地图产品“迈出巨大一步”:沉浸式_美国新地标
凤凰网科技讯 北京时间9月29日消息,谷歌在当地时间周三的第三届年度搜索活动上表示,该公司将为一些地点推出“沉浸式视图”和“氛围”,添加一些视觉形式细节,方便用户提前探索相...
日期:09-30
两家手机浏览器企业爆料:UC偷跑用户流量(UC浏览器偷跑流量)
  手机浏览器近期陷入混战之中,一方面,UC优视宣布将以不正当竞争为由起诉腾讯,另一方面,另两家手机浏览器企业也反过来指责UC采取偷跑用户流量等竞争手段,起诉腾讯无非是想借...
日期:07-24
美股周一:热门中概股普跌,新东方跌超11%,阿里、拼多多跌超9%_美股连创新高今天
美国时间周一,美股收盘主要股指全线下跌,均创一周多以来最大跌幅,科技股领跌。华尔街准备迎接本周晚些时候开始的财报季,财报可能显示通胀对企业的影响。道琼斯指数收于31173.84...
日期:08-29
苹果如何语音唤醒siri「苹果考虑改变iPhone语音唤醒指令:“Hey Siri”没了 直接叫Siri」
很多iPhone用户现在已经习惯了语音操作,每天都要呼叫Hey Siri”很多次,不过苹果现在考虑改变这个语音唤醒的指令,Hey Siri”没了,直接变成Siri。这个消息是著名苹果爆料记者马克...
日期:11-08
微软准备发布 Win10 21H2,不支持 Win11 升级的朋友可获更新_windows10升级21h1
  9 月 28 日消息 微软将在今年秋季推出 Windows 10 21H2 版本更新。目前 21H2 预览版仅对不支持 Win11 升级的电脑可用,满足条件的小伙伴可在 Preview 和 Beta 通道中手...
日期:12-20
在千万网友云监工武汉_武汉:运营商赶工建5G、3000万网友“云监工”
  2020年春节前后,“新型冠状病毒”引发了自SARS之后又一次全国性疫情。据国家卫健委公布数据显示:截止1月28日24时,国家卫生健康委收到31个省(区、市)累计新型冠状病毒肺炎...
日期:10-17
jupyter debug「Jupyter大升级:各种大模型都能连,聊天就能生成代码、错误修改」
机器之心报道编辑:陈萍Jupyter 在其环境中添加了基于 LLM 的聊天机器人。现在,大语言模型(LLM)与 Jupyter 连接起来了!这主要归功于一个名叫 Jupyter AI 的项目,它是官方支持的 Pr...
日期:08-04
美国地图发展「美国科技巨头地图产品“迈出巨大一步”:沉浸式」
凤凰网科技讯 北京时间9月29日消息,谷歌在当地时间周三的第三届年度搜索活动上表示,该公司将为一些地点推出“沉浸式视图”和“氛围”,添加一些视觉形式细节,方便用户提前探索相...
日期:10-06
苹果7更新ios14后相机用不了「快升级!苹果发布iOS 16.0.3:修复iPhone 14相机启动慢等烦人问题」
今天早些时候,苹果发布了iOS 16新版,主要修复了iPhone 14比较烦人的问题,比如相机启动慢等。iOS16.0.3正式版更新大小达到了1.21GB,带来了多项修复内容。需要注意的是,因苹果各区...
日期:10-17
阿里文字生成图像产品“通义万相”将于月底逐步开放
4月21日 消息:近日,阿里巴巴达摩院基础视觉团队表示,基于阿里云,阿里构建了文字生成图像产品“通义万相”,将于本月底开放给公众。特斯拉电动汽车是哪个国家生产的此前,阿里云已...
日期:04-21
Redmi Note 14新机曝光 全系1.5K屏 走性能影像双路线_红米note14
  【手机中国新闻】Note系列是Redmi旗下非常重要的产品线,也可以说是品牌“销量担当”。据手机中国了解,Redmi Note 14系列新机已经曝光,新一代机型将走性能和影像双路线,且会...
日期:01-02
今天的消费由“马公子”买单!特斯拉今日为欧洲所有电车提供免费充电
快科技8月29日消息,日前,我们从特斯拉欧洲官方获悉,为了庆祝特斯拉超充站入驻欧洲十周年,特斯拉宣布,8月29日将向所有特斯拉和非特斯拉用户提供免费充电服务。闽西汉剧特斯拉补充...
日期:08-30
Rokid发力空间计算 新一代人机交互产品Rokid AR Studio亮相
【】8月26日消息,Rokid今日发布了消费级OST(Optical See Through)个人空间计算平台Rokid AR Studio。据介绍,Rokid AR Studio延续Rokid分体式设计思路,由AR空间计算眼镜Rokid...
日期:09-16
英伟达小型超算「NVIDIA推出DGX GH200 AI超级计算机」
2023/5/29 21:38 NVIDIA推出DGX GH200 AI超级计算机   新型AI超级计算机将256个Grace Hopper超级芯片连接为巨大的、1-Exaflop、144TB GPU,用于支持生成式AI、推荐系统...
日期:05-30
第一财经:拿深圳高薪住长沙低价房 万兴科技拿出招揽人才杀手锏
  近日,第一财经发布报道《“拿深圳高薪住长沙低价房”,这类口号会让人才从沿海城市回流吗》。报道称近年来内陆城市吸引高端人才回流的举措越来越多。这也从侧面反映出,...
日期:07-16