您的位置:首页 > 互联网

百度沈抖:智能体是进入生产场景的最佳形态_沈抖执掌的百度移动生态变好了吗

发布时间:2024-09-26 14:18:59  来源:互联网     背景:

通信世界网消息(CWW)为帮助企业更快、更好、更省地使用大模型,百度智能云分别针对算力、模型、AI应用,全面升级百舸AI异构计算平台4.0、千帆大模型平台3.0两大AI基础设施,并升级代码助手、智能客服、数字人三大AI原生应用产品。

百度集团执行副总裁、百度智能云事业群总裁沈抖表示,大模型以及配套的算力管理平台、模型和应用开发平台,正在迅速成为新一基础设施。

“2024年大模型的产业落地正在加速,目前在千帆大模型平台上,文心大模型日均调用量超过7亿次,累计帮助用户精调了3万个大模型,开发出70多万个企业级应用。过去一年,文心旗舰大模型降价幅度超过90%,主力模型全面免费,最大限度降低了企业创新试错的成本。”沈抖说。

雷军红米7发布会

升级百舸4.0:模型训练有效时长达99.5%,可高效管理十万卡集群

大算力是大模型落地的基础条件。为满足企业落地大模型从集群创建、开发实验,到模型训练、推理的全旅程算力需求,应对超大规模GPU集群高成本、难运营两大挑战,百度智能云升级发布百舸AI异构计算平台4.0,面向万卡、十万卡集群全面升级算力管理能力。

首先,在集群创建阶段,企业通常需要进行大量复杂、琐碎的算力配置和调试工作。百舸4.0预置了主流的大模型训练工具,能够实现工具层面的秒级部署,并将万卡集群运行准备时间从几周缩减至1小时,极大地提升部署效率,缩短业务上线周期。

百度百舸AI异构计算平台4.0

在开发实验阶段,企业需要针对业务目标对不同架构、参数的模型进行多次测试,进而制定最佳模型训练策略,保障后续训练的性能和效果。百舸4.0全新升级的可观测大盘,能够对多芯适配、集群效能、任务自动容错等方面进行全方位监测,提供直观决策依据,帮助用户更好地把控整体项目。

在模型训练阶段,稳定和高效是衡量GPU集群水平的“金指标”、“硬通货”。

在稳定性方面,一张GPU出现故障就会导致集群整体停摆,大量时间、成本浪费在故障恢复和数据回滚上。百舸4.0能够自动筛查集群状态,并基于对GPU故障的精准预测,及时转移工作负载,降低故障发生频次。此外,百舸独有的故障秒级感知定位、Flash Checkpoint模型任务状态回滚等技术,能够大幅减少集群故障处置时间,实现接近无损的集群容错。

目前,百舸在万卡集群上实现了有效训练时长占比99.5%以上,业界领先,极大地节约了客户算力与时间成本。此外,百舸4.0通过在集群设计、任务调度、并行策略、显存优化等一系列创新,大幅提升了集群的模型训练效率,整体性能相比业界平均水平提升高达30%。

在模型推理环节,百舸则通过架构分离、KV Cache、负载分配等一系列加速方法,实现了模型推理的降本提效,尤其在长文本推理方面,推理效率提升超过1倍。

面向未来,沈抖认为,大模型的Scaling Law将在一段时间内持续有效,很快就会有更多的十万卡集群出现,但是管理十万卡的难度与管理万卡有着天壤之别。

首先,在物理空间方面,十万卡集群需要占据大概10万平方米空间,相当于14个标准足球场的面积;在能耗方面,每天则要消耗大约300万千瓦时的电力,相当于北京市东城区一天的居民用电量。这种对于空间和能源的巨大需求,远远超过了传统机房部署方式的承载能力,跨地域机房部署又会给网络通信带来巨大挑战。此外,十万卡集群中的GPU故障将会非常频繁,有效训练时长占也将迎来新的挑战。

针对这些难题,百舸4.0已经构建了十万卡级别的超大规模无拥塞HPN高性能网络、10ms级别超高精度网络监控,以及面向十万卡集群的分钟级故障恢复能力。

“百舸4.0正是为部署十万卡大规模集群而设计的。今天的百舸4.0,已经具备了成熟的十万卡集群部署和管理能力,就是要突破这些新挑战,为整个产业提供持续领先的算力平台。”沈抖说。

生数科技作为国内领先的多模态大模型厂商,基于百舸平台开发出国内首款全面对标OpenAI Sora的视频大模型“Vidu”。会上,生数科技联合创始人兼CEO唐家渝宣布,即日起Vidu将通过百度智能云千帆大模型平台面向开发者、企业用户开放API服务。

生数科技联合创始人兼CEO唐家渝

对于自建智算中心的客户,百舸4.0此番还对“一云多芯”能力进行了升级。在万卡规模集群上,多芯混合训练效能高达95%,保持业界领先。“要建设更大的集群,同时确保供应链的安全和弹性,势必会存在不同芯片混合使用的情况,也就是说,对于自建智算中心的客户来说,一云多芯是必然选择。”沈抖说。

以中国邮政储蓄银行为例,2023年,为加速大模型应用落地,邮储银行新增大量来自不同厂商的GPU资源,基于大模型为18个核心业务系统、30多家分行的金融业务提供AI赋能。在百舸的支持下,邮储银行顺利完成了不同型号GPU资源的部署、上线;同时,也实现了GPU、CPU算力的规划重组,有力保障了300多个大小模型、6000多次训练任务。模型迭代时间也从过去的一个半月大幅缩短至半天,并实现了更好的模型效果。

长安汽车执行副总裁张晓宇表示,基于百舸平台,百度智能云与长安汽车合作探索开发了整套自动驾驶模型训练的最佳实践方案,实现了GPU资源的精细化管理与调度。双方紧密配合,在数据加载、计算效率、通信方式等维度进行联合优化,使得算力总体平均使用率提升到90%以上,综合资源利用率提升了50%。

沈抖执掌的百度移动生态变好了吗

长安汽车执行副总裁张晓宇

发布千帆3.0:三大服务全面升级,一句话即可生成企业级应用

为了满足企业客户对模型调用、模型开发、应用开发的需求,百度智能云发布千帆大模型平台3.0。

在模型调用方面,升级后的千帆平台,不但可以调用包括文心系列大模型在内的近百个国内外大模型,还支持调用语音、视觉等各种传统的小模型。在扩大模型种类的同时,百度智能云持续降低模型调用成本。过去一年,文心旗舰大模型降价幅度超过90%、主力模型全面免费,最大限度降低企业创新试错的成本。

文心大模型家族全景图

在模型开发方面,对于需要定制、微调专属模型的客户,千帆3.0不仅提供了最完善的大模型工具链,还支持CV、NLP、语音等传统模型的开发,并实现数据、模型、算力等资源的统一纳管和调度,为企业提供一站式的大、小模型开发服务。

千帆平台大模型工具链

模型投入使用后,千帆平台还支持企业将应用中产生的数据,经过采样评估、人工标注、对齐或微调等方式反馈给模型,形成数据飞轮,持续优化模型效果,放大模型在特定场景下的优势。

在应用开发方面,针对企业落地大模型的高频应用场景,千帆3.0从检索效果、检索性能、存储扩展、调配灵活性四方面对企业级检索增强生成(RAG)进行了全面升级;针对企业级Agent的开发,千帆3.0增加了业务自主编排、人工编排、知识注入、记忆能力以及百度搜索等80多个官方组件支持。

此外,本次大会还发布了智能化低代码应用开发平台“AI速搭”,通过自然语言对话就能进行企业级应用开发,一句话就可以完成应用创建。

沈抖在大会现场还演示了如何通过对话,在AI速搭平台上开发一个资产管理应用。只需一句话描述对目标系统的需求,包含资产信息、资产入库、资产领用、资产维修、资产报废等功能模块,大模型就可以清晰地理解需求并生成应用。过去,这样一个应用即使用低代码方式开发也需要几天的时间,现在只需几分钟就能完成。

工具平台的不断完善,也促进了过去一年大模型产业落地的爆发式增长。目前,在千帆平台上,文心大模型日均调用量超过7亿次,千帆平台累计帮助用户精调了3万个大模型,开发出70多万个企业级应用。

三星电子大中华区总裁崔胜植表示,2024年初,三星在全球市场推出Galaxy AI,并与百度智能云达成战略合作,基于千帆平台、百度识图为中国用户带来国际领先的Galaxy AI本地化功能,包括即圈即搜、笔记助手、转录助手、聊天助手、浏览助手等移动 AI 体验。

三星电子大中华区总裁崔胜植

在招聘领域,猎聘基于千帆平台,通过调用文心大模型,结合自身丰富的行业know-how,能够对企业岗位需求和求职者简历内容进行语义理解分析,并实现智能化的简历筛选功能,人岗匹配准确率相比业界平均水平的70%高出15个百分点,高达85%,并提升招聘效率50%以上。

在教育领域,考试宝作为一款职业教育在线学习App,过去主要依赖人工为会员提供试题解析服务,速度慢、成本高,有些试题甚者需要等待一天以上才能得到解析结果。如今,通过提示词工程和调用文心大模型,考试宝实现了试题的智能化解析,只需上传试题就能秒级得到解析结果,单条试题解析成本也从过去的1.5元降到3厘,降幅高达98%,用户付费意愿也增长了一倍以上。

此外,千帆行业增强版提供了体系化的工具和组件,支持行业客户、合作伙伴在千帆通用底座上不断添加行业特色,从而更方便地开发适合自己的行业应用。目前,千帆平台上已经沉淀了包括制造、能源、交通,政务、金融、汽车、教育、互联网在内的八大行业解决方案。

南方电网数字电网研究院副总经理胡荣表示,去年九月,南方电网发布了行业垂直领域首个自主可控的大模型“大瓦特”。“大瓦特”既是大模型、小模型及智能体构成的模型体系,也是开放共享的平台与生态体系。平台上,南方电网基于百度智能云千帆平台构建了电力调度值班助手。在应对突发事件时,电力调度值班助手可以秒级生成处置方案,极大地增强了调度员的应急响应能力。

南方电网数字电网研究院副总经理胡荣

代码助手、智能客服、数字人全面升级

随着大模型产业落地逐渐走向深水区,AI原生应用也将迎来爆发式增长,为了满足企业直接选购成熟AI应用的需求,百度智能云面向数字人、智能客服、代码提效三大领域,升级了三大AI原生应用产品。

基于文心大模型重构的AI原生智能客服应用“客悦”,在用户复杂意图理解、多模态信息交流等方面实现了大幅提升,让智能客服变得更聪明、更拟人。“问题自助解决率”是智能客服领域最关键的考核指标,当前业内平均水平是80%,升级后,客悦将这一指标提升至92%,实现业界领先。目前,客悦已累计帮助企业客户服务超过1.5亿人次,交互超过5亿次。

基于大模型能力,新升级的曦灵数字人4.0支持根据文字快速生成不同妆造、不同行业特色的3D数字人形象和视频。本次大会期间,曦灵平台宣布:将3D超写实数字人的价格从万元大幅降价至199元,达到业内最低价。

全新升级的4D(3D+时间维度)自动绑定技术和创新模态迁移技术,还解决了传统2D数字人动作僵硬的问题,可以实现人物在不同角度、形体、表情的高度一致,即使是面部微表情也能做到自然、逼真。

全新升级的全流程AI代码提效工具“文心快码”,聚焦研发全生命周期的业务流,实现了从项目接手到最终交付,全流程编码开发效率与质量的双重提升。

本次大会,文心快码业界首发企业级代码架构解释、企业级代码审查,两项全新功能。企业级代码架构解释能在项目接手初期,实现工程架构的智能解读,帮工程师快速理解业务逻辑;而企业级代码审查则能传承资深工程师的编码经验,智能辅助程序员查缺补漏。

此外,针对市面上通用代码助手缺乏对企业历史代码库的理解的痛点,文心快码全新升级的企业级代码辅助能力能够深度理解企业代码库,快速学习企业过往的代码与规范,让生成的代码更贴近企业的要求。

目前,文心快码已经服务超过1万家企业客户,帮助数百万中国开发者提升编码效率,整体提升研发效率20%。


返回网站首页

本文评论
曾拒绝10亿美元收购OpenAI股权 Intel错失AI关键机遇_intel 收购altera
8月8日消息,据媒体报道,七年前,Intel曾有机会以10亿美元收购OpenAI 15%的股权,但时任CEO鲍勃·斯旺(Bob Swan)并未推进这一谈判。报道称,如果其在七年前做出了正确选择,Intel的命运...
日期:08-08
奔驰力推电改油方案(奔奔 油改电)
  纯电动力与内燃机动力对乘用车平台的要求可谓截然不同,前者要为电池包预留足够的空间以达成可观的续航能力,还要考虑如何布置电池与电机的冷却回路。   车厂设计新平...
日期:01-24
微软推出 GPT-4 驱动的网络安全 AI 助手 Security Copilot
3月29日消息:在宣布为 Office 应用提供 AI 驱动的 Copilot 助手后,微软现在将注意力转向网络安全。微软 Security Copilot 是网络安全专业人士的新助手,旨在帮助防御者识别违...
日期:03-29
鹅厂革新大模型工具全链条!5分钟开发AI助手,河南学生已经用上了
声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:明敏 鱼羊 ,授权转载发布。大模型的风,吹进中小学了。在河南,十几所中小学的学生老师,都已经用上专用大模型辅助学习和教课。...
日期:05-21
视频播放超4000万,花样百出的剧情赛道如何撬动流量?
声明:本文来自于微信公众号飞瓜说(ID:feiguashuo),作者:云知,授权转载发布。剧情类视频一向是快手热门视频榜上的常客,让用户们刷的乐此不疲。而最近,爆款的剧情类视频屡出,更是呈现出...
日期:10-28
redmi k40 旗舰骁龙870怎么样「redmik70全系骁龙K70发布_第二代骁龙8加持 2499元起-Redmi」
来源:中关村在线在今晚的Redmi十周年暨K70系列手机新品发布会上,Redmi K70系列新机正式发布,标准版机型Redmi K70也备受瞩目。这款手机定位为“新一代旗舰性能新标杆”,售价从24...
日期:11-30
社交元宇宙软件_552个元宇宙App,70个搞社交,哪款真能交到朋友?
声明:本文来自微信公众号“雪豹财经社”(ID:xuebaocaijingshe),作者:高旭洋,,授权转载发布。元宇宙社交,远在宇宙中Fast Reading元宇宙社交已渐成红海。2021年11月到今年1月,约有55...
日期:08-04
第三季度,360数科实现营收37亿元,同比增长43_360数科第二季度营收41.832亿元 净利润同比下降37%
中国市场转型的过程 查看最新行情   讯 北京时间8月19日凌晨消息,360数科(Nasdaq:QFIN)今日公布了该公司截至2022年6月30日的2022财年第二季度未经审计财报...
日期:08-21
男子驾车疯狂违章 上传视频炫耀自曝!后续舒适_男子拍361张车辆违章照片
日前,网上流传出一段新鲜出炉的违章驾驶视频”,视频中的驾驶员可以说是违章驾驶教科书级别”的反面教材。车辆的行车记录仪视频,还贴心的标注了违章驾驶的时间(3月21日 7:49)、地...
日期:03-24
同济一本科寝室四名男生同时直博:都在共同进步 激发学习动力
10月23日消息,据媒体报道,来自上海同济大学334寝室的四位男生,他们全寝成功直博引发关注。他们是学校化学科学与工程学院2020级本科生,其中谭睿皓直博至清华大学,夏辉康直博至复...
日期:10-24
第三方支付业务发展现状_第三方支付行业将开始洗牌 近半企业或将彻底消失
  随着首批正规军的诞生,第三方支付行业将开始洗牌,近半企业或将彻底消失   去年12月17家第三方支付企业申领牌照在央行公示后,牌照的发放就进入了倒计时。   记者昨日...
日期:07-26
谷歌pixel2「谷歌Pixel Fold折叠屏手机定档5月10日:经典“相机条”设计」
快科技5月5日消息,谷歌将于5月10日举行2023年度I/O大会,除了新一代的Pixel 8系列外,还将带来Pixel Fold折叠屏手机。随着发布会的临近,谷歌也官宣了Pixel Fold折叠屏手机,并展现...
日期:05-06
毕业生小心受骗!华为辟谣有远程实习和内推实习:虚假信息_华为开放平台 远程真机
快科技7月18日消息,刚刚毕业的大学生一般都缺乏求职经验,不法分子往往利用毕业生急于找工作的心理进行诈骗。针对网上出现的打着华为旗号、需要付费的远程实习”内推实习”等...
日期:07-19
点亮美好艺术生活,壹哆哆App即将发布_壹哆哆智能艺术IP小镇
  据悉,智能艺术生活化平台“壹哆哆” App(yidodo.com)将于2019年10月14日在北京·梵石iTown黑糖盒子艺术中心举行发布仪式。 发布仪式举办场地:北京·梵石iTown黑糖盒子...
日期:06-03
智库云遇黄石港_智库云科技集团黄石
  ,梦想临空腾飞   2月23日上午,黄石临空商务产业园重点项目开工暨签约的仪式拉开帷幕,市委书记董卫民、市长吴锦等出席开工仪式,春回大地,发展临空经济的种子已经在黄石肥...
日期:07-16
广西移动智慧生活_广西首个全光Wi-Fi组网服务! 广西移动开启智慧家居新体验
  畅享全屋千兆W-iFi,开启智慧家居新体验。5月17日,中国移动广西公司(以下简称“广西移动”)与智慧家庭运营中心联合发布广西首个全光Wi-Fi组网服务,以全光纤组网实现全屋超...
日期:02-10
美团陈晖「前美团高级副总裁陈亮将于AI大模型领域创业」
凤凰网科技讯 4月14日消息,前美团高级副总裁、最高决策机构S-team成员陈亮于近期投身AI大模型相关创业,目前已与少量投资机构接触。知情人士表示,目前陈亮尚未组建完整的技术团...
日期:04-15
中概股周一收盘涨跌互现 知乎涨超5% 斗鱼跌超7%_中概股暴涨原因
  北京时间27日凌晨,美股周一收跌,道指下跌近330点,标普500指数创今年迄今的最低收盘水平。全球风险资产均遭抛售。美国国债收益率飙升和外汇市场动荡,令股市承压。英镑兑美元...
日期:10-02
二郎神黑化「黑神话《未尽》美术导演专访:揭秘动画中二郎神为何是白发」
快科技9月13日消息,日前,黑神话《未尽》的美术导演无言接受了中国电影报道的专访,分享了创作历程和感受,并揭秘了动画中的二郎神为何是白发。她表示,游戏科学当时给的参考图就是...
日期:09-14
中国空间站"太空菜园"画面公开!一片欣欣向荣_中国空间站太空行走视频
太空种菜,挑战无限!中国载人航天工程最新消息显示,神舟十八号飞船的宇航员叶光富、李聪、李广苏已在太空驻留逾4个月。从公开的画面中可见,宇航员在空间站内开展了丰富的科学实...
日期:09-11