您的位置:首页 > 互联网

百度智能云主打大模型应用落地“效价比” 一口气推出5款新模型

发布时间:2024-03-22 12:43:08  来源:互联网     背景:

【】3月21日消息,2023年,大模型在全球范围爆发式增长,经过一年的狂飙突进似发展后,业内普遍认为2024年是大模型应用落地元年。让企业客户愿意、能够、有效的应用大模型能力,成为大模型企业思考的重点。

自2023年12月以来百度智能云千帆大模型平台服务8万企业用户,累计帮助用户精调1.3万个大模型,帮助用户开发出16万个大模型应用。在这份成绩的背后,百度智能云对服务企业落地大模型了也有了一套心法。

百度副总裁谢广军在接受媒体采访时表示,2024年AI原生应用会加速落地,企业从探索场景逐步走到落地应用,这个时候会遇到模型性能、效果,以及在成本多方面的挑战。综合考量“大模型的使用效果、性能以及成本”即“效价比”,成为企业落地大模型的核心诉求。

百度副总裁谢广军

针对企业最关心的大模型落地场景、使用成本、应用开发、应用效果四大挑战,百度智能云千帆在大模型ModelBuilder、AI原生应用开发工具组件AppBuilder两个方面给出了最新“解题思路”。

一方面,为满足企业“效价比”核心诉求,百度千帆ModelBuilder大模型服务全面升级,全新发布3个轻量级大模型、2个垂直场景大模型。

另一方面,百度智能云对千帆AppBuilder组件能力全面升级,开放工具组件增至55个,进一步大幅降低AI原生应用开发门槛。

通过这两条腿齐发力,以期加速大模型在企业业务中的应用落地。

上新5款大模型 最高推理调用成本下降53%

谢广军表示,当前业界已逐渐形成一个共识,即模型不见得是参数规模越大越好。在很多实际的场景当中,用小尺寸的专家模型也能够达到通用大模型的效果,小尺寸专家模型的推理成本会更低,更便宜。大模型“效价比”才是企业核心诉求。

基于这样的研究方向,百度智能云推出了三款轻量级大模型。

ERNIE Speed作为三款轻量级大模型中的“大个子”,推理场景下拥有最高128k的上下文长度,在处理知识问答等任务时,能够更好的处理上下文的依赖关系,生成更加连贯和准确的预测或回答。同时,针对特定场景可以将ERNIE Speed作为基座模型进行精调,模型效果可以追平甚至超过旗舰级大参数规模大模型,效价比大幅提升。

ERNIE Lite,其参数量相比ERNIE Speed更小,也更加适合搭载在低算力的AI加速卡上处理推理任务,在兼顾模型效果与推理性能的同时,大幅降低客户落地应用成本。作为ERNIE-Bot-turbo模型的升级版,ERNIE Lite在情感分析、多任务学习、自然推理等场景下的应用效果提升了20%。推理调用成本大幅下降了53%。

ERNIE Tiny,三款轻量级模型中参数量最小的大模型,为客户提供了极致低成本、低延迟的最佳选择。在检索、推荐、意图识别等高并发、低延时等应用场景中,ERNIE Tiny的优异性能呈现了不俗表现。在某对话推荐业务场景中,精调后的ERNIE Tiny在搜索引擎推荐词激发环节,相比ERNIE 3.5,对话轮次增长了3.5%,成本下降了32%。

此外,企业在落地应用中,对大模型在人物扮演、外部工具调用均有更高的效果要求。本次千帆大模型平台ModelBuilder还基于对企业场景的深入洞察,结合百度自身业务最佳实践沉淀,推出了ERNIE Character和ERNIE Functions两款垂直场景大模型,分别适配客户在角色扮演类应用场景(如游戏NPC、客服对话等)和工具调用场景(对话中使用外部工具、调用业务函数等)中的使用需求。

谢广军介绍,在企业实践中,某智能硬件厂商,基于ERNIE Character打造智能助理,应用该模型后在人设一致性、激发并提升用户聊天欲望等方面效果显著提升。某旅游出行类APP,使用ERNIE  Functions打造智能客服助手,在执行订票、查询航班状态等多种function调用上准确性达到85%。

谢广军强调,新发布的三款轻量级模型主要有两个使用场景:一是客户、合作伙伴会结合自己的数据做垂类场景模型。一是百度也会基于这些小的基座模型,去开发一些行业垂类场景模型,比如做教育行业的教辅答题和解题等。

向量数据库VDB 1.0亮相 开放工具组件达55个

千帆AppBuilder作为产业级AI原生应用开发平台,是千帆的重要组成部分。

此次升级后的AppBuilder开放的工具组件多达55个。包括基于百度多年技术积累和自有业务沉淀的大模型组件、AI能力组件,也包括搜索等百度特色的业务组件、和多场景的第三方API工具,另外还提供了 RAG(知识检索问答)、GBI(生成式数据分析)等根据典型应用场景深入调优的高级能力组件。

开发完成后,应用可多渠道分发与集成,AppBuilder支持将应用一键分发到微信客服、微信公众号、Web端/H5及百度灵境矩阵等主流渠道。基于百度灵境矩阵,应用可在百度搜索、百度信息流等主流场景分发与挂载。真正实现应用开发出来后,就直接触达用户,打通从AI原生应用创建到开发再到分发的全流程。

开发AI原生应用离不开云基础设施,值得一提的是,本次发布的基础组件还包括了百度智能云全新推出的向量数据库VDB 1.0。

谢广军表示,大模型火了之后,向量数据库重要性凸显,它可以帮助减轻幻觉、解决数据数据更新等问题,也是加速大模型在场景落地的关键技术。

百度向量数据库VDB1.0既是一项独立存在的产品和服务,是百度智能云的一项基础设施,也是作为一项基础云的组件和能力封装到了千帆AppBuilder里面。

谢广军强调:“当前大模型落地过程中,向量数据库应用成本相对较高,企业在千帆AppBuilder中组件化利用向量数据库的能力,是一个性价比兼具的方案,相比同类开源产品,VDB 1.0性能最高提升10倍,相比付费产品,则更省成本。”

模型路由,让成本再降15%

会上,谢广军还透露了百度智能云的模型路由服务。百度智能云的模型路由是以降本为目的来做MOE。

谢广军表示,模型路由能够帮助客户在使用场景中,根据不同情况选择不同的能力模型。小模型往往比较擅长垂类场景,但在实际使用过程中,这种场景会非常多,十分泛化,模型路由通过分流,让在某一垂类问题上更专业的专家模型来回答,专业的模型解答专业的问题。相比旗舰模型或者更大尺寸的模型,小尺寸模型也能达到同样甚至赶超的效果,提升性能的同时降成本。如果都不能回答,就让大尺寸的模型或者旗舰模型来“兜底”。

amd r7 5800x与r9 3900x如何选择

富士康是台资吗

据介绍,通过百度智能云的模型路由方案,有企业客户的模型推理成本降低15%。

谢广军称:“当前,ModelRouter已启动邀测,一些手机厂商客户在应用过程中已经感受到成本的下降,保证业务效果不降的情况下,将简单的Query调度到更轻量级的模型上,使得综合成本下降。”(果青)


返回网站首页

本文评论
小米14手机参数曝光:C8材料屏、3000尼特峰值亮度,号称堪比 iPhone15Pro_小米14长度
10月26日 消息:小米公司于今晚举办新品发布会,正式发布了小米14系列新机。小米14实现多方面的升级,采用1.5K 高清屏,分辨率达到2670x1200,每英寸像素460PPI,号称提供与 iPhone15P...
日期:10-26
百度此时进入视频行业 迟到的赌注能否跨出搜索宿命?_百度最后的赌注
  这个作风确有几分“纨绔子弟”的后来者,能一改百度产品跨出搜索就受挫的宿命吗?   他是被中国互联网圈儿膜拜的Outlook Express高手,摸索了100多种使用窍门。他被女下...
日期:07-26
上汽大通maxusg10试驾「彻底“玩转”车内空间,上汽大通MAXUS MIFA 9试驾体验」
当“电动、智能、舒适”成为MPV消费者选车关键词,全球多人出行领域,全尺寸纯电MPV的“风口”已经到来。需求决定市场,在国家开放二胎、鼓励三胎政策的刺激下,更大空间、高度舒适...
日期:09-16
中国信通院联合阿里云、清华大学网络科学与网络空间研究院发布《“DNS+”发展白皮书》
域名系统(DNS: Domain Name System)已提出整四十年,期间云计算、工业互联网、区块链和IPv6等技术逐渐发展,以DNS为代表的各种网络标识服务的技术兴起,并趋于技术一体化、平台普...
日期:11-08
维修不再直接换新:苹果将为iPhone 14系列提供同机维修服务_苹果官网14天内换新
近日,根据苹果的一份内部备忘录显示,全球范围内的Apple Store和苹果授权服务提供商,将陆续为iPhone 14系列的全部四款机型提供同机维修服务。简单来说,Apple Store和苹果授权服...
日期:11-20
Visa开发基于区块链的联合计算系统,用于处理大规模私有数据
《Visa开发基于区块链的联合计算系统,用于处理大规模私有数据》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系...
日期:08-02
美团直播:排头兵先行,主力军未动_美团外卖直播平台
声明:本文来自微信公众号“财经故事荟”(ID:cjgshui),作者:王舒然,授权转载发布。折扣给得扎实,用户薅得开心,商家进度“参差不齐”。“1.5元买到了甜啦啦的冰鲜柠檬水”“6元拿下...
日期:07-21
消费“折叠”,电商“拼刺刀”的时代到来了
声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:纪南,授权转载发布。今年年初,东北证券首席经济学家付鹏在某经济论坛上下了一个判断:过去40年的宏观投资逻辑正在...
日期:06-26
小米Mix Fold 3线下缺货 二代机价格仍高端定位“不降价”
财联社8月23日讯,(记者 唐植潇),日前小米发布了旗下第三款折叠屏产品,并在社交平台上表示,小米Mix Fold 3的销量达到了前代销量的2.25倍。记者走访小米之家线下店了解到,目前小米Mi...
日期:08-23
亿万克:以领先液冷技术助力数据中心绿色发展
通信世界网消息(CWW)数据中心是数字经济的核心驱动力。随着数据中心规模的不断扩大,其能耗和碳排放也日益增加,给环境和社会带来了巨大的压力。因此,如何提高数据中心的能效,降低...
日期:07-21
日本隐私监管机构就用户数据警告 ChatGPT 开发商 OpenAI
6月2日消息:日本的隐私监管机构周五表示,已警告微软支持的初创企业 OpenAI,即 ChatGPT 聊天机器人背后的公司,不得在未经人们许可的情况下收集敏感数据。SKG智能穿戴香港可以使...
日期:06-02
Opera Touch浏览器登陆iPad并带来隐私浏览模式
  【TechWeb】老牌浏览器Opera Touch继去年10月登陆iPhone之后,今天Opera公司正式宣布Opera Touch移动浏览器登陆iPad平台。在本次更新中iOS平台的Opera Touch还引入了隐...
日期:07-23
蓝凌软件入编《2021年企业数字化转型场景研究报告》
  12月14日,首届中央企业数字化转型峰会在深圳湾体育中心顺利开幕,峰会由大湾区中央企业数字化协同创新联盟、中央企业数字化发展研究院主办,有关中央企业、地方国有企业等...
日期:07-17
家长信偏方致3天大宝宝气管堵塞 网友吐槽:很多老人愚昧还自以为是
陕西西安一家长听信老人的话,为了防止宝宝夜惊,于是给刚出生3天的宝宝吃了黄米”大小的七珍丹,没想到宝宝吃了以后3个小时左右开始出现吐奶、呼吸不顺畅的表现。就医后,发现宝宝...
日期:04-08
固态断路器商业化!TYT泰永长征推动尖端技术落地_固态断路器 优缺点
固态断路器作为新生产品,即使在国际市场上,也属于只有少数企业掌握的尖端领域。而在商业化道路上更是遇到非常多的阻碍,始终还未大规模普及。自 2021 年发布国内首 款固态断路...
日期:08-07
Zen 5处理器单核性能将提升30% Zen架构之父预测AMD
4月8日消息,Zen架构之父吉姆・凯勒(Jim Keller)近日在采访中透露,相比较Zen 4,AMD即将推出的Zen 5单核性能将提升30%,时钟频率高于4.0GHz,功耗稳定在250瓦以下。吉姆・凯勒在AMD开...
日期:10-03
用户称小米电视已可永久关闭开机广告:方法公布_怎么关闭小米电视开机广告
快科技10月11日消息,近日,有网友发帖称,小米电视已经可以永久关闭开机广告。该网友称,具体方法为:小米商城App找到人工客服,称关闭电视广告,客服会让提供MAC地址(以太网MAC、WiFi M...
日期:10-11
社交元宇宙Soul的眼泪_社交元宇宙概念股
声明:本文来自于微信公众号刺猬公社(ID:ciweigongshe),文|张静伦,编|园长,授权转载发布。第三次IPO,Soul还是不挣钱。“现在这个软件真的不是我们当初认识的那个软件了。以前的用户...
日期:05-20
微信:有零钱的账号不会被系统注销
7月17日 消息:日前,网上有传言称,微信号长期没有使用被注销,账号有200元钱被收走,对此腾讯官方作出了回应。腾讯微信团队微博发文表示,微信有零钱的微信号就不会被注销。喜茶费用...
日期:07-18
iqoo5120w闪充「超快闪充2K直屏旗舰iQOO 11S登场 售价3799元起 「200W」」
2023年7月4日晚,“杭州亚运会电竞赛事官方用机”iQOO 11S正式发布,售价3799元起。iQOO 11S搭载高通第二代骁龙8旗舰5G移动平台,携手增强版LPDDR5X和UFS 4.0组成“旗舰性能铁三...
日期:09-11