您的位置:首页 > 互联网

腾讯吴永坚:AI大模型催生“效率革命”,重塑智能应用「腾讯副总裁吴」

发布时间:2023-09-07 22:20:13  来源:互联网     背景:

   9 月 7 日, 2023 腾讯全球数字生态大会在深圳国际会展中心举行,聚焦产业未来发展新趋势以及自研技术产品的最 新进展,展示了全方位的行业前沿与智慧洞见。在行业大模型及智能应用专场上,腾讯云副总裁、腾讯云智能研发负责人、腾讯企点研发负责人吴永坚发表《MaaS助力应用升级 重塑智能时代生产力》主题演讲。基于AI大模型技术,腾讯云更新升级近 10 款智能应用和解决方案,进一步加快模型产业落地。

iPhone12取消刘海

  腾讯云副总裁、腾讯云智能研发负责人、腾讯企点研发负责人 吴永坚

  吴永坚认为,AI大模型应用,催生“效率革命”,让智能应用表现出更强的能力、更高的效率。例如,在AIGC应用方面,腾讯混元大模型正式通过腾讯云对外开放,用户可以通过自然语言给模型输入内容生成指令,提升文案创作效率。依托腾讯自研的AI绘画模型,腾讯云AI绘画实现输入文本、图片智能生成图像,支持超过 25 种绘画风格,共同为高质量、高效率的内容创作提供支持,加快在内容社区、电商等场景落地。

  同时,腾讯云依托行业大模型解决方案,提升了图像识别、数据分析、人机交互等多款智能应用生产效率,将更多元化的,即插即用的产品、服务推向市场,重塑智能时代生产力。

  吴永坚介绍,在图像识别领域,TI-OCR训练平台集成OCR大模型,借助端到端算法,助力客户解决特定场景识别难题,减少训练成本和训练时长;在数据分析领域,腾讯企点分析·AI助手通过分析大模型,实现零门槛对话式分析,让人人都能拥有专业数据分析能力,为业务一线提供决策支持。在人机交互方面,通过行业大模型中枢,对接海量知识和工具,实现文字、语言、视频等多模态意图理解,生成智能、精准答案输出,支持更智能、更高效、更自然的智能客服、AI助手、数智人应用落地。

  吴永坚表示,未来腾讯云将继续推动AI大模型等先进技术,应用于内部PaaS、SaaS产品,验证MaaS服务的可用性、易用性。另一方面,也将持续打造更多开箱即用的AI大模型产品、服务,打通AI产业落地全链条,助力客户实现数智化升级。

  以下为吴永坚主题演讲内容整理:

  各位线上的观众、媒体朋友们,大家好!我是腾讯的吴永坚,今天我分享的主题是《MaaS助力应用升级 重塑智能时代生产力》。

怎么把邮箱变成企业邮箱

  今年 6 月,我们正式发布了腾讯云行业大模型解决方案,助力客户将AI大模型应用于产业场景。与此同时,我们也推动内部实践,基于行业大模型,推出腾讯企点智能客服、企点AI助手两款产品,通过技术创新解决智能客服“不智能”,数据分析门槛高的难题。

  随后,我们将AI大模型能力应用到更广泛的PaaS、SaaS产品。一方面,验证我们MaaS服务的可用性、易用性。另一方面,也将更多开箱即用的产品、服务,向客户开放,推动大模型在实际生产、运营场景发挥效用。

  今天,借数字生态大会,和大家分享一下我们的最新实践。

  依托腾讯云多年深耕产业互联网的经验,我们从产业需求出发,基于自研腾讯混元大模型,同时支持主流开源模型应用,在TI平台内置高质量行业大模型,为客户提供不同规模的模型服务。通过升级大模型训练、精调工具链,助力企业快速生成专属模型,升级智能应用,加快模型产业落地。

  首先和大家分享,我们基于腾讯混元大模型,在AIGC应用方面的探索。

  过去,在文案创作场景,传统创作以“人工”为核心,容易产生创意不足、时效性不足、质量不可控等问题。今天,腾讯混元大模型正式通过腾讯云对外开放,用户可以通过自然语言给模型输入内容生成指令,提升文案创作效率;通过参数选择、多轮输入,对生成内容进行控制、调优,提升文案创作效果;根据营销、创作、效率等不同场景需求,生成对应专属内容,提升文案可用性。同时,还可以与广告平台、UGC平台、SaaS服务实现快速连接,加速落地,为各类场景提供更精准、高效的商业文案创作工具。

腾讯副总裁吴

  同样,传统绘画创作,也需要耗费大量的时间和精力,并且严重依赖于创作者的专业水平和主观经验,给企业带来较大的运营成本。我们推出腾讯云AI绘画,输入文本、图片即可智能生成图像,支持超过 25 种绘画风格。值得注意的是,依托腾讯自研的AI绘画模型,腾讯云AI绘画具有强大的中文理解能力,可以更好地支持中文元素的图像生成,例如古诗词理解、水墨剪纸等;我们也大幅降低了API接口耗时,相较业内平均水平降低50%,为高质量、高效率的内容创作提供支持。

  深入产业,我们发现在内容社区、电商等场景,图文结合的形式,可以提供更丰富、更个性、更有创意的广告信息,有效提升转化率。基于刚刚介绍的两种方式,用户只需输入主题和产品描述,即可一键生成种草文案、商品详情描述等内容。AI绘画,还可以在内容配图,宣传海报等环节,提供创意辅助,实现智能营销+智能创意双重提效。现在,欢迎大家申请试用腾讯混元大模型,也可以登录腾讯云官网试用AI绘画。

  在此之外,今年 6 月,我们还公布了腾讯云行业大模型解决方案。

  由大量专业知识学习,以及强大推理能力,构建出的专属行业大模型,在特定领域的表现力及适应性更强。基于此,我们进一步提升了图像识别、数据分析、数智人、客服等智能应用生产效率,将更多元化的,即插即用的产品、服务推向市场。

  在图像识别领域,既往OCR文字识别,需要经过图片输入、检测、识别、结构化等多个流程。一方面,多流程操作容易导致错误累积,降低模型准确率;另一方面,每一个业务场景的图片识别需求有所不同,导致单一模型难以复用于新场景,每一次定制都需要增加成本。

  升级为“端到端”的OCR大模型后,从图像到文字,一步生成识别结果。比如,针对票据示例,可直接提问“委托日期是什么时候”,大模型在理解图片后给出回答,大幅缩减识别流程,提升识别准确度。针对发票混贴的场景下,一个模型可支持多种类型图像识别,泛化性进一步提高。

  与传统模型相比,OCR大模型突破技术局限,有效降低了落地成本。例如,针对手写体,复杂表格难识别的问题,OCR大模型通过全面理解图片,直接提取相关字段,提升识别准确度;针对拍摄背景复杂的图片,OCR大模型可以借助端到端算法,避开干扰信息,直接回答相关问题;针对训练成本,在特定场景下,传统模型训练提升指标,需要依赖超过 2000 个训练样本, 48 到 60 个小时训练,而OCR大模型,只需要 50 到 100 个训练样本,训练 2 个小时,即可实现3%到20%的效果提升。

  目前,OCR大模型已经集成到TI-OCR训练平台,供客户依据自身业务场景,进行小样本精调使用。

  以新能源领域为例,客户通过TI-OCR 训练平台进行图片标注,以小样本企业数据对OCR大模型进行精调,实现对弯曲电线字符、水印铭牌、复杂电表图片等识别,推动自动化信息审核。在OCR大模型辅助下,字符读取准确率达到98%以上,自动化审核预计为客户节省超过80%的人力投入。

  在数据分析场景,当用户希望了解“最近的销量情况”时,传统数据分析流程复杂,需要高度依赖专业人员,经过分析思路拆解、数据指标导入等环节,才能生成结论,链路长效率低。面对同一个问题,通用大模型因为缺乏分析专业知识和洞察力,则容易生成冗余、或无效的答案。

  为此,我们打造了支持零门槛对话式数据分析的分析大模型。

  和通用大模型相比,分析大模型内化了专业的数据分析知识、不同行业的分析指标体系,可以依据行业特点进行意图理解、思路拆解、数据推理,从分析师视角生成结论。

  例如,通过分析大模型的意图理解能力,销量这个词汇会被关联为“销售额”、“订单数”,“最近”被关联为“近 7 天”,经过与用户交互,明确分析任务为近 7 天的订单数趋势。

  通过分析大模型的数据推理能力,还将进一步建议用户从不同销售渠道,分析订单数变化原因。

  基于分析大模型,我们升级推出腾讯企点分析AI助手,覆盖对话式分析,辅助数据配置,提取智能结论、一键生成报告四大场景。今年 9 月,企点分析AI助手正式向大客户开放内测申请。未来,人人都能拥有专业数据分析能力,让数据跑得更快,为业务一线提供决策支持。

  在人机交互方面,我们通过行业大模型中枢,对接海量知识和工具,实现文字、语言、视频等多模态意图理解,生成智能、精准答案输出。接下来,我将详细为大家介绍智能客服、语音助手、数智人方向的探索。

腾讯副总裁吴

  围绕客服场景,今年 6 月腾讯企点发布全新一代智能客服,引入大模型能力,对对话交互、人工辅助和知识构建三个层面进行提升。最近,我们进一步升级了管理端配置能力,提升知识构建效率,优化C端用户体验。同时,我们积极与各行各业进行产业实践,在文旅、泛政、地产等领域落地标杆案例。

  例如,在知识构建方面,通过企业专属知识“导入-校验-调优”闭环,可以提升复杂文档读取、理解效果,进一步优化冷启动效率,降低运维成本。在文字文档基础上,我们增加了对图文混排、多列排版等复杂文档接入。通过语义切块,生成向量,以高可用、可扩展向量数据库方案,丰富问答组合及内容;通过快速生成问答对,以及问答原文的回溯,提高问答校验的效率;通过提供对话测试和运营工具,让运营人员快速实现调优,提升问答准确率。

  在对话交互层面,大模型迭代向量数据库、搜索引擎能力,智能生成拟人化答案,可以让智能客服应对更复杂的需求。例如,传统客服无法支持“操作步骤讲解”这类复杂需求。新一代智能客服通过上下文信息补全,基于企业知识库进行问答推理,可以将复杂问题解决率提高30%。

  在用户体验上,大模型加持,也让智能客服更接近“真人客服”。例如,可以准确地识别用户情绪,及时给出安抚。可以分辨任务型、知识型、闲聊型话题,通过聊天的方式解决任务需求。在图片示例中,我们看到,即使在业务办理过程中,用户插入了“闲聊”话题,也不会导致任务中断,保证了业务办理成功率。

  除了智能客服,出行大模型的引入,也极大提升了车载语音助手的语义理解能力、交互体验。

  传统车载语音助手,以规则+小模型的方式,理解用户请求,存在对话呆板不自然、机械式回复无情感、功能单一等问题。加入大模型后,通过复杂意图识别,提供更自然的对话能力;通过设定人设,实现更富情感化的语音交互。同时,随着大模型能力迭代,将支持更多出行场景能力。

  例如,基于出行大模型,通过简单提问,语音助手可以自动生成行程规划。根据车辆情况,语音助手会主动提示加油,并在导航中添加沿途加油站。同时,大模型也融合了车身信号信息,可以为用户进行车辆故障诊断。

  在数字人领域,数智分身技术发展,推动数字人从定制化走向普惠化。我们通过行业大模型,进一步降低数字人应用门槛,提升生产效率及交互体验。

  今年 4 月,我们推出了数智人工厂, 24 小时即可生成小样本数智人。今天,在AI大模型技术的加持下,我们再次提升生产效率,发布“通用口型”版小样本数智人,无需训练,上传素材后, 1 小时内即可获取专属数智分身,数智人生产效率再次获得提升。虽然流程、时间都大幅简化,但形象效果依然很逼真。

  大模型技术的加持,也让数智人实现更高效、更自然、更智能的效果。我们全新升级的“交互式”小样本数智人,可以根据真实对话场景,进行手势的停顿、变化,更接近于真人交互状态。具有交互能力的小样本数智人,未来将不再局限于短视频生产这类单向播报场景,也可以被用于服务咨询等交互场景。

  在3D数智人生产运营领域,依托AI大模型技术,我们推动照片式生成3D形象,改变手工作业形式,大幅提升生成速度。也可以实现智能动作驱动,基于语义为3D数智人自动匹配动作,让“数智员工”服务体验接近于真人员工。

  可以看到,AI大模型应用,正在催生“效率革命”,让智能应用表现出更强的能力、更高的效率,落地更多场景。未来,我们将持续将AI大模型等先进技术,应用于内部PaaS、SaaS产品,打通AI产业落地全链条,重塑智能时代生产力。让更多开箱即用的AI大模型产品、服务,助力客户实现数智化升级。


返回网站首页

本文评论
吉利汽车研究院陈勇:用人工智能驱动智能驾驶技术革新「吉利智能驾驶研发中心」
通信世界网消息(CWW)算力是人工智能和智能驾驶领域的基础设施,是支撑大模型训练和推理的核心要素。随着人工智能模型的规模和复杂度不断增加,算力的需求也越来越高。因此,建设自...
日期:08-02
骁龙8 Gen3将10月发布 小米14或首发_骁龙8cx gen4
高通骁龙8 Gen3芯片的发布时间已提前至10月底。与此同时,搭载该芯片的旗舰手机也将陆续推出。首批搭载高通骁龙8 Gen3芯片的手机包括小米14系列、vivo X100系列、iQOO 12系列...
日期:06-02
全域兴趣电商下,抖音电商作者有了哪些新增量?_抖音电商品类
声明:本文来自于微信公众号 TopKlout克劳锐(ID:TopKlout),作者:白羊,授权转载发布。两年多时间里抖音电商高速发展,对于已经入场的电商作者来说,他们的价值有了哪些变化?而对于那...
日期:11-25
美特斯邦威回应出海:已通过速卖通取得初步成绩
12月13日消息,日前,“美特斯邦威”在与投资者交流中,提到“出海”话题时表示,公司尚未在亚马逊平台上售卖衣服,当前已尝试阿里速卖通跨境平台开展销售,并取得了初步成绩。昨日开盘...
日期:12-13
小米13怎么样「小米产品经理预热小米13 仅有小米13和小米13 Pro」
中关村在线消息:近日,小米的产品经理魏思琪在线为网友预热小米13的最新的消息。小米13依旧和上一代一样,小米13和小米13 Pro的大小并不一致,小米13依旧主打小屏旗舰,从曝光的图片...
日期:11-29
元宇宙产业大会2023春季会开幕,智慧图亮相签约!
随着数字化的发展,元宇宙正在作为虚拟世界和现实社会交互的重要平台,数字经济的表现形态之一,在文化和旅游领域快速拓展广阔的应用空间,成为当下该领域的热门赛道。2 月 16 日,元...
日期:03-08
绿茶、打碟、卖卤蛋,张兰的家丑“可外扬”
声明:本文来自于微信公众号 锌财经(ID:xincaijing),作者:孙鹏越,授权转载发布。凭借一己之力压下世界杯流量的,只有巨蟹座的汪小菲和他白羊座的母亲,张兰。11月21日,国内媒体转载台媒...
日期:11-28
AMD/NV注意 Intel表态:CPU、GPU、独显都要做「intel核显和amd独显交火」
随着Intel推出Arc独显,他们正式进入了高性能GPU市场,这意味着AMD、Intel都会是手握高性能x86、高性能GPU的半导体公司,NVIDIA没有高性能x86,但GPU及ARM CPU上也不容小觑。三星平...
日期:10-25
极氪X发布:旗下首款紧凑型纯电动SUV 起价18.98万元_极氪纯电动车mpv
凤凰网科技讯 4月12日消息,极氪X发布会今晚举行,这是极氪旗下发布的第三款车型,该款新车基于SEA浩瀚架构研发,定位紧凑型纯电动SUV。新车共分为三个版本,18.98万元起售,将于今年6...
日期:04-13
格力一夜完成河北市场系统切换 经销商直呼董明珠是个狠人_董明珠的格力分销商城
一夜之间,此前被格力电器取消了格力空调河北省代理资格的河北盛世欣兴格力贸易有限公司突然发现自己的格力空调的售后服务平台已被关闭。这是继8月22日格力电器突然宣布授权...
日期:09-16
围炉冰茶又火了,年轻人为何钟情围炉?「围炉茶舍怎么样」
声明:本文来自于微信公众号 刺猬公社(ID:ciweigongshe),作者:弋曈 佳璇,授权转载发布。“来一桌围炉冰茶,看云雾吞吐;配几碟江南点心,品花开花落”。一周前,这句意境空灵的文案在短...
日期:04-23
被「Wordle」拿捏心态的美国玩家,又爱上了“复刻”新品?
声明:本文来自微信公众号“白鲸出海”(ID:baijingapp),作者:B21993,授权转载发布。单词类游戏,在2022年春天突然因为一款页游「Wordle」火了起来。这款游戏表面上看和其他单词类游...
日期:11-16
招商局发布首位数字员工“招小影”
11月14日消息,近日,招商局集团宣布首位数字员工“招小影”入职。招商局集团打造了“招商如影”数字人平台,并孵化集团首位数字员工“招小影”。招商如影数字人平台,提供了端到端...
日期:11-15
泡泡玛特是啥东西「天价手串,年轻人的新泡泡玛特?」
声明:本文来自于微信公众号 新熵(ID:xinshangxz),作者:樱木,授权转载发布。“我没想到还有这样的神仙顾客。他在直播间抢到了手串,还会寄礼物感谢我。”最近,赵方建的手串直播生意...
日期:08-12
淘宝&抖音双11,top10品牌谁在消失,谁还在榜?数据变化释放了哪些信号?「淘宝双十一」
声明:本文来自于微信公众号 楠开口(ID:nnvoice),作者:Sally楠,授权转载发布。今年双11已经过去了一大半了,今年除了传统的电商平台,淘系 京东 外,抖音的双11也开启了,从10月31号到11...
日期:11-08
原神内购内容将涨价 价幅度未知「原神 出价」
中关村在线消息:《原神》官方在HOYOLAB社区透露受平台价格政策调整的影响,或将调整部分地区的内购内容价格。受影响的地区包括智利、埃及、日本、马来西亚、巴基斯坦、波兰、...
日期:10-12
探访直播基地双11:商家不想亏钱卖,主播不愿抢流量_直播间抢红包项目
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:云飞扬,授权转载发布。“对我们来说,双11就是换个背景的事儿,本质变化不会特别大。”双11第13年,问及今年双11的变化,安鑫传媒招...
日期:11-03
突然!USB 3.0/USB 4被正式取消:命名完全变了_usb命名为何如此混乱
但凡接触过电子产品的朋友,恐怕最熟悉的接口就是USB了。在USB 3.0时代,USB接口的命名开始出现前所未有的混乱,起初是USB 3.0、USB 3.1到USB 3.2这样的演进,后来又被集体更改为US...
日期:10-02
作业帮与Google、Facebook等国际科技巨头一同登上2021“十大突破性技术”榜单
  近日,《麻省理工科技评论》2021年“全球十大突破性技术”(TR10)在杭州全球同步首发,“远程技术”成为一大亮点。作为该技术主要研究者,全球用户规模最大的在线教育公司作...
日期:07-16
你们的开机第一屏画面要变了!安卓机器人首次3D化「安卓机器人倒地怎么办」
快科技6月27日讯,谷歌日前终于确认,Android机器人的Logo将首次调整为3D化风格。事实上,早在年初的CES 2023上,3D化的新机器人就首次出现,前不久的I/OD大会上,它再度亮相。除了Logo...
日期:06-28