您的位置:首页 > 互联网

声网发布 RTE+AI 能力全景图 RTE2024,聚焦Gen-AI 时代的 RTE_声网agora上市

发布时间:2024-10-26 21:33:17  来源:互联网     背景:

【】10月26日消息,由声网和 RTE 开发者社区联合主办的 RTE2024 第十届实时互联网大会正式开幕。今年是声网成立的十周年,也是 RTE 大会的第十届。十年间,实时互动从“理念”发展成一个“行业”。实时互动技术不仅助力社交泛娱乐、在线教育、IoT、企业服务等几十个行业、数百个场景实现了跨越式成长,也支撑了诸多互联网风口的进化,从过去的电商直播、互联网医疗、秀场直播到如今的大模型,都离不开 RTE 能力的参与和赋能。

在全新的生成式 AI 时代,RTE 与 AI 也将迎来更多可能性。在RTE2024 主论坛中,声网创始人兼 CEO 赵斌、Lepton AI 创始人兼 CEO 贾扬清、声网首席科学家、CTO 钟声分别带来主题演讲,分享他们对于实时互动行业的深刻洞察。

赵斌:生成式 AI 将驱动 IT 行业四大变革

生成式 AI 正在驱动 IT 行业发生大变革,赵斌认为,这一趋势主要体现在四个层面:终端、软件、云和人机界面。在终端上,大模型能力将驱动 PC 和 Phone 往 AI PC 和 AI Phone 的方向进化。在软件上,所有的软件都可以、也将会通过大模型重新实现,并从 Software with AI 发展至 AI Native Software 。在云的层面,所有云都需要具备对大模型训练和推理的能力,AI Native Cloud 将成为主流。此外,人机界面的主流交互方式也将从键盘、鼠标、触屏变成自然语言对话界面(LUI)。

oppo find x3拍摄

声网 im

手机内存6GB

随着生成式 AI 成为下个时代 IT 行业进化的主题,RTE 也成为了多模态应用和基础设施中一个关键的部分。10月初,声网的兄弟公司 Agora 作为语音 API 合作者,出现在了OpenAI 发布的 Realtime API 公开测试版中。

在此次大会中,赵斌表示,声网与 MiniMax 正在打磨中国第一个Realtime API。赵斌也展示了声网基于 MiniMax Realtime API 打造的人工智能体。在演示视频中,人与智能体轻松流畅的进行实时语音对话。当人类打断智能体并提出新的疑问时,智能体也能够非常灵敏的快速反应,实现了与人类自然流畅的对话。

在生成式 AI 的大潮下,RTE 将会提供更为广阔的空间。赵斌也在分享中宣布,声网正式发布了 RTE+AI 能力全景图。在全景图中,声网从实时 AI 基础设施、RTE+AI 生态能力、声网 AI Agent、实时多模态对话式 AI 解决方案、RTE+AI 应用场景五个维度,清晰呈现了当下 RTE 与 AI 相结合的技术能力与应用方案。生成式 AI 与RTE 结合带来的场景创新,将成为下一个十年的主题。

过去十年,声网不仅见证并推动了 RTE 从一个理念变成一个行业的过程,更身体力行的打破了国内实时音视频领域的三无状态。赵斌称,10年前行业内没有行业会议、专业书籍、以及专业媒体和社区。如今,RTE 大会迈入第10年,声网也于今年8月正式出版行业首本系统介绍实时互动的技术型科普图书《读懂实时互动》,同时,RTE开发者社区也持续繁荣,加速推动。

贾扬清:AI 是云的第三次浪潮

随着 AI 技术的发展,AI 时代的大模型应用开发、AI 云、以及 GPU 等基础设施建设逐渐成为热门话题,也成为了支撑整个行业发展、催生新应用诞生、新商业价值实现的基本底座。Lepton AI 创始人兼 CEO 贾扬清在 RTE2024 主论坛上分别从 AI 应用、云、GPU 算力云技术以及企业大模型自主性等层面带来了他对 AI 基础设施进化的解读。

针对 AI 应用,贾扬清指出,今天是最容易建设 AI 应用的时代,越是简洁的 AI 模型思路越容易产生优秀的效果。AI 能力加持后,应用本身的开发范式也在从数据、模型、应用构建三个维度发生变化,未来的应用开发将从“以流程为中心” 转化为“以模型为中心”。

除了 AI 应用层面,传统的云架构也在大模型、GPU 优化等需求的催化下发生了翻天覆地的变化。贾扬清认为,AI 是云的第三次浪潮,继 Web 云、数据云之后,AI 将成为第三朵云。AI 云有以下三个特征:算力会成为智能的基础、AI 云需要大量计算与大规模的异构集群,以及少量但高质量的通讯。总体而言,云的产品形态,本质是计算和传输的平衡。贾扬清指出,在 AI 云的形态下,实时的交流和智能的结合在用户体验环节非常重要。毫不夸张的说,实时将直接与生产力划上等号。

企业在构建自己的大模型自主性上,到底该如何决策?贾扬清强调,企业应该将开源和闭源大模型都纳入考虑范畴。采用开源模型+定制化的优势不仅仅是具备更强的可定制性,还有更低的成本以及更高的速度,开源+定制化能够达到比闭源模型更好的效果。

钟声:分布式端边云结合的AI系统将成为现代基础设施的基本形态

在已经到来的 AI 时代,现代化基础设施应该是什么样?声网首席科学家、CTO钟声提到,大量用户设备往往会先接入边缘节点、并在需要的时候再接入云端,数据将在端设备、边缘节点和云之间往返传递。AI 时代的数据中心会包含以大量异构算力组成的超级计算集群(SuperScaler)。但是,停留在仅依赖超级计算集群的系统是远远不够的,万亿参数、多模态引入所造成的高昂计算成本、缺乏机制约束的数据隐私保护、几秒钟的延时都将阻碍大模型的普惠,极大地限制其在很多场景下的应用。

钟声认为,分布式端边云结合的 AI 系统将有效解决这些痛点。这个系统将把计算和传输在各节点做合理地配置,系统会智能地以自适应的方式把任务编排到端与边上执行,非常有效地降低了成本,同时提供了更低延时(低于1秒级的响应速度)、更高网络抖动容忍度、优秀的抗噪声能力,并且完整的用户数据只会保留在端上。

苹果教育优惠支付宝认证

分享过程中,钟声还在大会现场演示了一个由STT、LLM、TTS 、RTC四个模块组成的端边结合实时对话AI智能体,这也是全球首次有厂商在比日常实际场景更具挑战的环境下展示实时AI 对话能力。大会现场观众规模超过千人,面临复杂的噪声、回声、麦克风延迟等困难,但智能体与钟声的互动仍然表现出了优秀的对话能力,在普通5G网络环境下实现了流畅、自然、有趣的双向实时对话,对话模型的极快响应速度、及时打断与被打断的自然程度、对抗噪声能力、遵循语音指令做等待能力都非常突出。

正如钟声在最后分享的,随着端设备的多样化以及能力的提升,AI 基础设施会变得更优化合理,使得 AI 无处不在,AI助理、AI分身帮助我们有效缓解时间稀缺性,改善工作效率和生活体验。

圆桌:AI 的6000亿难题,从基础设施到商业化落地

AI 的6000亿美元难题,一直都是整个行业非常关心的话题,在圆桌讨论环节中,Lepton AI 创始人兼 CEO 贾扬清、MiniMax 合伙人魏伟、面壁智能联合创始人&CTO 曾国洋、Hugging Face 工程师王铁震、Agora 联合创始人 Tony Wang 五位嘉宾一起探讨了从 AI 基础设施到 AI 商业化落地的机会与挑战。

声网sdk

针对商用大模型和开源大模型未来的发展趋势,贾扬清分享了两个核心观点:其一,同等质量模型的Size会变得越来越小,计算效率会越来越高,模型架构也会变得更加开放和标准。其二,除了极少数头部公司之外,越来越多的企业会采用开源架构来做下一代模型。因此,开源架构的应用会变的越来越普遍,通过开源架构训练出来的模型也都会有各自不同的风格。

王铁震则表示,我们将在未来看到越来越多 Infra 和 Realtime 的工作,大家不仅需要关注开源模型本身,还需要重视开源模型的基础设施和数据闭环,才能把开源模型跑得更好、更快。Realtime 需要TTS、也需要大模型,如果能够通过一些方式放在一起,放在边缘侧、离用户更近的地方,才能产生非常好的效果。

关于如何看待音视频多模态模型的实际应用潜力,魏伟表示,随着多模态的出现,生成式人工智能的边界一定会被继续拓展,并加速这一产业的变革。从产品和用户服务过程中魏伟发现,文本、语音、音乐、视频这些模型可以很好的帮助艺术、影视、音乐等领域的创作者极大地提高效率,并为他们提供新的思路和方法。

针对大模型技术巨大的成本使用问题,曾国洋分享到,随着技术的前进,算力一定会变得越来越便宜,相同能力的模型规模也会变得越来越小,但算力成本优化会最终转化为训练更强大的模型。真正达到 AGI 水平之前,我们只能感受到模型在变得越来越强,很难感受到成本的变化。他还提到,由于面壁智能是做端侧模型的,所以很关注如何让模型在端上跑得更快,在实际部署过程中,他们会用各种量化压缩甚至是稀疏化方法去优化实际部署的开销。

总结来说,Tony Wang 认为想要推动 AI Infra 到模型、再到商业化落地,技术驱动和成本是最核心的两个点。此外,在产品真正走向市场的过程中,流量和口碑也是关键。


返回网站首页

本文评论
拯救中国市场,只能看iPhone 16了
声明:本文来自于微信公众号 字母榜 作者:字母榜,授权转载发布。“(中国)那里的竞争环境是世界上最具竞争力的。我以前就说过,现在情况仍然如此。”库克这话是在解释新一季财报中大...
日期:08-03
8款新品齐发!Redmi Note 13系列发布会价格汇总:49元起_小米note3发布会回顾
快科技9月21日消息,今晚由阔别已久的王腾召开了一场Redmi发布会,带来了中端市场卷王产品Redmi Note 13系列,同时还带来了平板、耳机、冰箱等多款产品。首先是手机方面,这次共推...
日期:09-22
大模型自我奖励:Meta让Llama2自己给自己微调,性能超越了GPT-4
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。人工智能的反馈(AIF)要代替 RLHF 了?tcl老式彩电大模型领域中,微调是改进模型性能的重要一...
日期:01-21
修复ios系统修复无障碍功能并引入新功能 苹果iOS-17.5公测版发布
来源:中关村在线凤凰卫视刘爽苹果公司于4月25日发布了iOS 17.5、iPadOS 17.5、macOS 14.5和watchOS 10.5的第三个公测版。这些更新的内容与昨天发布的Beta 3版本完全相同,并邀...
日期:04-25
第四季度全球晶圆代工厂营收排名:台积电份额已是三星3倍(三星市值超过台积电)
  12月11日消息 根据集邦咨询的消息,第四季全球前十大晶圆代工厂营收排名出炉,台积电遥遥领先,三星第二,格芯第三。   在2019年第四季度的排名中,台积电以大优势领先,其次是...
日期:05-01
千万级网红"听泉鉴宝"停播内背后:供货商被列入异常经营名单_听泉茶叶价格多少
继疯狂小杨哥、东北雨姐之后,又一位千万级粉丝网红也登上热搜拥有2500万粉丝的抖音博主听泉鉴宝,被曝出学历存疑、藏品问题等引发关注。目前听泉鉴宝及其相关账号已经删除了与...
日期:10-17
沉默5天后,白宫终于发声回应华为推出新机,称不应对华商业脱钩
在美国商务部长雷蒙多访华之际,长期受美国制裁打压的中国企业华为,推出了一款新手机。这件事在美国舆论界炒得很热闹,美国《华盛顿邮报》在报道中指出,华为新手机引发了华盛顿的...
日期:09-07
宁波女子银行账户突然多1000万元 银行回应:系统异常,已恢复_宁波银行交易金额超限
浙江宁波市民陈女士在登录宁波银行App查看余额时,惊讶地发现自己的账户多了 1000 万元。她描述称,每次刷新账户,余额都不一样,甚至能查看到其他客户的财务情况和流水。陈女士将...
日期:12-06
斯坦福模型介绍「维基百科+大模型打败幻觉!斯坦福WikiChat性能领先GPT-4」
要点:1. 维基百科+大模型打败幻觉,斯坦福WikiChat在事实准确性和其他指标上表现优秀。2. 斯坦福研究人员利用维基百科数据训练大模型WikiChat,成功减轻了幻觉问题,并在事实准确...
日期:01-04
研究显示 ChatGPT 提供的医疗保健回应与人类提供的建议几乎无法区分
7月18日消息:根据《JMIR 医学教育》杂志上发表的一项新研究,ChatGPT 对与医疗保健相关的问题的回答很难与人类的回答区分开来。傲游浏览器兼容模式比亚迪财报出炉该研究由纽...
日期:07-18
上海特斯拉工厂小时工「特斯拉:上海工厂大部分员工春节期间放假9天」
(原标题:特斯拉:网传上海工厂放假信息不准确,比法定假期延长两天) 12月28日,有媒体报道称特斯拉上海超级工厂将从2023年1月3日至1...
日期:12-28
古罗马事件「外媒科学网站6日摘要:AI技术破译古罗马烧焦手稿」
2月6日(星期二)消息,国外知名科学网站的主要内容如下: 《自然》网站(www.nature.com) 1、外国学生利用AI技术破译2000年前被烧焦的手稿 iphone15最新官方消息三名来自埃及、瑞士...
日期:02-06
重装Win7不怕丢数据金山装机精灵1分钟闪电备份
  无论Windows7多完美,总会有系统崩溃的那一刻。然而重装Windows7是一件艰难重重的事情,首先要做的并不是找各种各样的Windows7重装盘,而是先把个人的重要数据一个一个找出...
日期:07-22
部分高铁票比机票最低价贵百元 网友争议不断:飞机便宜还更快_高铁票比飞机票贵多少
快科技5月7日消息,武广高铁、沪杭客专、沪昆客专、杭甬客专4条高铁票价将于6月开启涨价窗口,此次票价涨幅普遍在20%左右,是近年来调整力度较大的一次。对于此次高铁票调价行为,...
日期:05-07
蔚来加电一次多少钱「蔚来李斌:加电体验超过了加油、电车才能普及」
快科技9月11日消息,近日,2023世界新能源汽车大会在德国国际汽车及智慧出行博览会期间召开,会上蔚来汽车创始人李斌发表了演讲。李斌强调了电车补能方式的重要性,蔚来一直希望解...
日期:09-12
网购2百多却扣款3千多?花呗回应:排查确认是用户主动支付「花呗无缘无故被扣了3000多是怎么回事」
一名女子在网购一件衬衫后,发现支付宝的花呗账单显示被扣款3363.67元,而实际上她只花了249.2元购买衬衫。她多次联系支付宝客服,但没有解决问题。8月9日凌晨,花呗发文回应称,经过...
日期:08-09
“爱因斯坦脑子”热销,年轻人开始上网买“情绪”了_爱因斯坦的脑子多少钱
淘宝之大,无奇不有,有点离谱但合理的东西比比皆是。今天狐妹逛淘宝,一不小心点进了一个叫“什么东西”的页面。好家伙,仿佛一下子打开了通往新世界的大门。这要放在以前,以我的购...
日期:09-03
iphonese4当年有多惊艳网友:真不敢想象 iPhone SE 4外形设计重回刘海屏?
来源:中关村在线ipados15正式版什么时候发布近日,据可靠消息来源称,苹果公司正在重新设计其最新款的 iPhone SE 4 手机。这款手机原本计划采用全面屏设计,并基于 iPhone 14 的技...
日期:02-10
别让弹窗广告弹到安全底线_别让弹窗广告弹到安全底线怎么办
  来源:北京商报  弹窗广告常见,出现在喜剧场景中博君一笑,但弹到了汽车驾驶途中,把人吓出一身冷汗。小米对讲机连接普通对讲机  近日,“车载导航中控屏出现弹窗广告”的事...
日期:10-03
画面有点上头!男子扛铁板狂砸秦桧雕像:《满江红》带火景区热度
电影《满江红》票房领跑贺岁档,成为现象级作品。airpodspro怎么拆耳机套iphone 11pro14.4建议升级ios15.1片中涉及的岳飞、秦桧等历史人物,也引发民众关注,与之相关的庙宇、建...
日期:01-30