您的位置:首页 > 互联网

自研端到端语音通话大模型上线,Soul App语音大模型再升级_soul语音话术

发布时间:2024-09-04 01:58:40  来源:互联网     背景:

近日,社交平台Soul App(以下简称“Soul”)语音大模型再次升级,上线自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。目前,Soul自研的端到端语音通话大模型能力已上线旗下“异世界回响”实时通话场景(内测中),并将在后续拓展至AI苟蛋等多个AI陪伴、AI互动场景。

自 2016 年上线,Soul一直致力于以创新的技术方案和产品设计,实现社交体验的拓展。 2020 年,Soul启动对AIGC的技术研发工作,系统推进在智能对话、语音技术、虚拟人等AIGC关键技术能力研发工作,并推动AI能力在社交场景的深度落地。

以AI升级社交的过程中,Soul的技术重点之一是致力于实现拟人化、自然化情感陪伴体验。其中,声音是重要环节之一。作为传递信息和情感的重要媒介,声音最能在沟通中赋予“情绪温度”和“陪伴感”。特别是在社交场景中,情感化、低延迟、多风格、类真实的声音能力,可以打破“次元壁”,让线上社交尤其是人机互动中,也能实现真实生活场景聊天的自然流畅感和沉浸现场感,真正完成类现实生活化互动场景中的交互体验。

因此,为给用户带来更好的情绪反馈和陪伴感,情绪理解、延迟问题一直是Soul技术团队关注的焦点。

此前,Soul团队推出了自研的语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力,支持真实音色生成、语音DIY、多语言切换、多情感拟真人实时对话等,目前已应用于Soul “AI苟蛋”、站内狼人游戏“狼人魅影”AI语音实时互动、独立新产品“异世界回响”等场景。

soul语音助手

与国际最前沿的技术发展保持同频,Soul持续完善自身语音技术能力积累,创新AI社交应用体验。今年 7 月,在人工智能领域顶 级的国际学术会议——国际人工智能联合会议(International Joint Conference on Artificial Intelligence,IJCAI)举办的第二届多模态情感识别挑战赛(MER24)上,Soul 语音技术团队于SEMI(半监督学习)赛道获得第 一名,在国际赛事舞台上展现了Soul的前沿洞察和技术能力。

如今,自研端到端语音通话大模型的率先上线,再次证明了Soul在行业中扎实的技术能力积累。

区别于传统的级联方案,语音到语音的端到端建模,意味着语音交互体系的颠覆式升级,即不再需要从“语音识别、自然语言理解、语音生成”等多个环节流转,直接语音输入—语音输出的端到端模型能够最 大程度实现信息无损传递,降低响应延迟时间。

soul语音话术

facebook技术总监

此次Soul自研的端到端语音通话大模型便具备超低交互延迟、快速自动打断、超真实声音表达和丰富情绪感知理解能力的特点,支持更自然的人机交互体验。

在延迟方面,于实际应用过程中,用户体验与“异世界回响”中虚拟人实时语音通话效果时,延迟时间少于行业平均水平,真正实现即时的AI交流和陪伴。

值得一提的是,端到端的语音语义理解和响应以及更自然的语音指令控制,让Soul语音通话大模型不仅能够给予情感关怀、理解人声情绪情感并给出有温度的回应,还能够理解物理世界的声音场景,模拟物理世界动物声音、理解多人聊天内容,实现多风格语言切换、文艺内容创作和即兴演唱,接近现实交流互动场景需要。

接下来,Soul将持续推进多模态端到端大模型能力建设和应用落地,以AI辅助社交、提升关系建立的质量和效率的同时,构建人机交互新场景,让用户可以与AI进行更加有温度、沉浸、趣味的互动交流,不断创新社交体验。


返回网站首页

本文评论
model y 玩具车「特斯拉Cyberquad玩具车国内将开卖 11990元」
7月13日 消息:特斯拉中国官网今日公布了Cyberquad玩具车的售价为11990元,这款玩具车将于明天上午10点在特斯拉中国官网、天猫/京东特斯拉官方旗舰店正式开售。华为mate50系列...
日期:07-13
2021中国新经济企业500强榜单发布 腾讯、阿里、字节位列前三「2020中国新经济企业500强榜单」
  中国企业评价协会发布了“2021中国新经济企业500强”榜单,腾讯、阿里巴巴、字节跳动位列前三。芯片大厂有哪些小米有品年货节  榜单显示,2021年新经济500强榜单,较上年变...
日期:10-06
arm和英伟达芯片「英特尔遭遇强劲对手!英伟达开发基于ARM架构的个人电脑芯片」
周一,据媒体援引知情人士透露,英伟达已开始开发基于ARM架构的、用于微软Windows操作系统的个人电脑芯片。该款芯片最早将于2025年上市。英伟达的最新举动,是微软携手芯片公司为...
日期:10-24
谷歌市场分析_谷歌5月继续领跑美搜索市场 占市场份额65.5%
  6月13日消息,据国外媒体报道,据市场研究公司comScore称,谷歌5月份在美国搜索市场的份额从4月份的65.4%提高到了65.5%。雅虎和微软必应搜索引擎5月份的市场份额与4月份相同...
日期:07-30
“斗米名企招聘季”正式开启,奏响2021春季招聘最强音(斗米招聘官网)
  农历岁末,往年是返乡高峰期,今年各地倡导就地过年,灵活用工市场进入招聘旺季,斗米作高效的一站式招聘服务平台,2021年开年伊始,与多家名企推出“斗米名企招聘季”活动。   ...
日期:07-16
独具光环,敢于不凡  2023 魅族秋季无界生态发布会顺利举行_魅族zero无孔手机发布会
通信世界网消息(CWW)2023 年 11 月 30 日,星纪魅族集团在武汉成功举办2023 魅族秋季无界生态发布会,3500多名来自各行各业的嘉宾、媒体、魅友共同见证了魅族 21 系列旗舰智能手...
日期:12-01
联想家悦e156z_联想家悦e156z怎么升级
是一款采用全新设计的台式电脑。该电脑的特点是价格实惠、性能升级。这款电脑的性能堪比一些高配机型,是一款性价比极高的电脑。外观方面,采用银色机箱,整机重量为5.42kg,尺寸为...
日期:05-29
雷军:捐款是为了让中国出现更多的华为、小米、比亚迪!_雷军捐款20亿美元
11月30日,武汉大学迎来了其130周年校庆日,而武大的校友、小米创始人雷军在第九届校友珞珈论坛上宣布向母校捐赠13亿元人民币,这一喜讯刷新了武汉大学建校以来单笔最大捐赠额,也...
日期:12-01
华为手表新款watch gt2微信语音「华为Watch GT 3系列微信手表版上线:支持语音、文字回复」
9月29日消息,今日,@华为终端 官方宣布,华为Watch GT 3系列智能手表正式上线微信手表版。用户可通过蓝牙连接,不必拿出手机,抬手就能查看微信上的语音和图文信息、语音和视频通话...
日期:10-04
iQOO Neo8 系列正式发布,首发天玑9200 ,一文看懂主要配置_iqoo天玑处理器
iQOO 在 5 月 23 日发布 iQOO Neo8 和 iQOO Neo8 Pro 两款手机,iQOO Neo8 搭载骁龙 8 处理器, iQOO Neo8 Pro 全球首发天玑 9200 ,安兔兔 V9 跑分达到 1363206,是目前安卓排名...
日期:05-24
6年青春结束了 暴雪《守望先锋》明晚关服:“归来”接任「暴雪tv五周年守望先锋什么时候到」
旧守望”离去,新的守望”即将到来。一周前,《守望先锋》的主界面换成了最初英雄的合影不包括任何新英雄,似乎在以这种方式与玩家道别。根据守望先锋”官方消息,为了保障《守望先...
日期:10-03
AI虚拟试穿在线使用教程指南 Outfit Anyone官网体验入口_ar虚拟试穿下载
Outfit Anyone是一款超高质量的虚拟试穿产品,它为用户提供了一种全新的尝试不同时尚款式的方式,而无需实际试穿衣物。借助两个流的条件扩散模型,Outfit Anyone能够灵活处理衣物...
日期:01-19
5G和人工智能技术推动中国边缘服务器市场逆势增长「5g及其赋能下的人工智能发展现状与应用前景」
通信世界网消息(CWW)近日,国际数据公司(IDC)发布了最新的《中国半年度边缘计算市场(2022下半年)跟踪》报告。数据显示,中国边缘计算服务器市场在2022年仍保持显著增长。边缘专用服务...
日期:06-14
尼山对话聚焦AI  周鸿祎:大模型不能引发企业裁员 将成为助手「周鸿祎金山案例分析」
【网易科技6月26日报道】3秒钟即可生成一段尼山圣境景区门票的直播带货视频,5秒钟就能产出一份景区招商方案及详细流程,在今天上午召开的世界互联网大会数字文明尼山对话主论...
日期:06-26
苹果2023第三财季财报将于8月4日发布「苹果第三财季是几月到几月」
7月10日 消息:根据苹果公司官网公布的消息,他们将于8月4日发布2023财年第三财季的财报。这个财报会议将在太平洋时间8月3日下午2点,也就是北京时间8月4日早上5点开始。预计包...
日期:07-10
腾讯看点推出“游戏新春嘉年华”,八大国民级游戏会场送丰厚大礼
  牛年新春在即,腾讯看点游戏推出“游戏新春嘉年华“活动,设置八大热门国民级游戏分会场,送出重磅好礼,并邀请近百位游戏大咖送祝福,让广大游戏玩家在线上和看点游戏创作者们...
日期:07-16
「郭明錤称华为Mate」,60 Pro今年下半年出货量600万台 「提高20%」「华为mate60最新官方消息」
来源:中关村在线电竞人员据郭明錤最新发布的分析简讯,华为Mate 60 Pro机型的需求量超过了预期,因此他将今年下半年的出货量预测上调了20%,从原先的500万台提升至600万台。郭明錤...
日期:09-14
木兰 Mulan PSL 为何能成中国首个国际通用开源协议?
  2 月 14 日,开源促进会(OSI,Open Source Initiative)批准了来自中国的木兰开源许可证第二版(MulanPSL v2),木兰许可正式成为一个国际化开源软件许可证(或称“协议”)。这...
日期:12-09
小米字节联手!小爱同学接入豆包大模型:手机、SU7已搭载
快科技6月13日消息,据字节旗下火山引擎”公众号介绍,小米旗下人工智能助手小爱同学”与火山引擎达成合作,双方基于豆包大模型实现更智能的AI交互体验。据悉,字节跳动打造的豆包...
日期:06-13
从市值风云败诉被判赔201万,谈自媒体该如何“报道企业”_市值风云文章
声明:本文来自于微信公众号三言Pro,作者:三言,授权转载发布。近期,有多起企业诉自媒体胜诉、自媒体败诉需赔偿的消息,涉及360、特斯拉、联想、小米等企业,且企业起诉自媒体有继续...
日期:08-30