您的位置:首页 > 互联网

OpenVoice V2版本发布 能对声音风格进行精细控制_open audio

发布时间:2024-04-26 16:45:07  来源:互联网     背景:

4月26日 消息:MyShell TTS 开发的 OpenVoice 是一项创新的声音克隆技术,它能够通过仅使用一小段参考发言者的音频片段来复制其声音,并生成多种语言的语音。

智能网联汽车 定义

以后都是无人驾驶汽车吗

目前,MyShell TTS 已经推出了全新的OpenVoice V2版本。这个版本能够直接支持英语、西班牙语、法语、中文、日语以及韩语,并且显著提高了音频输出的质量。OpenVoice V2拥有复制任意声音的能力,能以多种语言进行语音输出,并具备情感和口音的控制功能。它不但可以准确模仿特定的声音色彩,还允许对声音的风格,包括情感、口音、节奏、停顿及语调等进行细致调整。

主要功能:

蔚来 保时捷

  • 准确的音色克隆: OpenVoice 能够精确地克隆参考音色,并在多种语言和口音中生成语音。

  • 灵活的声音风格控制: 用户可以对声音的情绪、口音、节奏、停顿和语调进行详细调整,实现个性化的声音输出。

  • 零样本跨语言声音克隆: 即使某些语言未在训练集中出现,OpenVoice 也能实现声音复制。

  • 高效的计算性能: 相比于市场上现有的商业API,OpenVoice 在保持高性能的同时,计算成本大大降低。

OpenVoice V2新特性:

苹果xs max金色多少钱

  • 更好的音频质量: 采用新的训练策略提升音频质量。

  • 原生多语言支持: 原生支持英语、西班牙语、法语、中文、日语和韩语。

  • 集成 MeloTTS: V2版本引入了 MeloTTS 技术,增强了声音的自然度和表现力。

  • 免费商业使用: 自2024年4月起,V1和V2版本均以 MIT 许可证发布,支持商业和研究用途的免费使用。

技术方法:

声音样式和语言的解耦设计: OpenVoice 的设计哲学是将声音的不同特性进行解耦,使得可以独立控制各个参数,提高操作的灵活性和推断速度。

基础发音者 TTS 模型与音色转换器: 包括允许对风格参数进行控制的基础发音者 TTS 模型,以及采用编码器-解码器结构的音色转换器。

训练策略和数据处理: 在训练过程中,使用了大量的多语种、多风格的音频样本,并采用特定的损失函数确保在保留风格的同时去除或转换音色。

官网:https://research.myshell.ai/open-voice

open audio

项目地址:https://top.aibase.com/tool/openvoice

创建自己的语音机器人:https://myshell.ai/

opensl audio


返回网站首页

本文评论
澎湃S2今年发布!5nm工艺制式,性能持平骁龙8+?_澎湃s2什么时候发布
小米在2017年推出首款自主研发的SOC——澎湃S1之后,澎湃S2迟迟没有和消费者见面;业内人士曾经表示,澎湃S2多次流片失败,官方已经放弃了这款芯片;不过最新的消息显示,小米澎湃S2有...
日期:01-26
短剧或成行业主流「口碑突破,类型多元,微短剧行业的“量变”之年」
声明:本文来自于微信公众号 读娱(ID:yiqiduyu),作者:一实,授权转载发布。进入十月以来,长时间出现在芒果TV综合热搜第一的不是《密室大逃脱》和《披荆斩棘》这些综N代新作,也不是...
日期:10-28
百度文心一言用户数突破2亿,API 日均调用量2亿_百度文心ernie
划重点:⭐️ 文心一言用户数突破2亿,API 日均调用量2亿⭐️ 文心大模型4.0工具版推出,提升训练效率5.1倍⭐️ 百度推出三大开发工具:AgentBuilder、AppBuilder 和 ModelBuilder4月16...
日期:04-16
研究显示,GPT-4可以自主利用安全漏洞,具备攻击性
划重点:⚠️ 研究揭示:GPT-4可以独立利用安全漏洞⚠️ 通过15个真实一日漏洞,GPT-4成功率高达87%⚠️ 研究呼吁广泛部署 LMM 代理需谨慎对待4月24日 消息:每周至少有一次,生成式人工...
日期:04-24
数字化新契机 2021MIS制造创新峰会只等你出席!_2021中国企业数字化创新峰会
  在大规模停摆下,“劫后余生”是对仍然活跃在市场的企业最好的概括。外部压力对新制造的冲击、供应链断裂的“灾难”、产业数字化的市场方向,制造企业面临的变化无疑是前...
日期:07-24
小米13 Ultra外观曝光:4月18日正式发布
小米13 Ultra手机已经官宣,目前已经定档在4月18日正式发布,只不过小米还没有官宣,而目前官一张最新的带壳渲染图显示,小米13 Ultra背部的外挂被曝光。华为mate 50谍照spacex将发...
日期:04-10
X100系列首发-天玑9300将采用全大核架构_直接挑战苹果A17 「vivo」_天玑处理器900相当骁龙什么处理器
今年上半年,联发科推出了天玑9200+移动平台,截至目前已有多款机型进行搭载,是目前安卓阵营性能最强的芯片之一。不过天玑9200+只是开始,此前联发科官方就正式确认了下一代旗舰芯...
日期:09-09
王炸更新!谷歌发布PaLM 2大模型:支持100种语言_google pacman
快科技5月11日消息,谷歌年度开发者大会Google I/O 2023上,PaLM 2大模型正式发布,准备向OpenAI的GPT-4等竞争对手发起挑战。据了解,PaLM 2是谷歌首个从头开始构建的多模态模型,具...
日期:05-11
三星引入 ChatGPT 不到 20 天,被曝发生 3 次芯片机密泄露!「三星chc」
声明:本文来自于微信公众号CSDN(ID:CSDNnews),整理 | 郑 丽 媛,授权转载发布。ChatGPT 爆火4个月,已逐渐成为各路打工人的“辅助神器”:能写代码、能编小说、还能给出策划方案……...
日期:04-04
这些退伍军人身披“电信蓝”冲锋在涞水灾区一线
通信世界网消息(CWW)河北省涞水县地处山区,本次暴雨过后,通信基础设施受损严重,抢修难度大。了解灾情后,中国电信保定涞水分公司驻义合庄村干部李杰、李金杰主动请缨,是第一批赶赴...
日期:08-06
一分钟短剧乱象丛生 广电总局出手:已下线25300多部
11月15日消息,随着短视频的普及,一分钟左右的微短剧也成为最新是赛道,据说规模比电影市场还要大。据国联证券预估,仅字节跳动体系内,短剧的流水规模就能达到220亿,要知道,中国内地...
日期:11-16
2021特斯拉2月份销量「特斯拉 2 月份中国产汽车销量 74402 辆」
3 月 3 日讯:乘联会数据显示,特斯拉 2 月份中国产汽车销量 74402 辆,比亚迪为19. 17 万辆。魅族手机系列及价格tcl电视全球排名闪存内存涨价原因...
日期:03-03
乐淘佳资讯:2022年网店转让行业分析报告_乐淘佳网店转让平台可靠吗
  据天眼查专业版最新数据显示,目前我国共有超378万家电商相关企业。近年来,基于互联网的“商业服务业”迅速崛起,平台与服务商融合发展,服务商生态集聚化。在互联网平台...
日期:07-10
Be Yourself:有效防止SD图像生成过程中提示词概念相互污染
3月27日 消息:近日,一个名为Be Yourself的项目引起了广泛关注。这个项目旨在解决SD(Stable Diffusion)图像生成过程中的一个问题:提示词概念相互污染。通过采用一种无需额外训...
日期:03-27
大众汽车在与富士康谈判合作建厂 生产Scout品牌汽车
DoNews11月30日消息(郭睿琦)据报道,知情人士透露,大众汽车在与富士康谈判合作建厂,为美国市场生产Scout品牌汽车。魅族mx4和红米note2大众汽车在考虑的其他选项包括与麦格纳国际...
日期:12-02
12999元的RTX 4090显卡解禁:CPU已成性能瓶颈「rtx3080显卡内存」
今晚NVIDIA的RTX 4090显卡正式解禁,售价12999元的新一代显卡旗舰展示出了强大的性能水平,之前官方表示在DLSS3、RTX等技术加成下,性能可是3-4倍于上代的RTX 3090显卡。当然,不考...
日期:10-16
法拉第未来执行董事长辞职 贾跃亭又将其收下「法拉第未来贾跃亭有多少股份」
外媒消息称,法拉第未来执行董事长苏珊斯文森 (Susan Swenson)已经官宣正式辞职。苹果产量预估而辞职的原因是FF官方已经与公司大股东FF Top就融资和董事会重组,最后,根据董事会...
日期:10-14
全球AI网络安全协议在图灵布莱切利公园签署
在图林的布莱切利公园,美国、英国、中国和欧盟等28个国家签署了“布莱切利宣言”,这是一项合作协议,旨在管理新兴人工智能(AI)工具,尤其是技术的网络安全风险。这些国家一致认为,潜...
日期:11-02
微软、OpenAI等投入1000万美元用于增强生成式AI产品的安全_微软创新赋能暨生态加速计划
要点:1. 微软、OpenAI等科技公司联合投入1000万美元,并任命Chris Meserole为“前沿模型论坛”的执行董事,以增强ChatGPT等生成式AI的安全。2. “前沿模型论坛”由微软、OpenAI...
日期:10-26