您的位置:首页 > 互联网

Meta 的开源语音 AI 项目 MMS 可识别 4000 多种口头语言

发布时间:2023-05-23 12:18:10  来源:互联网     背景:

5月23日消息: Meta 公司的人工智能研究团队今天宣布开源一个名为「Massively Multilingual Speech(大规模多语言语音)」的新项目,旨在解决创建准确可靠的语音识别模型的挑战。

345642148_1307836530084996_235818007697008664_n.png

图片来自Meta

能够识别人类语音并清晰回应的 AI 模型具有巨大的潜力,特别是对于完全依赖语音访问获取信息的人来说。然而,训练高质量的模型通常需要大量的数据,包括数千小时的音频和对话内容的转录。对于许多语言,特别是那些较为冷门的语言,这样的数据根本不存在。

Meta 的 MMS 项目通过将一种名为 wav2vec 2.0 的自监督学习算法与一个提供了超过 1,100 种语言标记数据和近 4,000 种语言无标记数据的新数据集相结合,克服了数据不足的问题。

为了解决某些语言数据缺乏的问题,Meta 的研究人员利用《圣经》这本在很多语言中已经被翻译的书籍。其翻译通常被用于基于文本的语言翻译研究,并且许多语言而且,还有人们朗读这些文本的公开可用的音频录音。

「作为这个项目的一部分,我们创建了一个包含 1,100 多种语言新约圣经的数据集,平均每种语言提供了 32 小时的数据量,」Meta 的研究人员说道。

当然,32 小时的数据量不足以训练传统的有监督语音识别模型,这就是为什么使用 wav2vec 2.0 的原因。Wav2vec 2.0 是一种自监督学习算法,使机器能够在不依赖于标记训练数据的情况下学习。

借助这种算法,可以用更少的数据训练语音识别模型。MMS 项目在 1,400 多种语言中的约 500,000 小时的语音数据上训练了多个自监督模型,然后对生成的模型进行了特定的语音任务微调,如多语言语音识别或语言识别。

Meta 表示,生成的模型在 FLEURS 等标准评估以及与其他语音识别模型的比较中表现良好。

马斯克创办特斯拉

iPhone12或于14日发布

「我们使用了一个包含 1B 参数的 wav2vec 2.0 模型在 1,100 多种语言上训练了多语言语音识别模型,」Meta 的研究人员解释道,「随着语言数量的增加,性能确实会下降,但幅度很小,:从 61 种语言增加到 1,107 种语言,字符错误率仅增加约 0.4%,但语言覆盖范围增加了 17 倍以上。」

在与 OpenAI LP 的 Whisper 语音识别模型进行直接比较时,Meta 的研究人员发现,使用 MMS 数据训练的模型的单词错误率大约是其一半。「这表明我们的模型在与目前最佳的语音模型相比时表现非常出色,」研究人员表示。

Meta 表示,现在他们正在分享 MMS 数据集和用于改进和训练模型的工具,以便 AI 研究界的其他人能够在此基础上进行进一步的工作。MMS 项目的目标包括扩大其覆盖范围以支持更多的语言,并改善对方言的处理,这是现有语音技术所面临的主要挑战。

iphone 14 pro max自动重启

「我们的目标是让人们更容易以自己偏好的语言获取信息和使用设备,」研究人员说道,「我们还设想未来的情景是,一个单一模型能够解决所有语言的多种语音任务。虽然我们训练了独立的语音识别、语音合成和语言识别模型,但我们相信将来一个单一模型将能够完成所有这些任务,带来更好的整体性能。」

赛力斯新车规划


返回网站首页

本文评论
论文发表nature「Nature新规:用ChatGPT写论文可以,但不能列为作者」
5月1日 消息:Nature针对ChatGPT代写学术文章、被列为作者等问题,给出了两项原则:任何大型语言模型工具都不能成为论文作者;如在论文创作中用过相关工具,作者应在“方法”或“...
日期:05-01
消息称下周骁龙8+ Gen 1新手机相继发布_骁龙8cx Gen2
IT之家 8 月 5 日消息,此前摩托罗拉 moto X30 Pro / razr 2022 新品发布会因故取消、一加 Ace Pro 新品发布会宣布延期。不过有消息称,下周一批骁龙 8+ Gen 1 新手机将进行正...
日期:08-20
雷军称贝索斯曾向其道歉:未照顾好卓越网(贝索斯为什么卸任)
8月11日晚间消息,2022年雷军的年度演讲“穿越人生低谷的感悟”如期而至。此次年度演讲除了分享个人感悟之外,雷军还带了包括小米全新折叠屏手机MIX Fold2以及Redmi K50至尊版...
日期:08-21
第三方文件 UWP 正适配 Win11:全新设计,标签式文件资源管理器
  8 月 27 日消息 外媒 MSPoweruser 报道,Files(文件)是一款适用于 Windows 10 的第三方开源文件管理器,它利用了 Windows 平台的最新功能,包括流畅设计、无缝更新和 API,实...
日期:07-17
积极参与社会安全共建 自如通过安全生产标准化三级达标
  近日,北京市朝阳区应急管理局公告了2019年安全生产标准化达标企业名单,依据《安全生产等级评定技术规范第58部分社会旅馆》(DB11/T 1322.58-2018)进行自评和外部评审,自如...
日期:07-14
三星3nm抱上谷歌大腿:Google Teor G3旗舰芯片已在路上_谷歌Google Pixel 3
今日消息,据SamMobile报道,高通、联发科旗舰Soc不约而同的交由台积电代工,三星暂时失去了这两位大客户。不过三星跟谷歌关系越来越紧密,最新爆料指出,Google Pixel 8系列使用的Go...
日期:11-15
京东与找钢集团达成战略合作 共推制造业数字化转型
  21世纪经济报道记者杨清清 北京报道  9月9日消息,找钢产业互联集团和京东宣布达成全面战略合作伙伴关系,共推制造业数字化转型。猎豹移动概念股  据了解,在交易侧,京东...
日期:09-10
高通2023财年第一财季营收同比下降12% 净利同比下降34%_高通财报2020
2月3日消息,据外媒报道,当地时间周四,芯片制造商高通发布了2023财年第一季度财报。财报显示,如果按照美国公认会计准则(GAAP)计算,该公司第一财季营收为94.63亿美元,同比下降12%;净利...
日期:02-03
iphone11水下「iPhone 15支持水下操作 专利曝光」
从2016年的iPhone 7开始,iPhone就标配防水,但并不保修常生活中的一些水溅、掉水坑、掉洗脚盆的场景都基本无碍,苹果甚至还打造了新的技术,让iPhone可以在水下也能自由操作屏幕。...
日期:02-25
腾讯程武在联合国教科文旗下《HAS》杂志撰文:在焦虑的时代,科技与文化融合为人类创造新希望
  近日,联合国教科文旗下《人文、艺术与社会》杂志(The Magazine of Humanities, Arts and Society,下简称《HAS》)第二期《在焦虑与希望之间》正式上线,联合国教科文组织社...
日期:09-09
吉利汽车前挡风玻璃「吉利真会玩儿:汽车挡风玻璃上实现烟花秀」
企查查APP显示,近日,浙江吉利控股集团有限公司、吉利汽车研究院(宁波)有限公司申请的在智能座舱中实现烟花秀的方法和智能座舱”专利公布。企查查专利摘要显示,所述方法包括:1、在...
日期:01-29
抖音电商拟允许连体钞流通币销售吗「抖音电商拟允许连体钞流通币销售」
12月23日 消息:抖音电商发布了关于连体钞/原厂币允许售卖的意见征集通知,意见征集期内2022年12月22日—2022年12月29日。本次核心变化为:1、允许官方装帧/原厂封装类钱币销售...
日期:12-23
辛选:辛巴年货节单场带货超1400万单_辛巴双十一带货27亿
12月26日消息,12月24日辛选集团创始人辛巴辛有志年货节直播专场收官,累计带货1400多万单。在辛巴直播间,三只松鼠、蒙牛、泸州老窖等上架即被抢购一空。其中,坚果累计引导销售超...
日期:12-26
“数学废柴”也能考进前三!作业帮初中数学给你196个逆袭大招
  “数学废柴”的转身   山东青岛的初二学生周博,过去一年多,数学一直比较差。   “班上的同学总说我在数学上是个废柴。”周博说自己的情况从初一后变得糟糕。他回...
日期:09-02
腾讯最大股东Prosus出售112万股腾讯股份,持股比例降至27.99%「腾讯最新持股比例」
查看最新行情   讯 9月8日晚间消息,腾讯的最大股东Prosus出售112万股腾讯股份,持股比例降至27.99%。下一款屏下摄像头手机外卖是o2o...
日期:09-10
女子高铁投喂前座萌娃 被回赠奶瓶:网友笑赞饭碗都拿出来了
女子高铁投喂前座萌娃 被回赠奶瓶:网友笑赞饭碗都拿出来了张一鸣退出多家字节跳动关联公司法定代表人1月4日,在长沙至武汉的高铁上,一女子遇到了一个懂得礼尚往来的萌娃。手机...
日期:01-05
卖出的巴黎水装满10个游泳池! 京东11.11海囤全球完美收官
  今年的京东11.11注定不凡,不但有“超级百亿补贴千亿优惠”的重磅福利释出,更是为消费者准备了超强产品扩容。作为主打集结全球正品好物的跨境平台,京东海囤全球集结了全球...
日期:12-07
B站国创作品收入预计超20亿 《三体》动画定档12月3日
凤凰网科技讯 10月29日消息,哔哩哔哩(以下简称“B站”)宣布《三体》动画定档12月3日,并将开启《三体》动画全球共创计划。同时,B站推出了49部国创作品新内容,包括《镇魂街 第三季...
日期:10-30
美团港股开盘跌_港股美团跌超11%,市值跌破1万亿港元
iphone 11 原价 查看最新行情   讯 8月16日下午消息,港股美团跌超11%,报159.6港元每股,市值跌破1万亿港元。此前有市场消息称,腾讯计划出售美团的全部或大...
日期:08-18
ChatGPT实火!微软正洽谈100亿美元增持OpenAI
1月10日消息,据国外媒体报道,最近爆火的AI聊天机器人ChatGPT所有者OpenAI在日前传出打算以要约形式出售股票后,今日又传出了与微软更进一步投资合作的消息。知情人士称,周二,微软...
日期:01-10