您的位置:首页 > 互联网

谷歌听力「谷歌研究团队宣布 AudioPaLM:一个能说能听的大型语言模型」

发布时间:2023-06-25 14:02:56  来源:互联网     背景:

6月25日消息: 大型语言模型(LLMs)近几个月一直备受关注。作为人工智能领域最重要的进展之一,这些模型正在改变人机交互的方式。随着各行各业纷纷采用这些模型,它们成为人工智能在全球蔓延的最佳例证。

谷歌听力

LLMs 在处理复杂交互和知识检索任务时表现出色,其中最著名的例子是由 OpenAI 开发的 ChatGPT 聊天机器人,它基于 GPT 3.5 和 GPT 4 的 Transformer 架构。除了文本生成外,还开发了像 CLIP(对比性语言图像预训练)这样的模型,用于图像生成,使得可以根据图像的内容生成文本。

宝马会自燃吗

为了在音频生成和理解方面取得进展,Google 的研究团队推出了 AudioPaLM,这是一个大型语言模型,可以处理语音理解和生成任务。AudioPaLM 结合了两个现有模型的优势,即 PaLM-2 模型和 AudioLM 模型,以产生一个统一的多模态架构,能够处理和生成文本和语音。这使得 AudioPaLM 可以处理各种应用,从语音识别到语音转文字。

虽然 AudioLM 在保持诸如说话者身份和语气信息方面表现出色,而以文本为基础的语言模型 PaLM-2 则专注于特定于文本的语言知识。通过结合这两个模型,AudioPaLM 利用了 PaLM-2 的语言专业知识和 AudioLM 的附加语言信息保存能力,从而更全面地理解和生成文本和语音。

AudioPaLM 使用一个联合词汇表,可以使用有限数量的离散标记表示语音和文本。将这个联合词汇表与标记化的任务描述相结合,可以在各种声音和基于文本的任务上训练单个解码器模型。传统上需要单独模型来处理的语音识别、文本转语音合成和语音到语音翻译等任务现在可以统一到一个架构和训练过程中。

马苏与孔令辉复合

经过评估,AudioPaLM 在语音翻译方面的表现明显优于现有系统。它展示了对语言组合执行零样本语音到文本翻译的能力,也就是说,它可以准确地将从未遇到过的语言的语音翻译成文本,为更广泛的语言支持开辟了可能性。

AudioPaLM 还可以基于简短的口语提示在语言之间进行声音转换,并能捕捉并重现不同语言中的独特声音,实现语音转换和适应。

团队提到的 AudioPaLM 主要贡献包括:

  1. AudioPaLM 利用了文本预训练模型 PaLM 和 PaLM-2 的功能。

  2. 在自动语音翻译和语音到语音翻译基准测试中取得了最先进的结果,并在自动语音识别基准测试中具有竞争力的表现。

  3. 该模型通过语音转换来进行声音转换,超越了现有方法在语音质量和声音保留方面的表现。

  4. AudioPaLM 通过使用未见过的语言组合进行自动语音翻译,展示了零样本功能。

总而言之,AudioPaLM 是一个统一的大型语言模型,通过利用基于文本的语言模型的能力和整合音频提示技术,可以同时处理语音和文本,成为 LLM 列表中强有力的补充。

AudioPaLM Hugging Face 页面:https://huggingface.co/papers/2306.12925

amdrx7900首发名单

三星z fold3发布时间


返回网站首页

本文评论
誓做行业“领跑者”!TCL电视又双叒叕获权威大奖(tcl电视王牌)
  近日,由国家市场监督管理总局指导、中国标准化研究院、企业标准“领跑者”联盟主办的2020年企业标准“领跑者”大会发布了由76家评估机构发布的2020年度第一批企业标准...
日期:07-16
Coinbase第二季度营收8.03亿美元 同比转盈为亏
屏下指纹 小米iphone手机怎么辨别翻新机双十一买投影仪划算不ipadpro2020边框荣耀note10打不开turbo芯片制造科普 查看最新行情   讯 北京时间8月10日...
日期:08-11
英国重大组织犯罪署网站被黑客组织Lulz攻破
  北京时间6月21日消息,黑客组织Lulz Security周一宣布攻破英国警方重大组织犯罪署(以下简称“SOCA”)网站,导致该网站在短时间内无法访问。   Lulz Security在过去一个月...
日期:07-30
小红书健康等级异常了咋办?「小红书出现异常」
声明:本文来自于微信公众号 麋鹿先生Sky(ID:milusir94),作者:麋鹿先生Sky,授权转载发布。每个月的25号,对于小红书的博主们来说,都是一次特别的日期,有些人开心,有些人难过,无他,正是...
日期:03-29
每逢佳节被催婚,大厂青年难过“脱单”关
声明:本文来自于微信公众号创业最前线(ID:chuangyezuiqianxian),作者:李小反,授权转载发布。假期每接近一天,大厂“打工人”于西西的焦虑就增加一分。春节临近,令人窒息的催婚大戏...
日期:01-21
收购TikTok未果!微软CEO吐槽:这是我干过最奇怪的事「苹果采购副总裁因在 TikTok 发表低俗言论而离职」
9月30日消息:据彭博社报道,苹果公司的采购副总裁Tony Blevins在最近的TikTok视频中对自己的职业发表了粗俗的评论,因此他将离开公司。Blevins出现在TikTok创作者Daniel Mac的...
日期:09-30
印度第二家苹果零售店在德里开业 库克出席开幕仪式_印度苹果产业链
4月20日消息,据外媒报道,继本周二在印度孟买开设了第一家苹果零售店后,苹果于当地时间周四在印度德里开设了第二家零售店Saket商店,苹果CEO蒂姆•库克(Tim Cook)同样亲临现场参加...
日期:04-21
McAfee和RSA发布企业安全与遵从性解决方案
  10月18日,据国外媒体报道,McAfee和RSA在今年初签署了合作协议,现在这两家公司计划发布一种新的解决方案,用来确保企业提高安全状况和风险管理水平,并从中受益。McAfee安全管...
日期:07-24
高颜值搭配强功能,坚果G9实为“高性价比机皇”(坚果G9缺点)
  挑选产品的时候,特别是购买价格不菲的电子产品,我们一般在意的都是什么呢?品牌?配置?功能?哪怕其中一个有质疑都不敢轻易入手。所以能经受住来自消费者的目光与考验,还能...
日期:07-17
荣泰漫威联名款筋膜枪,可以放在口袋里的身体放松神器
  最近一段时间,筋膜枪的人气实在太高了!不仅一大波健身博主争相种草,最近丁香医生推荐了荣泰G20漫威款筋膜枪,让我们来康康荣泰G20漫威联名款筋膜枪,用按摩科技,拯救每一块肌...
日期:07-10
AMD R5 4400G 现身:6 核 APU,核显频率达 1.9 GHz(AMD APU A4-6210(1.8GHz/L2 2M))
  6 月 11 日消息 日前,商用的 R5 Pro 4400G 已经曝光,现在消费级的 R5 4400G 出现在了跑分平台上,两者参数一致,都是搭载了 6 核 CPU 和 1.9GHz 的 GPU。   如图所示,R5 4...
日期:07-14
简单三招 金山卫士让系统不再“慢两拍”(打开金山卫士)
  随着电脑硬件的升级换代,高性能的计算机现在已经走入了普通老百姓家中。尽管电脑硬件性能提升了好几倍,但仍经常听到身边的朋友在抱怨:为什么电脑启动这么慢,为什么打开一...
日期:07-25
新娘婚礼当天穿上奥特曼服装 新郎直呼非常懵:背后原因让网友羡慕
近日,郑州一对新人结婚上了热搜,原来是新娘穿了奥特曼的服装,这让新郎万万没想到。按照新郎郑先生的说法,婚礼的每个细小环节都是他和妻子精心策划的,当时结婚当天一进门看见一个...
日期:05-26
3999元起  华为Mate50E今日开启预售_华为mate50最新官方消息
中关村在线消息:10月8日上午10:08,主打“创新本色,领势而上”的华为Mate50E即将正式开启预约,10月14日正式开售。华为官方也随手机一同为用户提供了碎屏服务宝、延长服务宝两项...
日期:10-13
艾瑞团购排行榜 聚划算美团拉手居前三
5月23日消息,艾瑞近日发布的2011年3月团购网站总访问次数排行榜,其中前三位分别是淘宝聚划算、美团网、拉手网。 2011年3月月度总访问次数团购网站排名  数据显示,淘宝聚划...
日期:07-28
今天电信大面积故障「中国电信突发大规模故障!官方最新回复:已逐步恢复」
快科技6月8日消息,今天下午,广东电信突发大面积故障,具体表现为无信号、无法拨打电话、无法收发短信、上网等。手机qq 怎样 打开 京东优惠券TCL集团营业收入目前,广东电信客服官...
日期:06-09
骗得了别人骗不了百度指数  冷空气后你的胃最想吃什么它门清
  国人人人喜爱用百度检索,可你如果知道检索之后,百度指数反应出的内容,或许会觉得更加有趣。从2018年12月份以来,全国共经历了2次超低温,每次低温之后都伴随着一波火锅潮。...
日期:11-02
创造历史!比亚迪第300万辆新能源车下线_比亚迪新能源车销量2021
11月16日,比亚迪汽车宣布,第300万辆新能源车正式下线。比亚迪第300万台新能源车是e平台3.0首款纯电轿车海豹,它集合了比亚迪目前最为顶级的技术,足球运动员王霜则成为了该车的车...
日期:11-18
剧版《哈利·波特》官宣 启用全新演员阵容_哈利·波特系列演员表
华纳兄弟探索公司正式宣布将其流媒体HBO MAX升级为MAX,于 5 月 23 日正式推出,包括了原有的HBO MAX和Discovery的内容。剧版《哈利·波特》也随之官宣,华纳发布了该剧的先导预...
日期:04-13
潘建伟院士:量子科技最新进展及未来展望「量子技术 潘建伟」
来源:君联资本CEOClub2020年,76个光子的量子计算原型机“九章”在求解高斯玻色取样的特定问题上,速度是当时最快的经典超级计算机的100万亿倍。近期潘建伟团队已经实现了255个...
日期:06-10