您的位置:首页 > 互联网

苹果手机如何复制音乐「只需 15 分钟,iPhone 就能「复制」你的声音」

发布时间:2023-06-05 11:03:01  来源:互联网     背景:


史蒂芬·霍金的「机械电音」,也许是世界上其中一个最有辨识度的声音。

但那并不是霍金自己的声音。


在霍金因渐冻症(ALS)失去说话能力的年代,技术还不足以让他能生成自己声音。事实上,能用上语音合成器的人都屈指可数。

到了今天,ALS 患者虽然有了更多语音合成的选择,但总体费用和时间门槛仍然不低,普及度也有限。

最近,苹果公布了全新无障碍功能 Personal Voice(暂未上线),不仅让用户能免费「备份」自己的声音,同时还在安全地应用 AI 技术上,作出了一次有意思的尝试。

只需 15 分钟「调教」,就能生成你的声音


▲ 图自 Fastcompany

在生成式 AI 可以模仿一切的时代里,用 AI 模仿一个人的声音听起来已经不算新奇,只是感觉有点安全隐患。

我好奇的,更多是苹果要怎样安全和高效地实现 Personal Voice 这一功能。

据介绍,iPhone、iPad 和 Mac 用户只需要根据提示录制 15 分钟的音频,苹果就会基于设备端的机器学习技术来生成和用户一样的声音。

相比之下,为失语群体提供专业语音合成服务的公司,可能需要采用专业设备,录制几小时的语音素材,价格最低都要数百美元。

另一项新无障碍功能 Live Speech,则支持用户打电话、FaceTime 或者是和他人面对面对话的时候,输入文字即可生成语音内容,为失语或不方便说话的用户提供另一种「发声」方式。


结合 Personal Voice 和 Live Speech 两项功能,失语用户就能用接近自己原本声音的生成声音和他人沟通。

用起来是方便了,但怎样避免有人用网上扒的语音素材来生成他人的声音?

  1. 素材随机化。

在录制 15 分钟语音素材的过程中,苹果将随机生成需要用户朗读的内容,减少他人猜中素材的可能性。

英特尔锐炬显卡驱动


  1. 物理距离屏障。

在录制过程中,用户需要在距离设备 6-10 英寸(约 15- 25 厘米)的特定空间里完成录制。

在生成过程中,所有数据都将通过苹果的 Neural Engine(神经引擎)在设备本地完成,不必要上传到云处理。

语音合成后,第三方应用如果想使用 Personal Voice,都要获得用户明确授权。


即便第三方应用获得授权使用时,苹果也会采用额外的背景保护,确保第三方应用无法获取 Personal Voice 以及用户之前所录制的语音素材。

如果是苹果「全家桶」用户,生成自己的 Personal Voice 后还能通过 iCloud 同步到不同设备上,并以端对端的方式加密。

自己的声音,失去了才懂多重要


人是感性的生物,而声音是很强烈的情感触发器。

有研究指出,当人在听到母亲的声音时,身体释放出催产素水平和跟妈妈拥抱时产生的程度很相似。另一个研究则指出,听到自己的声音,会增强一个人的自我能动性。

这听起来有点抽象。

华为向诺基亚交专利费

但当我们失去它时,重要性就变得显而易见了。

2021 年 3 月,Ruth Brunton 被确诊 ALS。那年圣诞,她就已经失语了。

ALS 患者中,约有 25% 的人患的是「延髓起病型」肌萎缩侧索硬化症,主要表现是说话障碍或吞咽困难。这类病人说话会逐渐变得含糊、带有鼻音,甚至失语。

Brunton 的行动很果断,确诊后马上找公司去做语音生成。

蔚来会成为下一个特斯拉吗

来回花了一个月时间,录了 3000 多个句子的语料,但最后出来的结果并不理想。

那家公司用的是一种名为「单元选择(unit selection)」技术。

简单粗暴来说,它就是通过「拼接」来实现语音生成,把语料拆分为大量小的语音单元,然后按需把元素拼起来。


▲单元选择技术下,「Bob」这一词语能被拆分成不同语音元素,图自《华盛顿邮报》

这种技术生成的语音能听清,但会有点电音,听起来不太自然。

结果就是,Brunton 录制的语料结合了微软一个名为「Heather」的声音,不但声音和自己毫不相似,甚至逼着这英国人「讲」起了美语口音。


https://s3.ifanr.com/wp-content/uploads/2023/06/real-ruth.m4a

▲ Brunton 自己真实的声音

https://s3.ifanr.com/wp-content/uploads/2023/06/heather.m4a

▲ 合成版 Brunton 的声音

困在这个声音里,Brunton「只会在必要的时候说话,不再是因为想说话而说话」。

从前和丈夫打闹聊天的心情消失了,Brunton 也不怎么愿意参加多人对话。

即便是说「我爱你」,用一个不像自己的声音来说,意义也似乎被削弱了。


六个月后, Brunton 和丈夫争取回了最初录制的语音素材,找了另一家公司,用 AI 技术合成了一个更像她自己的声音:

苹果手机铃声复制

这听起来也许有点傻,但重新获得自己的声音让我更有自信了。

在波士顿儿童医院负责「增强沟通」项目的 John M. Costello 留意到,那些采用了更真实生成语音的病人,似乎更能够和亲近的人建立深厚的联结。

2022 年圣诞节,「重获新声」的 Brunton 还用语音录制的一段节日祝语。

https://s3.ifanr.com/wp-content/uploads/2023/06/ruth.m4a

▲ Ruth 觉得新的合成声音更像自己

然而,圣诞刚过,Brunton 就染上了新冠,最后在今年 2 月离世了。

她离开的那晚,丈夫 David 一整夜都握着她的手:

我们有两年时间来告别。 我们说好了,我们要说尽一切我们想说的。

难以想象,如果 Brunton 后来没换上更像自己的声音,她又是否能自在地说出想说的一切。

无障碍思维点亮灵感,AI 燃起生产力


我一直认为,无障碍设计所挖掘的,其实就是人类多样性创造的想象力资源。

我们去到和自己有着截然不同生活体验的人面前,聆听更少被诉说的故事和体验,创造出我们之前没想象过,但却能对更多人友好的的新生活方式。

Personal Voice 能让失语的 ALS 患者重新获得自己的声音;也可以帮助在经历「刀片嗓」的我用自己的声音去和其他人对话;甚至,我也很难避免会去想象,是否应该用这为自己「备份」声音留给亲近的人,以免哪天自己会突然离世。

而 AI 技术,就是实现这些想象力生产力。

正如杜编辑之前说的,虽然不赶生成式 AI 的热闹,但苹果一直都把 AI 用来提升用户体验 —— 提升效率,保护隐私。


提升效率,在于提升本地执行的机器学习算法和模型。

除了 Personal Voice 以外,苹果这次预览的另一个无障碍功能 Point and Speak 也采用了本地设备端的机器学习技术。

未来,视障用户在 iPhone 自带的放大器里,结合 Point and Speak 和旁白功能,就能凭自己手指把 iPhone 变成「点读机」 —— 点到哪儿,让 iPhone 给你把文字读到哪儿。


去年的「门检测」功能道理也类似,让设备端的机器学习帮视障用户识别出门,并朗读出门上面的信息和周围的标识。


至于隐私,按乔布斯说的,就是「如果你需要他们(用户)的数据,那就向他们(用户)请求。每一次都如此。」

这在无障碍设计方面也尤其重要 —— 因为这些功能设计起源就是服务被所谓「常规设计」忽略的人,常常都是更弱势的群体,因此更有必要确保这些用户的隐私不受侵害。

在这个语境下,我们也可开启更多关于数据应用权和透明度的讨论。

苹果这次做 Personal Voice 时,和帮助 ALS 患者的非盈利机构 Team Gleason Foundation 合作。


▲ Team Gleason Foundation CEO Blair Casey(右)

该机构的 CEO Blair Casey 一直也在推动语音生成公司设定一套标准录制素材设定,让用户能直接录这部分素材,并体验不同公司生成出来的语音效果,而不是像现在一样「盲赌」。

同时,Casey 也主张语音生成公司把用户录制的语音素材数据提供给用户(因为很多用户可能录制后就失语了),以免他们未来想把这些数据用在其他技术上:

如果更好的技术出来了,你会不想试一试吗? 如果你没法拿回自己的语音素材,你就没法去试。

AI 也许是我们时代最强的生产力。

但是,这力该怎么使,也许以人为本的无障碍设计能给它不少指引。


返回网站首页

本文评论
乐信三季度财报_乐信发布Q2财报:营收24亿元,环比上升40.9%
8月17日消息,乐信(NASDAQ:LX)发布2022年2季度未经审计财务业绩。在2季度疫情冲击、宏观经济承压等外部环境下,乐信促成借款491亿元(人民币,下同),环比上升13.9%;在贷余额866亿元,环比上...
日期:08-18
从东南亚到欧美,淘金TikTok的正确姿势是什么?「东南亚tiktok在流行什么」
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:云飞扬1993,授权转载发布。在之前的TikTok系列报道中,我们已经相继讨论了什么是TikTok,TikTok网红有哪些特征,以及包括主播、商...
日期:09-28
足球迷必备!小米主题推出世界杯高清壁纸_皇马球迷壁纸
2022届世界杯正在卡塔尔如火如荼进行中,这项顶级体育赛事受到了广泛关注。小米用户现在有福了,小米主题推出了世界杯高清壁纸。据介绍,这些壁纸是小米主题联合《FIFA 足球世界...
日期:11-26
日本统计了56大高科技工业产品份额:我国拿到15个全球「日本制造业占世界比重」
日前,日本公布了2021年主要商品和服务份额调查”报告,总共的56个品类多与高科技工业产品相关。铂爵旅拍联系方式结果显示,美国公司在18个品类拿到第一名,中国公司在15个品类中拿...
日期:11-30
本田公布全新 HondaJet 概念飞机,可实现从纽约至洛杉矶不间断飞行_Honda飞机
  10 月 14 日消息,当地时间 10 月 12 日,本田(Honda)的飞机事业子公司 Honda Aircraft Company(HACI)在美国公务航空会议暨展览会(NBAA)上,展示了概念机型轻型公务机 Honda...
日期:07-17
三星1681打印机使用方法「三星168」
是指三星电子公司推出的一款手机。三星电子是韩国最大的电子产品制造公司之一,也是全球最大的手机制造商之一。采用了当时最先进的技术,成为了那个时代的一部经典手机。下面,我...
日期:05-28
极光运营宝典 | 开年领福利,银行“打工人”看这里!
  在我们刚刚迈入2021年的伊始,监管机构发布了《关于规范商业银行通过互联网开展个人存款业务有关事项的通知》,顿时成为互联网科技和金融界同行们进行热烈议论的话题。...
日期:07-16
阿里云盘即将推出元笔记:先给在校学生发1TB免费容量
  今年3月启动公测后,阿里云盘持续保持“不限速”、“不打扰”原则,吸引了一波用户。在未来商业化方面,引入丰富的个人云应用,是一项重要计划。   阿里云盘今日上线1T x 4...
日期:07-17
山寨播放器成垃圾图标制造机 每天2万网民被骚扰
  5月12日消息,金山网络云安全中心监测到网民在搜索“倩女幽魂、硬汉、天涯赤子心”等热门大片在线播放时,被暗藏病毒的虚假电影网站欺骗。安装专用播放器之后,病毒会在桌面...
日期:07-27
2023六大平台KOL粉丝分析研究|大搜索行为成势,内容偏好深度、专业、民生
声明:本文来自于微信公众号TopKlout克劳锐(ID:TopKlout),授权转载发布。粉丝作为KOL发展的基础与根本驱动力,在KOL的发展过程中扮演着重要的角色,不仅代表了KOL本人的内容价值和...
日期:05-17
Google暂不对Android3.0开源 针对国内厂家?(Google 3.0)
  开源的谷歌智能终端系统Android一出世就风靡全球,被誉为是与苹果iOS(应用于iPhone、iPad)唯一相匹配的劲敌,不仅被摩托罗拉、三星、索尼爱立信等巨头在中高端产品中广泛采...
日期:07-27
快播组件漏洞公开 360独家防御攻击
  8月5日消息,针对日前有技术论坛曝光快播(Qvod)组件漏洞一事,360安全中心紧急启动“漏洞防御机制”,最新推出的360安全卫士(8.2Beta版)已在360官网发布,是国内唯一能够真正...
日期:07-22
亚马逊CEO:疫情期间蓬勃发展或致过度扩张,公司正放慢招聘步伐_亚马逊公司新闻
  《华尔街日报》9月8日消息,亚马逊CEO安迪·贾西表示,疫情期间的蓬勃发展可能导致其过度扩张,该公司正放慢招聘新员工的速度。  亚马逊在最近几年大举招聘以满足消费者的...
日期:09-09
每周AI大事件 | GPT-4全面进入Windows 11、AI诈骗正全国爆发、百度内测基于大模型多款产品
欢迎来到的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。注:图片由midjourney生成Part1动态[国内要闻]百度...
日期:05-26
盘点海信激光电视L9F系列的那些“黑科技”(海信激光电视L9f)
  一提到激光电视,大家第一印象就是大屏、护眼。但除了这两项功能,大家也说不出激光电视更多的特色功能。实际上,激光电视作为采用激光光源,配备专业抗光增益屏,可以收看广电...
日期:07-16
时隔两年特斯拉“沉冤昭雪”!监管机构认定司机酒驾全责「特斯拉可以酒驾吗」
NTSB对数据的审查显示,这辆Model S自始至终都没有配备Autopilot系统,司机也没有使用特斯拉的任何先进辅助驾驶功能。 财联社2月10日讯(编辑 赵昊)当地时间周三(2月8日),美国国家运...
日期:02-13
谷歌公开向苹果施压 敦促采用跨平台通信协议RCS
8月10日消息,美国当地时间周二,谷歌启动了公开针对苹果公司的宣传活动,向后者施压以采用新的跨平台通信协议标准RCS(富通信服务),以取代已经过时的SMS和MMS标准。谷歌推出了名为“...
日期:08-20
寻找下一代发明家 2020年戴森设计大奖全球持续招募中(戴森设计大奖2021)
  [上海——2020年5月14日] 作为全球科技公司,戴森始终致力于通过独创及颠覆性的科技解决他人容易忽视的问题。同时,戴森也鼓励青年发明人才以技术缔造更美好的未来。戴森...
日期:06-02
围炉烹茶「围炉煮茶到冰茶,谁靠这杯茶赚翻了?」
声明:本文来自于微信公众号 锌刻度(ID:znkedu),作者:黎炫岐,授权转载发布。提起古代茶文化,或从《红楼梦》窥得不少。既有妙玉“收取梅上雪,五年后烹茶”,亦有“至夏日,黛玉进冰茶”...
日期:04-28
天猫618活动最全攻略 天猫618红包首发!最高23888元!「天猫618活动红包怎么用」
618年度购物狂欢节已开启,天猫的抢红包活动也已经开始啦!红包活动是天猫618的一部分,将为消费者带来无尽惊喜和优惠。在这个大促期间,通过参与互动游戏、完成任务和抽奖等方式,...
日期:05-30