您的位置:首页 > 互联网

奥特曼配音歌曲「10秒,让OpenAI奥特曼为你的视频配音?80岁歌手靠此技术翻红互联网」

发布时间:2024-02-28 17:52:28  来源:互联网     背景:

声明:本文来自于微信公众号 头号AI玩家(ID:AIGCplayer),作者:阿虎,授权转载发布。

奥特曼 配音

谁能想到,2023年香港乐坛最火的一首歌,是80岁歌手尹光和AI唱的。

这首《Dear Myself》荣获“叱咤2023年香港乐坛我最喜欢的歌曲”投票榜第1位,由歌手尹光和他的AI分身共创。很多网友都感动于那句“我声线亦折旧,我把这个使命过继给AI”。

值得一提的是,80岁的尹光还成为了首个注册AI声音专利的乐坛歌手。

2023年,“AI孙燕姿”在B站出道,曾一度让声音克隆变得十分热门。

彼时,我们制作声音克隆视频,还需要单独建立一个AI声库,采集大量的人类声音标本制作数据库,后期还得通过人工调试来模拟人声。

另外,还有一种办法是基于Bert VITS等开源项目,借助大量算力支持,直接文本转语音来还原音色。这对于设备、技术要求都比较高,网上可以找到许多教程,像“手把手教大家用GPT- SoVITS(声音克隆开源项目)”,或是部署“OpenVoice和SVC”。

图片来源:B站UP主“痕继痕迹”的GPT- SoVITS教程

但现在,部分AI工具只需要10秒乃至更少的声音样本,就能完美复刻音色。

2月26日,QQ音乐上线了声音克隆功能,1分钟录制原声,即可生成个人专属音色演唱歌曲,为AI声音赛道添了一把火。

我们见识过AI合成视频、动态图片的技术,而现在合成语音也变得轻而易举。对于创作者来说,AI声音克隆究竟进化到了何种程度?还有哪些热门的AI语音合成工具?如何快速复刻出真实声音?

奥特曼旁白配音

比亚迪股票解禁

10秒声音样本,AI就能克隆人声

那么AI克隆人声要怎么做?

“头号AI玩家”体验下来,对于很多创作者来说,如果是进行剧情重制、制作游戏二创视频,或是代替个人原声进行解说,目前AI工具中的音色克隆功能其实完全够用。

借AI声音合成的热度,“头号AI玩家”也生成了一版视频:

一加be2029

头号AI玩家,赞2

能够听出来配音来自于哪些明星和角色吗?

视频画面采用了OpenAI最新发布的Sora生成视频,配音工具则用的是近期流行的ElevenLabs和剪映的AI音色克隆功能,依次复刻了海绵宝宝、OpenAI CEO 奥特曼(Sam Altman)、梅西以及懒羊羊的声音。

以AI音频工具ElevenLabs为例,官方表示只要上传1分钟的声音素材,就能够把任意一段音频,快速生成为中文、葡萄牙语、日语等在内的29种语言,还保留声源的音色特征和情感色彩。

具体包括以下几个步骤:

首先,登陆ElevenLabs官网(https://elevenlabs.io/),先选择“Text to Speech”创建一个新项目,然后选择“目标音色”和“声音设置”来确定输出的音色。ElevenLabs预置了十几种不同口音、语气的角色供用户选择。

奥特曼配音搞笑视频

如果要使用自定义的声音,我们可以点击“Add Voice”按钮,上传已经录制好的音频。

以视频中奥特曼(Sam Altman)和梅西的声音样本为例,实际操作中我们只上传了10秒的清晰音频。上传完声音素材后,就可以等待ElevenLabs进行“克隆”了。

下面可选进一步编辑,点击“说话者Speaker”重新选择声音,或者在“Voice Setting”中对声音细节进行调整。

如果觉得这个声音和原声源并不像,可以点击“Similarity”进行调整,数值越高就越像源声音。而“Style”可以调整语音风格,包括生成的语速、停顿和语气。

实测下来,“Clarity+Similarity”数值在60%到75%之间,“Style”风格调整成75%至80%之间,“Stablility”调成55%-60%,音频的稳定性效果最好,声音也不会莫名其妙被改变,或者出现生成音频语速过快的情况。

另外,除了调整具体参数之外,还可以给文本添加标点符合来调整语速。比如视频中的梅西片段,我们就在“prefer”后面加了省略号,生成语速会自动减慢,一定程度上会改变表达的语气。

但实话实说,Elevenlabs的中文效果其实并没有非常出彩。如果中文音频素材只有5至10秒,生成的中文效果就更拉垮。我们上传第一版懒羊羊素材时,ElevenLabs的效果就带有明显的译制腔。

国内目前也推出了效果比较好的语音转换工具,免费可用。MiniMax上线应用“海螺问问”,其中的语音通话功能就可以克隆个人声音。

只需下载应用端,真人朗读一段儿歌就可以实现音色转换。

但相比ElevenLabs可以直接上传干音素材,国内的声音克隆工具大多采用朗读收录的方式进行复刻,暂时都不支持音频文件,一定程度上也避免了声音的滥用。

抖音旗下的视频剪辑工具剪映内置了“声音克隆”的AI功能,方便视频创作者一键实现文本到语音的转换。(相关阅读:《剪映的AI革命,字节的AI狂想》)

“头号AI玩家”此前发布的Sora相关视频,里面的视频配音就用到了AI朗读功能。

头号AI玩家,赞8

不过,这些AI音色都不是凭空而成的,大多需要采集真人声音作为声源,再进行深度学习,合成输出相似的语音音色。

还有一些专业向的声音工具,比如大饼AI、出门问问旗下的魔音工坊等,都支持一键改变创作者的音色,让音视频的创作有了延展发挥的空间。

未来AI声音的商业价值

除了丰富内容创作的形式之外,企业也在让声音变得有利可图。

2月13日,ElvenLabs上线了创作者激励机制,配音爱好者可以在ElevenLabs的语音库中分享自己的声音,并在他人使用时获得声音版权的收益。

该计划需要创作者在Voice Lab上传30分钟以上的个人音频,具体定价和使用途径都由创作者自行决定。

就像OpenAI推出GPTs创作者收益计划一样,ElevenLabs鼓励更多专业的配音演员出售他们的声音,用于更大范围的内容创作中。

评论区不少网友和配音演员都抱有乐观的心态,已经开始留言想听到“Martin Shaw”、“Dan Stevens”的AI声音了。

就现阶段的TTS(Text To Speech)技术而言,已经可以保证部分视频内容产出,比如电商带货、解说短视频、朗读录制播客。

对于内容创作者来说,AI语音克隆的应用方式多种多样,游戏、鬼畜、影视解说都有案例可供参考。从AI复活“塌房”UP主,到克隆音色鬼畜搞笑,什么都能玩。

比如,在苦等UP主更新的日子里,粉丝自己动手用AI制作想看的游戏解说。

不仅让游戏主播AI化,网友们还创造了普京分身、YouTube网红等AI平替,想让谁整活儿就让谁变声。

AI普京和普京视频通话;图片来源YouTube

AI工具大大减轻了创作者手动调音的工作量,鬼畜区UP主变得更高产了。就像UP主“女孩为何穿短裙”鸽了好久,幸亏有了AI,他才能产出这等好活。

图片来源:B站“女孩为何穿短裙”

尽管AI技术还没有完全改变人们的工作方式,但是却先改变了网友整活儿的表现形式。

还有一些中小电商商家会用AI来制作口播素材,像抖音平台流行的AI数字人带货,背后都有音色克隆的身影。

更有甚者,利用AI克隆声音后转成多语言版本,让自己的内容出海。随着AI语音合成技术的门槛逐渐降低,多语言分发成为不少创作者的选择。不少人选择以这种方式开拓更多渠道,笼络更多受众,获得更多流量。

从2023年AI生成披头士的最后一曲,到80岁歌手尹光AI共创,乃至助力创作者的高效产出,我们可以看到AI带来的时间、声音以及内容的延续性。

或许AI无法替代任何人事物,至少在未来,有了AI,你的一切都可以打破边界,开拓出新的内容创意和商业价值。


返回网站首页

本文评论
英伟达 RTX 4080 公版显卡实物曝光,与 RTX 3090 很像「英伟达rtx3070公版显卡」
IT之家 9 月 2 日消息,英伟达 RTX 40 系列显卡预计会在 9 月或 10 月发布,今日,爆料者KittyYukko 放出了一张标有“RTX 4080”的显卡图片,并称“和 RTX 3090 公版非常像”。平板...
日期:09-09
没有任何产品展示,OPPO德国官网已近乎清空
由于诺基亚提起专利诉讼,自去年以来 OPPO 在德国的手机销售就已经暂停,现在该公司在德国的官方网站也空空如也,没有任何产品的展示。网站首页只有一个广告,宣传 OPPO 与欧洲冠军...
日期:09-28
Pixel 7系智能机的面容解锁体验 还是不如苹果Face ID那样无缝「苹果7s有面部解锁吗」
周四的时候,Google 正式推出了 Pixel 7 系智能机,证实了外界的所有爆料。不过在带来了预期中的规格、功能和定价策略的同时,人们又开始担心 Pixel 7 / 7 Pro 的面容解锁体验、...
日期:10-10
ddr4 4800评测_DDR5-4800 内存跑分曝光:相比 DDR4 速度略慢,但延迟更低
  8 月 15 日消息 目前已有多家内存条品牌宣布推出 DDR5 内存,这也预示着英特尔第 12 代酷睿处理器预计将正式发布。关于全新规格内存的性能,根据外媒 tomshardware 消息,今...
日期:07-17
小红书否认将赴港上市:目前暂无上市计划_暂停赴美上市,小红书还能红多久
12月25日 消息:近日,有消息称小红书将在明年下半年启动香港IPO,并已经实现规模化盈利。特斯拉新款手机小红书对此进行了否认,表示公司目前暂无上市计划。小红书是一个生活方式...
日期:12-25
百度地图“发热门诊地图” 再升级  现已覆盖全国200余个重点城市!
  2020年大年初二,新一年里“云拜年”的第二天,新型冠状病毒感染所致肺炎的疫情继续牵动全国人的心。在全国各地的迅速响应下,一场与病毒的斗争已全面展开。医护人员“逆行...
日期:06-24
手机蓝牙耳机连接不上怎么办「手机蓝牙」
随着现代通信技术的不断发展,技术是一项极为重要的应用之一。技术是一种无线通信技术,它通过短距离无线传输数据,使用频带为2.4GHz。它的应用领域非常广泛,如数码相机、无线耳机...
日期:05-29
红旗H5销量连续4月上升 事实证明:除了实力 优惠力度同样重要
快科技7月17日消息,我们从懂车帝最新的销量排行榜了解到,红旗H9在六月竟交出了一份9873量的成绩单,而我们根据前几月的销量可以看到,这已经是连续第四个月实现销量上升了。由此...
日期:07-17
华为首批通过中国信通院边缘AI技术能力评估「华为ief平台 边缘计算」
在数字化转型浪潮之下,5G、边缘计算等技术的快速发展推动计算向边缘侧下沉。与此同时,算法、算力等方面的技术进步推动边缘AI技术迅猛发展,并在工业、交通、园区、医疗等领域得...
日期:07-11
国内用户行动真实!多款降价iPhone现货被抢空:优惠大到要剁手 苹果正补货
10月31日晚8点11.11正式开启,消费者开启剁手”模式,部分热门产品出现卖断货情况。晚8点一过,降价后的iPhone、AirPods Pro 2、iPad Air 5等多款产品现货均出现抢空”现象。电商...
日期:11-02
抖音修订《【鲜花园艺】行业管理规范》 增加农药准入资质要求
10月14日 消息:13日,抖音发布关于修订《【鲜花园艺】行业管理规范》的意见征集通知,征集期为2022年10月13日—2022年10月20日。修订后的规则更新了入驻要求中的定向准入类目明...
日期:10-15
“雪糕刺客”后半场,钟薛高们怎么走?_钟薛高 雪糕中的
  作者;|;刘艺晨;编辑;|;潘心怡   来源:36氪   极热天气持续数日,“雪糕刺客”被列入互联网通缉令,如何避开那些外表平平无奇、价格刺痛人的雪糕,成为今夏最热门的话题之...
日期:08-05
瑞星安全软件_瑞星安全助手国庆版发布 首家支持windows8
  日前,瑞星安全助手国庆版发布,以帮助用户应对种类繁多的病毒和木马。“此次发布的瑞星安全助手在技术上有更多突破,除了新增加的云查杀之外,还新增加了对Windows8系统的支...
日期:07-23
Llama2等30+模型接入千帆大模型平台,推理成本降50%!还有超全Prompt模板开放体验
声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:鱼羊 栗子 ,授权转载发布。最强开源大模型Llama2,性能更进一步~7B、13B、70B三个版本全都有,均可以直接调用部署。你可能想不...
日期:08-07
MagicPost:利用AI打造更好的求职帖子
11月3日 消息:MagicPost是一款基于人工智能的应用程序,旨在帮助LinkedIn用户创造更好的帖子。该应用程序利用AI技术对已发布的帖子进行分析,评估其受欢迎程度,并提供建议和编辑...
日期:11-03
元宇宙社交:「宇宙」内还没微信群人多_年轻人社交元宇宙
“元宇宙是个筐,未来往里装”。火热的元宇宙,在其众多核心要素中,社交的属性似乎最易融入,也被视为短期内最好切入元宇宙的入口。因此,我们看到,越来越多的互联网公司从社交大潮中...
日期:08-01
荣耀70双十一2199元 限购1台_荣耀30双十一价格
荣耀70手机在今年双11的促销力度非常大,原价2699元的手机现在双11旗舰有着立减500的降价幅度,随后价格干到了2199元,在2000元档位中摄像头的配置是非常高的,8+256G仍然立减500元...
日期:11-08
腾讯两个月推七款社交App
  (原标题:,频推新品扩展社交版图)   11月以来,腾讯在社交赛道上动作频频,先后推出了七款社交类APP,包括猫呼、轻聊、回音、有记、朋友、欢遇和灯遇交友;既有针对熟人或者陌...
日期:10-14
无代码AI图像生成和分析工作流平台ML Blocks 简单拖放即可创建工作流
2月4日 消息:ML Blocks是一款无代码AI图像生成和分析工作流平台,通过提供直观的拖放式界面,使用户能够轻松创建复杂的图像处理工作流,无需编写任何代码。产品入口:https://top....
日期:02-04
iba西门子「IBM携手西门子,助力企业实现高效、可持续的产品开发与运营」
北京2023年4月25日 /美通社/ -- 西门子数字化工业软件 (Siemens Digital Industries Software) 与 IBM近日宣布,共同打造一套集成了双方的系统工程、服务生命周期管理和资产...
日期:05-08