您的位置:首页 > 互联网

开源音频模型Stable Audio Open,文本生成47秒高清音效_音频开发

发布时间:2024-06-06 11:06:59  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

6月6日,著名开源大模型平台Stability.ai在官网宣布,开源最新文生音频模型Stable Audio Open。

音频开发

用户通过文本就能生成最多47秒,钢琴、笛子、鼓点、模拟人声等不同类型的44.1kHz音效。

值得一提的是,Stable Audio Open支持数据微调,歌手、音乐人可以让其生成基于自己的音乐数据,例如,架子鼓手可以根据自己的鼓点来进行微调。

山村米姑娘炒饭怎么样

开源地址:https://huggingface.co/stabilityai/stable-audio-open-1.0

iphone125g版有京东方屏幕吗

在线demo:https://huggingface.co/spaces/artificialguybr/Stable-Audio-Open-Zero

根据Stability.ai介绍,Stable Audio Open使用了486,492个录音训练数据,其中472,618个来自Freesound,13874个来自免费音乐档案馆,并且所有音频文件均根据 CC0、CC BY或CC Sampling+获得了商业许可。

水钻打孔和普通打孔的区别

开源音频格式

就是说通过Stable Audio Open生成的音效无需担心商业化问题,不会受到法律方面的追究。

AIGC开放社区根据其提供的在线demo体验了一下,在文本语义理解、生成音效等方面还是相当优秀。

需要注意的是,目前只支持英文提示词,其他任何语言都不行,即便你使用了识别效果也是相当的差。

在生成的过程中,用户可以对时间、扩散步数和CFG进行详细控制,以达到更好的效果。例如,一首非常舒适抒情的钢琴曲。

steam deck可以玩吃鸡吗

音频播放模块开发

此外,Stable Audio Open目前只能用于学术研究,还无法商业化。


返回网站首页

本文评论
NVIDIA驱动背锅:新版本导致Adobe PR与AE异常崩溃_pr安装nvidia驱动程序
近一段时间,有部分使用NVIDIA的用户发现,自己在使用PR或AE时,会出现不正常的软件崩溃,对常规视频剪辑与后期工作造成了影响。对此,Adobe在官网发布公告,称NVIDIA最新的531.18和531...
日期:03-14
形似保时捷Taycan:小米首车SU7正式申报!_小米造车车型
快科技11月15日消息,终于,小米造车首款产品正式亮相了。在工信部最新一批次的汽车申报名录中,小米首车SU7位列其中,其定位于纯电轿跑,车身尺寸为4997*1963*1455毫米,轴距3000毫米...
日期:11-16
理想汽车:未发行任何数字货币、数字藏品NFT
7 月 22日讯:理想汽车发布了反诈声明称,未向社会公众发行任何数字货币、数字藏品(NFT) ,也未授权任何第三方发行任何数字货币、数字藏品(NFT)。电商助力精准脱贫诺基亚n1与ipa...
日期:08-01
百度助力长春政务服务改革 高效信息传递帮助群众“最多跑一次”
9月26日,由中国城市和小城镇改革发展中心、百度知道、熊掌号、长春市人民政府联合主办的“便......
日期:09-26
中国移动陶涛:构建大数据湖仓一体生态,促进数据要素价值发挥
通信世界网消息(CWW)2023年7月4日至5日,由中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)主办的2023可信数据库发展大会在北京国际会议中心召开。中国移动信息技术中心...
日期:07-07
诺贝尔文学奖2020获奖作品「2022年诺贝尔文学奖公布:法国女作家安妮·埃尔诺获得1000万奖金」
10月以来,2022年的诺贝尔奖陆续公布,生理或医学奖、物理学奖之前已经公布,今天晚上文学奖也公布了,瑞典文学院在斯德哥尔摩宣布,将2022年诺贝尔文学奖授予法国作家安妮埃尔诺(Anni...
日期:10-12
Suno推出生成式音频AI基础模型 输入文本即可生成30秒音乐「生成音频软件」
8月10日 消息:最近,科技公司Suno推出了一款生成式音频AI基础模型,用户只需简单的文本输入,就可以生成两段约30秒带有歌词的音乐。这个玩法跟之前的Midjourney很相似,在Suno的Dis...
日期:08-10
3.36GHz超频版第二代骁龙8由台积电代工:不是三星
此前有爆料称Galaxy S23系列搭载的第二代骁龙8由三星代工。对此,Phone Arena发文指出,三星Galaxy S23系列搭载的第二代骁龙8芯片仍然由台积电代工,不是三星。这颗芯片由高通为...
日期:01-22
2023 年人工智能改变互联网的 5 种方式_人工智能互联网时代
12 月 13 日消息:尽管难以置信,但 ChatGPT 才推出仅有一年的历史。自从 OpenAI 在 2022 年 11 月首次发布 ChatGPT 以来,它迅速成为有史以来增长最快的应用程序,引发了谷歌的恐...
日期:12-14
报告:新加坡员工是全球最快采用人工智能技能的人群「新加坡人工智能专业排名」
本文概要:1. 新加坡是全球人工智能技能采用率最高的国家,超过了全球平均水平。2. 在2022年,人们最迅速增加的人工智能相关技能是提示生成式人工智能的出现。3. 随着人工智能的...
日期:08-22
快手StreamLake:已构建大算力基础设施体系,应对视频和大模型挑战
8月25日消息,昨日,快手异构计算负责人刘凌志对外透露了快手SL200芯片的最新进展,“在AI大模型进入AGI时代的过程中,快手紧跟大模型应用浪潮,在搜广推场景、内容创作、提高研发效...
日期:08-25
如果iPhone配上了手写笔,真的会违和吗「iPhone可以用笔吗」
声明:本文来自于微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,授权转载发布。如果你是一位忠实的苹果粉丝,那么可能还记得,在初代iPhone的新品发布会上,乔布斯曾经有这样一段...
日期:11-28
世纪华通脑科学研究成果持续落地 数药智能孤独症训练好帮手《AI星河》问世
继本月数药智能自主研发的专数达®《注意力强化训练软件》成功启动商业化进程之后,另一款孤独症康复训练软件《AI星河》也正式问世,进一步扩展了公司的产品线,以满足不断增长的...
日期:01-19
红米note 11 pro价格「红米Note 11T Pro 512GB即将登场!或碾压K系列」
中关村在线消息:9月29日,据红米官方爆料,红米Note11T Pro的512GB大内存版本即将登场,新机硬件与现款保持不变,但内存实现了大幅提升。大内存版红米Note11T Pro将在9月30日晚上8点...
日期:09-30
通义千问官网体验入口 AI智能聊天大模型软件app免费下载地址
《通义千问》是一个专门响应人类指令的大模型。它具有强大的语义理解和语言生成能力,能够回答各种问题、提供实用信息、帮助解决问题。这款产品以其高准确性、快速响应、支持...
日期:12-05
李彦宏人工智能「李彦宏:算力可以买来,创新能力需要自建」
5月4日,李彦宏今日在百度内部表示,算力不能保证能够在通用人工智能技术上领先,算力是可以买来的,创新的能力是买不来的,是需要自建的。李彦宏谈到,百度对创新的执着是一贯的,对于技...
日期:05-04
XREAL双11实现7倍增长 AR眼镜销量突破11000台
11月12日消息,2023年双11大促节落下帷幕,全球领先的消费级AR眼镜品牌——XREAL率先对外公布了双11成绩单。根据官方战报,本次双11期间,XREAL在京东和天猫双平台全 网GMV突破4000...
日期:11-13
支付宝搭建“健康防疫”专区  提供互联网医院在线问诊、多平台线上购药等便民服务
12月19日 消息:防控优化措施“新十条”出台以来,各地陆续主动开通互联网医院,提供在线问诊或复诊开方等服务,多个线上购药平台也在尽力保障药品供应及配送。为了减少服务分散问...
日期:12-19
恒驰汽车累计被执行超1亿元 研究院曾同一天5次成老赖_恒驰汽车企查查
近段时间,恒达汽车因为员工停工留职”,以及被曝团队解散一事,再次来到舆论的风口浪尖上。而恒大集团的债务危机当前仍未解决,恒大汽车也被卷入其中。天眼查App显示,近日,恒驰汽车...
日期:12-06
WDCC 2022世界设计之都大会开启元宇宙分会场
要加快推进世界知名“设计之都”建设,打造国际国内原创设计的首 发地,优 秀设计的产业转化高地,构建多元共赢的创意设计生态圈。——《上海市国民经济和社会发展第十四个五年规...
日期:09-16