观点：谷歌AI练习生写了首歌，网友听完心率都低了_

当前位置：首页 > 综合 > 正文

观点：谷歌AI练习生写了首歌，网友听完心率都低了

时间：2023-05-01 10:39:06 来源：量子位公众号

一段话整出一首歌，甚至是男女唱（跳）rap的那种。

男女说唱音频:00:0000:30

谷歌最新模型MusicLM一经推出就惊艳四座，不少网友惊呼:这是迄今听到最好的谱曲。

【资料图】

它可以根据文本生成任何类型的音乐，不管是根据时间、地点、年代等各种因素来调节，还是给故事情节、世界名画配乐、生成人声rap口哨，通通不在话下。

比如这幅《呐喊》（Scream）

在一段摘自百科的说明提示下，它生成了这样一段音乐。

（蒙克在一次幻觉经历中感受到并听到了整个自然界的尖叫声，它的灵感来源于此，描绘了一个惊慌失措的生物，既像尸体又让人联想到精子或胎儿，其轮廓与血红色天空的旋涡线条相呼应。）

ViT（Vision Transformer）作者在听过一段关键词含“平静舒缓”“长笛和吉他”的生成音乐后，表示自己真的平静下来。

也不免有同行表示，这对我来说比ChatGPT更值得关注，谷php歌几乎解决了音乐生成的问题。

毕竟MusicLM背靠280000小时音乐的训练数据库，事实上从现释出的Demjavascripto来看，MusicLM的能力还不止如此。

还可以5分钟即兴创作

可以看到，MusicLM最大的亮点莫过于就是根据丰富的文字描述来生成音乐，包括乐器、音乐风格、适用场景、节奏音调、是否包括人声（哼唱、口哨、合唱）等元素，以此来生成一段30秒的音乐。

即便说的只是那种说不清道不明的氛围，“迷失在太空”、“轻松而悠闲”;又或者是直接用在一些实用场景上，比如“街机游戏配乐”、给绘画配乐等。

除此之外，MusicLM具备长段音乐创作、故事模式、调节旋律等方面的能力。

在长段音乐方面，它能完成5分钟即兴创作，即便提示只有一个词。

比如仅在Swing（摇摆）的提示下，听着真就有种想马上下班去跳舞的冲动。(bushi)

而在故事模式中，不同的情标记甚至可以精确到秒的生成，哪怕情境之间完全没有任何联系……

更让人惊艳到的是，它还有很强的实用性功能。

一方面，它可以将旋律的提示结合进文本提示当中去，这样一来可以更精细地来调整音乐。有点改甲方爸爸需求那味了。

另一方面，它还能根据具体的乐器、地点、流派、年代、甚至是音乐家演奏水平等文本来生成。

背后生成模型MusicLM

但有一说一，AI生成音乐模型不在少数，谷歌自己此前也推出有类似的模型AudioLM。

此番MusicLM究竟有何不同?

据研究团队介绍，贡献主要有三个方面:

生成模型MusicLM。

把方法扩展到其他条件信号，如根据文本提示合成的旋律，并生成5分钟的demo。

发布了首个专门为文本-音乐生成任务评估数据集MusicCaps。

首先，MusicLM正是基于谷歌三个月前提出AudioLM模型的拓展。

AudioLM不需要转录或标记，只需收听音频，AudioLM就能生成和提示风格相符的连贯音乐，包括钢琴音或人声对话等复杂声音。

而最新的MusicLM，就是利用了AudioLM的多阶段自回归建模作为生成条件，且以此为基础进行拓展，使其可以通过文本提示来生成和修改音乐。

它是一个分层的序列到序列（Sequence-to-Sequence）模型，可以通过文本描述，以24kHz的频率生成音乐，并在几分钟内保持这个频率。

具体而言，研究团队使用了三个模型来用来预训练，包括自监督音频表征模型SoundStream，它可以以低比特率压缩一般音频，同时保持高重建质量。

还有语义标记模型w2vbERT，促进连贯生成;音频文本嵌入模型Mulan，它可以将音乐及其对应的文本描述投射到嵌入空间（以消除在训练时对文本的不同需求），并允许纯音频语料库上进行训练，以此来应对训练数据有限的难题。

训练过程中，他们从纯音频训练集中提取MuLan音频标记、语义标记和声学标记。

在语义建模阶段，他们用MuLan音频标记作为条件来预测语义标记。随后在声学建模阶段，又基于MuLan音频标记和语义标记来预测声学标记。

每个阶段都被建模为一个序列-序列任务，均使用单独解码器Transformer。

在推理过程中，他们使用从文本提示中计算出的MuLan文本标记作为调节信号，并使用SoundStream解码器将生成的音频标记转换成波形。

在280000个小时的训练后，MusicLM最终学会了保持24kHz的频率生成音乐，哪怕用来生成音乐的文本非常绕口。

类似“迷人的爵士歌曲与令人难忘的萨克斯独奏和独奏歌手”或“柏林90年代低音和强烈的电子乐”之类的。

研究团队还引入了一个高质量音乐数据集MusicCaps来解决任务缺乏评估数据的问题。

MusicCaps由专业人士共建，涵盖5500个音乐-文本对。研究团队公布了这个数据集，方便大伙进一步的研究。

这么一套操作下来，通过定量指标和人工评估，MusicLM在音频质量和文本契合度等方面都优于此前的音乐生成AI。

不过，谷歌研究团队说了:目前没有对外发布MusicLM的计划。

原因很简单，除了训练过程中难免出现的样本质量失真，最最关键的还有2点。

一来，尽管MusicLM在技术上可以生成合唱和声等人声，但是仔细听来，生成音乐的歌词，有的还勉勉强强听得出是音乐，有的根本就是无人能听懂的外星方言。

再者，研究团队发现系统生成的音乐中，约有1%直接从训练集的歌曲中复制——这已经足以阻止对外发布MusicLM了。

此外，还有批评者质疑，在受版权保护的音乐素材上训练AI模型到底合不合理。

不过团队在论文中介绍了下一步动向，主要关注歌词生成、改善提示文本准确性以及提高生成质量。

复杂音乐结构的建模也将成为团队的重点关注方向之一。

音频生成AI

这个研究的背后团队，是谷歌研究院。

共同一作Timo I. Denk，是谷歌瑞士的软件工程师，每天的工作就是利用ML进行音乐理解。

在这里多说两句，MusicLM的论文中，研究团队提到，MusicLM在质量和提示依从性方面都优于以前的系统。

“以前的系统”包括哪些?

一个是Mubert，已在github开源API，是一个text-to-music的AI，系列产品有根据既有标签生成音乐的Mubert Render、听歌软件Mubert Play等。

还有Riffusion，它建立在AI绘图的基础上，但将其应用于声音。

换句话说，Riffusion的工作原理是首先构建一个索引的频谱图集合，上面标记代表频谱图中捕获的音乐风格的关键字。

在频谱图主体上训练时，Riffusion就用Stable Diffusion的同一个方法——干预噪音，来获得与文本提示匹配的声波图像。

还有针对音乐制作人和音乐家的 AI 音频生成工具Dance Diffusion，OpenAI推出的可自动生成音乐的ML框架Jukebox……

要咱说，别成天盯着ChatGPT了，AIGC下一个风口万一是音乐生成呢?

参考链接:

[1]https://google-research.github.io/seanet/musiclm/examples/

[2]https://arxiv.org/pdf/2301.11325.pdf

[3]https://techcrunch.com/2023/01/27/google-created-an-ai-that-can-generate-music-from-text-descriptions-but-wont-release-it/

X 关闭

最新推荐

观点：谷歌AI练习生写了首歌，网友听完心率都低了

2023-05-01
今天白天到夜间局地有阵雨！河北最新天气预报、高速路况请查收→ 全球滚动

2023-05-01
“五一”假期第二天全国交通运输总体平稳有序焦点速讯

2023-05-01
浙江棋手丁立人加冕国际象棋诞生第一位中国棋王！_每日速读

2023-05-01
云南冬至吃什么传统食物(昆明冬至吃什么传统食物) 全球快报

2023-05-01
全球视点！索爱sr9蓝牙耳机怎么样_索爱蓝牙耳机怎么样

2023-05-01
赢了世界，却败给中国！世界首富携6万亿资产，无奈退出中国市场

2023-05-01
天天短讯！佩恩六道图片及名字佩恩六道图片

2023-04-30
“五一”小长假市民游客出游热情高涨，徐汇警方多措并举稳客流、保平安

2023-04-30
2021年几点几分入伏_2021年什么时候入伏今日热文

2023-04-30
神鬼世界boss图鉴_神鬼世界boss坐标|环球实时

2023-04-30
国海证券一季报营收净利增长，未来打造四大主线业务资讯推荐

2023-04-30
洛阳宜阳县检察院“宜检大课堂”对新进人员进行业务培训环球资讯

2023-04-30
慢性前列腺炎夏季病情变化多珠海男科医院天天精选

2023-04-30
北京青年任知了介绍_北京青年任知了介绍有什么_世界快消息

2023-04-30
芊渝芊寻双胞胎_芊寻今日播报

2023-04-30
5比2战胜爱沙尼亚队中国男冰获世锦赛甲级B组铜牌-世界速看

2023-04-30
焦点滚动:潮起上海乐享消费！2023国际消费季暨第四届上海“五五购物节”启动

2023-04-30
视点！陈茂波：消费券及“开心香港”活动助经济复苏

2023-04-30
射雕英雄传 94电视剧射雕英雄传94国语全集免费环球快资讯

2023-04-30
埃尔法为何不是丰田标埃尔法车标为什么不是丰田车标

2023-04-30
售价10.18-14.88万元比亚迪驱逐舰05冠军版上市-世界快看点

2023-04-30
刨冰怎么做_刨冰做法

2023-04-30
环球快资讯丨底部放量下跌是什么意思股价在低位成交量突然增加

2023-04-30
今日讯！让游客畅游山水

2023-04-30
胆管癌与结石的区别_胆管结石、胆管癌与肝吸虫-天天滚动

2023-04-30
山东淄博周村古商城旅游攻略快播报

2023-04-29
F1摩托艇排位赛，“郑”精彩！

2023-04-29
启灵火龙传奇什么时候出公测上线时间预告

2023-04-29
发行金额3亿元四川省首单绿色科创票据成功落地

2023-04-29
（体育）全民健身——滑旱雪度假期

2023-04-29
以高质量绿化助力高品质生活（记者手记）

2023-04-29
十大热门行业逐个看·银行篇丨年报季报稳健增长，各类银行大比拼_当前关注

2023-04-29
狄龙G2称老詹得40分才赢得尊重！美媒列湖人狂胜灰熊40分10大神迹

2023-04-29
今天是控卫吗？拉塞尔：看比赛给我什么我能成分卫也能成控卫

2023-04-29
视焦点讯！大明湖景区门票（大明湖景区）

2023-04-29
格力电器去年净利润增长6.26%，拟10派10元不及预期

2023-04-29
环球快讯:玉米油和葵花籽油哪个适合孩子（玉米油和葵花籽油哪个好）

2023-04-29
环球头条：走近夜色中的高铁“探路者” 致敬来自午夜时分的坚守

2023-04-29
“70后”厅官受审！5台点钞机连点现金5小时…_聚看点

2023-04-29
经济运行持续向好贵州一季度实现“开门稳”|天天热点评

2023-04-29
当前快播：c1驾驶证到期怎么更换

2023-04-29
天天微头条丨汉译法在线翻译免费（汉译韩）

2023-04-29
股票行情快报：北新建材（000786）4月28日主力资金净卖出2276.92万元

2023-04-29
烽火通信（600498）2023年一季报简析：营收净利润双双增长，应收账款高企-当前看点

2023-04-29
每日快播：帅哥被整蛊脱鞋_帅哥除魔师

2023-04-29
全球今亮点！补色剂鞋子_补色

2023-04-29
天天新资讯：今日电视剧古董局中老朝奉是谁_老朝奉是谁

2023-04-29
凤山县气象台更新暴雨红色预警信号【I级/特别严重】【2023-04-28】

2023-04-29
天天热资讯！奥翔药业2023年一季度净利同比增长32.45%

2023-04-28
激发创新活力专家学者共话知识产权与高质量发展

2023-04-28
深圳发力合成生物学领域超7亿建设研究大设施红杉中国等近200家机构投资此赛道

2023-04-28
全球短讯！红塔证券2023年乡村振兴帮扶及公益资金投入额度608万元

2023-04-28
环球播报:日媒：日本4月29日将解除新冠防疫入境检疫措施

2023-04-28
绵阳打捞手机多少钱║戒指掉入下水道看不到怎么掏出-天天观焦点

2023-04-28
获嘉县借势“中原农谷” 智慧冷链让小青菜身价倍增地方新闻

2023-04-28
当前观察：财政部拍板了！有2套以上房产的要注意，房产税或将开征？

2023-04-28
大连职业技术学院2022年云南省录取分数线

2023-04-28
当前速看：遥望科技龙虎榜数据（4月28日）

2023-04-28
[担保]金融街(000402):2023年度为全资子公司、控股子公司及参股公司债务融资提供担保-环球快看点

2023-04-28
购房焦虑症，已经缠上大学生

2023-04-28
天天快消息！民生银行济南天桥支行开展反赌反诈防范电信诈骗宣传活动

2023-04-28
十位艺术家联合百位青少年眼中的“猫”是什么样的这场巡展中有答案

2023-04-28
当前通讯！现代数据库索引设计与优化_关于现代数据库索引设计与优化介绍

2023-04-28
天天速递！百川畅银4月26日组织现场参观活动，深交所投服部、投资者等多家机构参与

2023-04-28
28个类型好看的动漫，刷到的整个暑假将不再迷茫。（下）

2023-04-28
中方支持塞科在安理会决议框架内通过对话解决科索沃问题

2023-04-28
【明日方舟同人】SS2.3、诗人之恋（2）

2023-04-28
微资讯！“五一”忘带身份证，可以这样解决！

2023-04-28
【全球聚看点】绿豆煮烂的简单办法是什么_绿豆煮烂的简单办法

2023-04-28
各个大长腿超短裙吸睛：淄博一群175美少女接送游客非官方行为

2023-04-28
厦门自贸片区强化政策叠加优势助力企业稳订单拓市场

2023-04-28
亿纬锂能：4月27日融资买入1.11亿元，融资融券余额32.85亿元

2023-04-28
今日最新！青岛红狮足球俱乐部落户青岛西海岸新区

2023-04-28
环球今头条！2023年山东各地二模考试时间汇总_持续更新中

2023-04-28
天天新消息丨快递业企稳回升印证市场回暖

2023-04-28
今日讯！红枣生姜红糖煮水喝有什么功效_生姜红枣红糖水什么时候喝最好

2023-04-28
全球今热点：晨会纪要

2023-04-28
世界观天下！五一假期临近节前我国“菜篮子”产品量足价稳

2023-04-28
baking soda是什么意思 soga是什么意思

2023-04-28
畅物流稳投资交通“大动脉”复苏强劲|每日信息

2023-04-28
晋商银行(02558)发布一季度业绩净利润4.91亿元

2023-04-28
五大险企一季度归母净利大增52%，中国人寿投资收益同比增18.8%

2023-04-28
顺丰控股：一季度营收610亿元

2023-04-28
黄山市通报一批化妆品类违法案件|当前热闻

2023-04-27
新区全国大学生创业大赛圆满落幕

2023-04-27
邮储银行武威市分行：金融活水精准滴灌助力“专精特新”企业焕发生机今日聚焦

2023-04-27
世界快播：万事达(MA.US)Q1营收、利润均超预期

2023-04-27
醴陵要跟“淄博烧烤”PK？炒粉还有“泰裤辣”_当前视讯

2023-04-27
南钢股份：间接控股股东上海复星高科技（集团）有限公司及其下属子公司（转让方）收到《民事起诉状》、《证据目录》等诉讼文件

2023-04-27
泰福泵业：下修事项尚需股东大会决议，具体信息请关注5月15日召开的2023年第一次临时股东大会

2023-04-27
环球通讯！微信铃声怎样修改_微信铃声怎么修改

2023-04-27
图片报：一些球员惊讶纳格尔斯曼的下课，高层误判球队会因此解脱|天天亮点

2023-04-27
冰川网络: 第四届董事会第十五次会议决议公告世界资讯

2023-04-27
环球微速讯：“桥就是树，树就是桥”：广东一座树长成的桥，构造奇特已300岁

2023-04-27
当前快看：信贷资产证券化信息登记质量评价方案发布：被列入限制名单业务暂停受理

2023-04-27
最新消息：和邦生物董秘回复：公司有接待机构调研，若有调研报告可网上查询

2023-04-27
中华鲟是哪个国家的特有物种_中华鲟怎么处理

2023-04-27
东山精密：公司电子电路板块的相关业务，正常一季度是淡季环球热议

2023-04-27
每日视讯：新兴装备（002933）4月27日主力资金净买入1250.10万元

2023-04-27

Copyright © 2015-2022 南非纸业网版权所有备案号：沪ICP备2022005074号-13 联系邮箱：58 55 97 3@qq.com