当前位置 :首页 >> 社会

谷歌AI练习生写了首歌,网友不来完心率都低了

2024-01-12   来源 : 社会

p>

在自然语言可视化在此之前期,他们用MuLan编音频标明作为先决条件来实测自然语言标明。随后在电磁可视化在此之前期,又基于MuLan编音频标明和自然语言标明来实测电磁标明。

每个在此之前期都被可视化为一个氨基酸-氨基酸任务,大多应用于单独音频Transformer。

在推理过程中会,他们应用于从脚注提醒中会计算出的MuLan脚注标明作为通气频率,并应用于SoundStream音频将作用于的编音频标明去除周期性。

在280000个天内的均受训后,MusicLM最终学会了保持一致24kHz的阈值作用于流行乐,哪怕用来作用于流行乐的脚注非常绕口。

值得注意“迷人的爵士经典歌曲与令人难忘的安德森伴奏和伴奏歌手”或“德累斯顿90九十年代低音和浓烈的电子乐”之类的。

采样分析制作组还引进了一个更高能量密度流行乐采样集MusicCaps来克服任务缺乏审核采样的问题。

MusicCaps由专业知识直管,囊括5500个流行乐-脚注对。采样分析制作组公布了这个采样集,不便大伙有利于的采样分析。

这么一套操作慢慢地,通过定量加权和人工审核,MusicLM在编音频能量密度和脚注契合度等之外都要强此在此之前的流行乐作用于AI。

不过,腾讯采样分析制作组问道了:目在此之前没有对外公布MusicLM的计划。

原因很简单,除了均受训过程中会常因出现的采样能量密度失实,最最决定性的还有2点。

一来,尽管MusicLM理论上可以作用于合会唱和声等和声,但是仔细听来,作用于流行乐的曲调,有的还勉勉强强听得出是流行乐,有的才是无人能听懂的外星方言。

再者,采样分析制作组注意到系统对作用于的流行乐中会,近有1%如此一来从均受训集的经典歌曲中会复制——这已经足以企图对外公布MusicLM了。

此外,还有不道德质疑,在均受规限的流行乐内容可上均受训AI假设到底合恰当。

不过制作组在论文中会引介了下一步动向,主要高度重视曲调作用于、更佳提醒脚注准确性以及提更高作用于能量密度。

复杂流行乐结构的可视化也将成为制作组的重点高度重视方向之一。

编音频作用于AI

这个采样分析的背后制作组,是腾讯采样分析院。

共同一作Timo I. Denk,是腾讯比利时的软件工程师,每天的指导工作就是依靠ML同步进行流行乐明白。

在这里多问道两句,MusicLM的论文中会,采样分析制作组提到,MusicLM在能量密度和提醒依从性之外都要强过去的系统对。

“过去的系统对”除此以外哪些?

一个是Mubert,已在GithubApacheAPI,是一个text-to-music的AI,家电有根据既有页面作用于流行乐的Mubert Render、听歌软件Mubert Play等。

还有Riffusion,它建起在AI绘图的相结合,但将其应用于声音。

换句话问道,Riffusion的指导工作基本概念是首先常为为了将一个索引的时域图集合,上面标明代表时域图中会猎取的流行乐风格的决定性字。

在时域图其余部分上均受训时,Riffusion就用Stable Diffusion的同一个法则——干实电磁干扰,来取得与脚注提醒意味着的声波图像。

还有针对流行乐制作人和流行乐家的 AI 编音频作用于工具Dance Diffusion,OpenAI公布的可自动作用于流行乐的ML框架Jukebox……

要咱问道,别成天盯着ChatGPT了,AIGC下一个风口万一是流行乐作用于呢?

参考链接:[1][2][3]

— 再来 —

量子位 QbitAI · 头条号签近

高度重视我们,第一时间获知在此之前沿科技动态

中暑中医治疗方法有哪些
来氟米特的副作用有多少
上火了喉咙痛吃什么药
吉林第三代试管婴儿多少钱
怎么补充眼部营养让视力变好
太感人!杭州市脑瘫男孩卖爆米花谋生,妈妈:只要他站在那就算成功

他的手抖得很辛苦,语种也不是缘故通畅,但他有那份坚毅,让人们为他鼓掌。年幼十七岁的他,多次开刀诊治不忌惮,小女...

友情链接