发布日期:2025-05-06 14:12 点击次数:74
英伟达(NVDA.US)推出了一款用于生成音乐和音频的新式东谈主工智能(AI)模子,旨在为制作音乐、电影和视频游戏的东谈主们提供做事。
字据英伟达的说法,这款模子名为Fugatto(Foundational Generative Audio Transformer Opus),不错使用任何文本和音频文献来生成或修改音乐和声息。
举例,该模子不错字据文本辅导创建音乐片断,从现存歌曲中删除或添加乐器,改造声息中的口音或心思,以致发出从未听过的声息。
英伟达诈欺音频研讨司理、管弦乐队指点兼作曲家Rafael Valle示意:“咱们但愿创建一个能像东谈主类同样相识和产生声息的模子。”
英伟达指出,告白代理商不错使用Fugatto快速定位多个地区的现存告白,并在配音中加入不同的口音和心机。此外,视频游戏开采者不错使用东谈主工智能模子修改游戏中事前录制的钞票,以适诈欺户在玩游戏时不休变化的四肢。
Fugatto不错使小号发出狗吠声或萨克斯管发出喵喵声。该公司补充说,通过微长入极少的传颂数据,研讨东谈主员发现它不错解决未经事前磨真金不怕火的任务,比如从文本中生成高质地的歌声。
英伟达示意,Fugatto的无缺版块使用了25亿个参数,并在包含32个Nvidia H100 Tensor Core GPU的Nvidia DGX系统上进行了磨真金不怕火。该模子的合座责任耗时一年多。
Fugatto可能会与Runway等初创公司以及 Meta Platforms(META.US)等大公司的雷同工夫伸开竞争。10月,Meta 发布了名为Movie Gen的东谈主工智能模子,该模子不错字据用户辅导创建传神的视频和音频编订。
本年 2 月,ChatGPT制造商OpenAI推出了Sora,它不错字据文本指示创建传神且裕如思象力的场景。这家由微软(MSFT.US)赈济的公司尚未向公众发布文本转视频模子。
包袱编订:于健 SF069世博体育app下载