Технологию назвали революцией для музыкальной индустрии
Компания Nvidia представила новую генеративную ШИ-модель под названием Fugatto (сокращение от Foundational Generative Audio Transformer Opus 1), которую уже окрестили "швейцарским ножом для звука". Эта технология может не только создавать уникальные звуковые эффекты, но и трансформировать существующие звуки с помощью текстовых подсказок, сообщает "Дивогляд" со ссылкой на The Verge.
Fugatto способна генерировать совершенно новые звуки, которых раньше не существовало. Например, она может создать звук "мяукающей трубы" или превратить мелодию фортепиано в вокальный трек. Демонстрация этих возможностей была показана на видео, ставшем настоящей сенсацией среди аудиоспециалистов.
Особенностью этой модели является ее способность выполнять задачи, не являющиеся частью начального обучения. Например, Fugatto может выделять вещание из аудиозаписи и изменять ее характеристики, такие как тональность, акцент или эмоциональная окраска. Кроме того, она способна создавать изменяющиеся со временем звуки, например шум дождя, который постепенно перемещается по разным поверхностям.
Менеджер по прикладным аудиоисследованиям Nvidia Рафаэль Валле назвал Fugatto революцией для музыкальной индустрии, сравнив ее значение с синтезатором, который 50 лет назад стал прорывом в мире музыки. Однако, несмотря на большой потенциал, компания пока не спешит открывать доступ к технологии для широкой общественности.
Как отмечают в Nvidia, генеративные ШИ модели всегда несут определенные риски. Например, их могут использовать для создания контента, нарушающего авторские права или противоречащего этическим и правовым нормам.
Ранее "Дивогляд" рассказывал, что пара роботов поссорились из-за неудавшегося анекдота.
Пока на нашей земле война, даже "Дивогляд" – это не о котиках и пандочках, а о победах нашего войска! Наш Telegram – Дивогляд 5.UA.