Nvidia wprowadza na scenę nowe narzędzie o nazwie Fugatto, które według firmy może generować „dźwięki, jakich jeszcze nikt nie słyszał”. Wyobraź sobie trąbkę, która miałaby miauczeć – brzmi absurdalnie? To tylko próbka możliwości tego narzędzia. Fugatto pozwala tworzyć muzykę, dźwięki oraz mowę, korzystając z tekstowych lub audio wejść, które wcześniej nigdy nie były używane w jego treningu.
Na przykład, Fugatto potrafi stworzyć utwór na bazie zwariowanych poleceń, takich jak: „Zagraj na saksofonie, który najpierw wyje, potem szczeka, a na koniec przechodzi w elektroniczną muzykę z dodatkiem szczekających psów”. Jeśli brzmi to jak pomysł na imprezę tematyczną, Nvidia jest gotowa dostarczyć ścieżkę dźwiękową.
Jednym z przykładów podanych przez Nvidię jest opis dźwięku: „Głębokie, pulsujące basy z przerywanymi, wysokimi cyfrowymi ćwierkami – jakby obudziła się gigantyczna, myśląca maszyna”. Fugatto może także zmieniać głosy ludzi, dodając im inne akcenty, zmieniając ton na bardziej gniewny lub uspokajający. To narzędzie umożliwia również edycję muzyki – izolowanie wokali, dodawanie instrumentów czy całkowitą zmianę melodii, np. zastąpienie pianina śpiewem operowym.
Według Nvidii, Fugatto powstało dzięki połączeniu milionów próbek audio w jeden gigantyczny zbiór danych. Badacze opracowali także instrukcje, które pozwoliły modelowi na rozszerzenie swoich możliwości bez konieczności dodawania kolejnych danych. Wśród źródeł treningowych znalazła się m.in. biblioteka efektów dźwiękowych BBC.
Na rynku pojawia się coraz więcej narzędzi AI do tworzenia dźwięków – swoje propozycje mają już Stability AI, OpenAI, Google DeepMind, ElevenLabs czy Adobe. Jednak Nvidia stawia na coś, czego inni nie obiecują: dźwięki, które wykraczają poza dotychczasowe możliwości technologii. Tymczasem niektóre start-upy już mierzą się z pozwami dotyczącymi praw autorskich związanych z muzyką tworzoną przez AI. Co więcej, Nvidia i inne firmy były krytykowane za używanie napisów z YouTube’a jako danych treningowych.
Choć Nvidia nie zdradziła jeszcze, czy Fugatto będzie ogólnodostępne, to narzędzie już teraz wywołuje spore zamieszanie w branży. Czy stanie się nowym standardem dla twórców muzyki i dźwięków? Czas pokaże. A na razie – czy ktoś zamawia symfonię z miauczącymi trąbkami?