Zastosowanie i możliwości, jakie oferują wszelkiego rodzaju modele językowe w zakresie tworzenia treści, są naprawdę całkiem spore. Dość powiedzieć, że nawet tak powszechny ChatGPT okazuje się szalenie przydatnym narzędziem dla osób, które potrzebują skorzystać z pomocy przy tzw. blokadzie kreatywnej.
Całkiem dużą popularnością wśród fanów muzyki cieszy się także SunoAI, czyli narzędzie do kreowania własnych utworów na bazie tekstów i odpowiednich promptów. Twórczość tworzona w tym narzędziu zdaje się czasem nie mieć limitów, co w zasadzie bardzo cieszy, zwłaszcza tych, którzy nie boją się takich eksperymentów.
Właśnie dla takich osób stworzone zostało nowe narzędzie, które tym razem opracowała NVIDIA. Czym jest Fugatto? Jakie ma możliwości?
Fugatto, czyli narzędzie do tworzenia dźwięków
Fugatto (od angielskiego Foundational Generative Audio Transformer Opus 1) to opracowany przez inżynierów NVIDII zaawansowany model GenAI, który pozwala manipulować dźwiękiem za pomocą komend tekstowych. Może tworzyć muzykę, podmieniać głosy, dodawać efekty i tworzyć zupełnie unikalne dźwięki. Fugatto obsługuje wiele zadań jednocześnie i łączy różne instrukcje jak akcent czy emocje w głosie.
Imponować może także rozmach, z jakim stworzony został ów model. Mowa bowiem o liczbie 2,5 miliarda parametrów, które są przez Fugatto wykorzystywane na swoje potrzeby. Oczywiście wszystko to napędzane jest przez technologie NVIDIA, a całość została stworzona i opracowana przez zespół z różnych krajów. Dzięki nowatorskim funkcjom Fugatto pozwala użytkownikom na eksperymenty artystyczne w niespotykanej dotąd skali.
Nie dziwi więc fakt, że inżynierowie określili swój model „szwajcarskim scyzorykiem” do dźwięku. Możliwości są bowiem ogromne, bo i na ogromie danych ów technologia była szkolona. Do dyspozycji była m.in. biblioteka dźwięków BBC, co zapewnia dostęp do ogromu materiału źródłowego, który faktycznie robi wrażenie.
Ogromne możliwości
Do czego jednak można będzie wykorzystać Fugatto? Ano można przytoczyć przykład producentów muzycznych, którzy na podstawie promptów będą w stanie stworzyć „szkic” utworu. Będą też mogli w wygodny sposób dodawać efekty lub próbować dostosować różne style, instrumenty czy efekty za pomocą kilku komend.
Nasz dzisiejszy bohater będzie też w stanie poprawiać ogólną jakość istniejących ścieżek lub pozwalać na izolację poszczególnych instrumentów. Możliwości jest więc cała masa i nie ograniczają się one tylko i wyłącznie do przemysłu muzycznego.
Jak zostało ustalone Fugatto operuje też na dźwiękach, a to może pozwolić twórcom gier na dostosowanie dźwięków do dynamicznej sytuacji. To zaś może przekładać się na większą indywidualność dla każdego gracza, który w zależności od sytuacji będzie słyszał inne dźwięki lub inaczej nagłośnione dialogi.
Podobnie jest w przypadku marketingu, gdzie model ten jest w stanie dostosować udźwiękowienie i akcent lektora do konkretnego regionu. To zaś jest wielkim uproszczeniem dla wszystkich, którzy zamierzają w przyszłości zajmować się tworzeniem kampanii reklamowych i docieraniem do odbiorców z całego świata.
Kiedy Fugatto trafi do powszechnego użytku?
Zdaniem inżynierów, którzy stoją za Fugatto wchodzimy w nową erę tworzenia muzyki i dźwięku, gdzie AI będzie naszym najlepszym asystentem. Co ciekawe, entuzjazm ten podziela znany producent Ido Zmishlany.
Faktycznie w tym przypadku jedyną barierą wydawać się może nasza własna kreatywność. Ciekawe tylko, jak model od NVIDII poradzi sobie w konfrontacji z ogromem zainteresowanych użytkowników.
Na razie jednak NVIDIA nie ujawniła, kiedy możemy spodziewać się wydania Fugatto i udostępnienia go szerszej grupie odbiorców. Na razie pozostaje czekać i liczyć, że nastąpi to prędzej niż później.