Wyobraź sobie, że siedzisz z przyjaciółmi. Wspominacie zabawną sytuację z wakacji, a ktoś mówi: „Hej, zróbmy z tego piosenkę!”. Zamiast szukać gitary lub godzinami majstrować w programie, sięgasz po telefon. Wpadasz na pomysł: „radosna pop-punkowa piosenka o tym, jak zgubiliśmy klucze w Barcelonie”. Wpisujesz to w aplikację i pół minuty później słuchacie gotowego utworu, z tekstem, wokalem i nawet okładką. Brzmi jak science fiction? Dzięki modelowi Lyria 3 w Gemini, to już rzeczywistość.
Google właśnie wprowadził do swojej aplikacji Gemini najnowszą, najbardziej zaawansowaną wersję generatywnego modelu muzycznego o nazwie Lyria. To nie jest kolejna prosta petarda do robienia rytmów. To potężne narzędzie, które na podstawie opisu tekstowego, przesłanego zdjęcia czy filmiku potrafi wyczarować 30-sekundowy, złożony muzycznie utwór. I to globalnie, w ramach beta, dla użytkowników powyżej 18. roku życia.
Co potrafi Lyria 3? Od opisu do piosenki w kilkanaście sekund
Sercem całej funkcji jest model Lyria 3, opracowany przez Google DeepMind. To ewolucja wcześniejszych wersji Lyrii, która przeskakuje kilka poziomów trudności. Przede wszystkim, całkowicie odcięła się od potrzeby podawania gotowego tekstu. To kluczowa zmiana.
Wcześniejsze modele często wymagały, aby użytkownik sam napisał lirykę, a AI tylko ją „zaśpiewała”. Lyria 3 robi to za nas. Analizuje nasz prompt – czy to „nostalgiczny afrobeat o wspomnieniach z rodzinnego domu”, czy „komediowy R&B slow jam o skarpetce szukającej swojej pary” – i sama tworzy spójne, dopasowane stylistycznie teksty.
Poza tym daje nam zaskakująco dużo kontroli. Nie chodzi tylko o wybór gatunku. Możemy dostosować styl wokalu, tempo, a nawet ogólny nastrój utworu. Efekt? Utwory są bardziej realistyczne i muzycznie złożone niż wszystko, co do tej pory oferowały podobne narzędzia. Google chwali się, że Lyria 3 rozumie już znacznie lepiej strukturę piosenki, dynamikę i aranżację.
Źródłem inspiracji może być wszystko. Tekstowy opis to oczywistość. Ale można też wgrać zdjęcie z wakacji lub krótki filmik. Model spróbuje odczytać atmosferę z wizualów i przełożyć ją na dźwięk. Chcesz utwór instrumentalny? Też nie ma problemu. Granice wyznacza głównie wyobraźnia użytkownika i… limit 30 sekund na jeden utwor.
Jak to działa w praktyce? Od Gemini po YouTube
Dostęp do tej magii jest prosty, o ile jesteśmy w grupie beta. W aplikacji Gemini (dawniej Assistant z Bardem) wystarczy wejść w menu „Narzędzia” > „Muzyka”. Tam otwiera się interfejs generowania. Proces jest interaktywny i odbywa się w czasie rzeczywistym – nie czekamy minuty na rendering, wynik pojawia się szybko.
Gotowy utwór można pobrać na urządzenie lub udostępnić linkiem. Na deser, za pomocą narzędzia o zabawnej nazwie Nano Banana, system automatycznie generuje też grafikę okładkową dla naszej miniaturowej kompozycji. Całość jest więc spakowana w estetyczny, gotowy do publikacji pakiecik.
Co ciekawe, Lyria 3 nie służy tylko rozrywce użytkowników Gemini. Jej moc wykorzystuje też YouTube w funkcji Dream Track dla Shorts. Twórcy mogą od teraz (nie tylko w USA) generować unikalne podkłady dźwiękowe do swoich krótkich form wideo, inspirując się nastrojem lub opisem. To bezpośrednia odpowiedź na potrzeby twórców, którzy szukają wolnych od roszczeń praw autorskich, oryginalnych ścieżek dźwiękowych.
Etyka, bezpieczeństwo i wielki znak zapytania o artystów
Tutaj dochodzimy do najciekawszej, a jednocześnie najbardziej newralgicznej kwestii. Generowanie muzyki przez AI budzi ogromne emocje, szczególnie w kontekście praw autorskich i naśladownictwa. Google zdaje się być tego świadome i od razu stawia grube kreski.
- Lyria 3 została zaprojektowana do oryginalnej ekspresji, a nie do naśladowania istniejących artystów.* Co to oznacza w praktyce? Jeśli wpiszesz w promptcie nazwisko ulubionego piosenkarza, model potraktuje to jako ogólną inspirację stylu czy nastroju. Nie będzie próbował podrobić jego charakterystycznego głosu ani stworzyć utworu, który mógłby zostać uznany za plagiat.
Każdy wygenerowany utwór jest sprawdzany pod kątem podobieństwa do istniejących treści w bazach danych. Poza tym, na wszelki wypadek, utwory są cyfrowo oznaczane jako stworzone przez AI. Co więcej, sam Gemini ma funkcję, która pozwala zweryfikować, czy przesłany przez kogoś plik audio został wygenerowany przez Lyrię.
Google podkreśla, że model był szkolony „z uwzględnieniem praw autorskich” i we współpracy z partnerami. Mimo to, beta ma swoje regulacje. Użytkownicy muszą przestrzegać zakazów tworzenia treści dyskryminacyjnych, dezinformacyjnych czy naruszających prywatność innych osób. Każdy utwór można też zgłosić, jeśli budzi wątpliwości.
Co dalej z muzyką z AI? Nie tylko 30-sekundowe piosenki
Globalne beta testy Lyrii 3 w Gemini właśnie się rozpoczęły. Na razie nie ma informacji o cenach (czy usługa pozostanie darmowa) ani o dokładnych harmonogramach rozwoju. Limit 30 sekund sugeruje, że Google traktuje to na razie jako potężną funkcję do zabawy, ekspresji i wspomagania krótkich form, a nie jako profesjonalne studio nagraniowe w kieszeni.
To może się zmienić. Sama ewolucja od modelu wymagającego tekstu do tak autonomicznego kreatora pokazuje, jak szybko rozwija się ta technologia. Wysoka jakość dźwięku, kontrola nad parametrami i integracja z ekosystemem YouTuba wskazują na poważne ambicje.
Czy takie narzędzia zastąpią artystów? Raczej nie. Ale mogą stać się dla nich nowym instrumentem, źródłem inspiracji lub sposobem na szybkie szkicowanie pomysłów. Dla milionów zwykłych ludzi to po prostu demokratyzacja radości z tworzenia muzyki. Nie musisz znać nut, mieć słuchu czy drogiego sprzętu. Wystarczy pomysł, kilka słów opisu i chęć do eksperymentowania.
Podsumowanie
Wejście Lyrii 3 do aplikacji Gemini to nie jest zwykły update. To postawienie kolejnego, dużego kroku w kierunku przyszłości, w której kreatywność jest wspomagana przez inteligencję na każdym poziomie. Zamiast martwić się o techniczne aspekty kompozycji, użytkownik może skupić się na tym, co najważniejsze: na emocji, historii czy nastroju, który chce przekazać.
Ograniczenia są – 30 sekund, ryzyko nadużyć, niepewność co do modelu biznesowego. Ale potencjał jest ogromny. Od pamiątkowych piosenek na podstawie zdjęć z wesela, przez unikalne podkłady dla twórców internetowych, po po prostu świetną zabawę w gronie przyjaciół. Lyria 3 nie napisze za nas symfonii, ale już teraz pokazuje, że granica między pomysłem w głowie a gotowym utworem w głośnikach staje się cieńsza niż kiedykolwiek. I to właśnie w tym leży jej największa siła.


Dodaj komentarz