DeepMind prezentuje Veo 4 z przełomową funkcją Interactive Video Editing

DeepMind wprowadza Veo 4 z funkcją Interactive Video Editing, pozwalającą na edycję konkretnych elementów wideo AI w czasie rzeczywistym poprzez prompty tekstowe, bez konieczności regenerowania całego materiału.
#image_title

13 lutego 2026 roku DeepMind, należące do Alphabet, zaprezentowało kolejną generację swojego generatora wideo AI — Veo 4, który wprowadza rewolucyjną funkcję Interactive Video Editing. To pierwszy system na rynku umożliwiający edycję konkretnych elementów już wygenerowanej sceny wideo za pomocą prostych poleceń tekstowych, bez konieczności regenerowania całego materiału od podstaw.

Przełom w precyzyjnej edycji wideo AI

Nowa funkcja Interactive Video Editing w Veo 4 pozwala użytkownikom na modyfikację wybranych fragmentów wygenerowanego wideo w czasie rzeczywistym. Dzięki zaawansowanym algorytmom uczenia maszynowego, system potrafi rozpoznać konkretne obiekty, postacie czy elementy tła i zmieniać je zgodnie z nowymi instrukcjami tekstowymi, zachowując przy tym spójność całej sceny i naturalność ruchu.

Technologia działa poprzez segmentację przestrzenno-czasową, która identyfikuje poszczególne elementy w każdej klatce wideo i śledzi je w czasie. Użytkownik może na przykład zmienić kolor samochodu jadącego przez ulicę, dodać deszcz do słonecznej sceny czy zmodyfikować strój postaci, wydając proste polecenie tekstowe typu „zmień niebieski samochód na czerwony” lub „dodaj okulary do mężczyzny w kapeluszu”.

Znaczące ulepszenia względem poprzedników

Veo 4 oferuje znaczące usprawnienia w porównaniu do wcześniejszych wersji. Nowy model generuje wideo w rozdzielczości do 4K przy 60 klatkach na sekundę, z możliwością tworzenia sekwencji trwających nawet 2 minuty. Jakość wizualna została poprawiona dzięki wykorzystaniu nowej architektury transformer-based, która lepiej radzi sobie z detalami i konsystencją temporal w długich sekwencjach.

Funkcja Interactive Video Editing zmienia sposób, w jaki myślimy o tworzeniu treści wideo. Zamiast zaczynać od nowa przy każdej zmianie, twórcy mogą teraz iterować i doskonalić swoje wizje w czasie rzeczywistym — powiedział Demis Hassabis, CEO DeepMind.

System został przetestowany na korpusie ponad 100 milionów godzin materiału wideo i może rozpoznać ponad 10 tysięcy różnych kategorii obiektów. DeepMind twierdzi, że dokładność edycji sięga 94% dla prostych modyfikacji kolorystycznych i 87% dla bardziej złożonych zmian strukturalnych.

Wpływ na branżę kreatywną i dostępność

Wprowadzenie Veo 4 z Interactive Video Editing może znacząco wpłynąć na branżę kreatywną, szczególnie na produkcję treści marketingowych, edukacyjnych i rozrywkowych. Narzędzie znacznie skraca czas potrzebny na iteracje twórcze, co może obniżyć koszty produkcji wideo nawet o 70% według wstępnych analiz firmy.

DeepMind planuje udostępnić Veo 4 w modelu subskrypcyjnym począwszy od marca 2026 roku. Podstawowy plan będzie kosztować 299 dolarów miesięcznie i pozwoli na generowanie do 100 minut wideo miesięcznie z funkcją Interactive Video Editing. Plan profesjonalny za 899 dolarów miesięcznie będzie oferować nielimitowane generowanie oraz dostęp do zaawansowanych funkcji edycji.

Firma zapowiedziała również integrację z popularnymi narzędziami do montażu wideo, takimi jak Adobe Premiere Pro i DaVinci Resolve, co ma nastąpić w drugim kwartale 2026 roku. To posunięcie może przyspieszyć adopcję technologii wśród profesjonalnych twórców treści.

Qualcomm Snapdragon 9 Gen 1 AI z dedykowaną jednostką NPU 1000 TOPS — pierwszy mobilny chipset uruchamiający Gemini 3 Pro lokalnie

Prev

ByteDance przedstawia Seedream 5.0 z Dream-to-Reality Engine — przełomowa technologia przekształca sny w wideo

Next