Jak tworzyć storyboardy filmowe w Veo 3 — poradnik krok po kroku
Tutorial: generuj spójne sekwencje wideo w 4K przez Veo 3. Konkretne prompty, kontrola kamery i porady od filmowców Google.
Veo 3 to najnowsza wersja generatora wideo od Google, która potrafi coś, czego konkurencja dopiero się uczy — tworzyć spójne sekwencje ujęć bez gubieniu kontekstu między klipami. Nie musisz już montować w Premierze dwudziestu osobnych generacji, modląc się żeby główna bohaterka wyglądała tak samo na każdym ujęciu. Veo 3 pamięta co wygenerował sekundę wcześniej i trzyma spójność wizualną przez całą scenę. W tym tutorialu pokażę jak skonfigurować narzędzie, jakie prompty działają najlepiej i jak sterować kamerą bez zgadywania.
Google udostępnił Veo 3 w AI Studio pod koniec 2024 roku, ale większość twórców nadal używa go jak prostego generatora — jeden prompt, jeden klip, koniec. Tracą przy tym 70% możliwości narzędzia. Veo 3 to nie Runway czy Kling, które świetnie radzą sobie z pojedynczymi ujęciami. To narzędzie do budowania całych sekwencji, gdzie każdy klip naturalnie przechodzi w następny. Filmowcy z Google Creators Program testowali Veo 3 przez cztery miesiące i wypracowali konkretne metodyki. Czas je w końcu pokazać po polsku.
Czego potrzebujesz żeby zacząć
Dostęp do Veo 3 dostajesz przez Google AI Studio — to główna platforma do eksperymentowania z modelami Google. Musisz mieć konto Google, najlepiej Workspace lub osobiste z włączonym dostępem do narzędzi AI. Veo 3 nie jest jeszcze ogólnodostępny jak Gemini w przeglądarce, więc jeśli nie widzisz opcji generowania wideo w AI Studio, dołącz do listy oczekujących przez formularz na stronie Google Labs. Zwykle trwa to tydzień, maksymalnie dwa.
Po dostępie potrzebujesz jeszcze dwóch rzeczy: jasnej wizji tego co chcesz stworzyć i gotowości do iteracji. Veo 3 nie wygeneruje perfekcyjnego storyboardu za pierwszym razem, ale trzecia-czwarta próba zazwyczaj trafia w punkt. Zaplanuj sobie dwie godziny na naukę interfejsu i pierwsze testy. Google udostępnia limit 50 generacji dziennie dla użytkowników podstawowych, 200 dla Workspace Premium. Wystarczy żeby nauczyć się podstaw i stworzyć pierwszą pełną sekwencję.
Protip ✅
Zanim zaczniesz generować w Veo 3, zapisz sobie listę ujęć w zwykłym notatniku. Każde ujęcie to osobna linia: „close-up twarzy”, „medium shot od pasa”, „wide shot cała postać w tle”. Veo 3 najlepiej pracuje, gdy wiesz dokładnie, czego oczekujesz od każdego klipu.
Konfiguracja pierwszego projektu
W AI Studio kliknij „Create New” i wybierz Veo 3 z listy dostępnych modeli. Interfejs wygląda podobnie do innych generatorów — pole tekstowe na prompt, suwaki z parametrami, preview po prawej. Kluczowa różnica to przycisk „Add to sequence” pod oknem generacji. To właśnie przez niego budujesz serię powiązanych ujęć zamiast generować losowe klipy.
Zacznij od ustawienia podstawowych parametrów dla całego projektu. Rozdzielczość ustaw na 4K, jeśli planujesz finalny eksport w wysokiej jakości, albo 1080p, jeśli to tylko roboczy storyboard. Veo 3 w 4K generuje klipy do 8 sekund, w 1080p do minuty, ale dla storyboardów najlepiej działają ujęcia 3-5 sekund. Krótkie, konkretne, z jednym jasnym ruchem lub zmianą kadru. Dłuższe klipy gubią dynamikę i Veo 3 zaczyna halucynować dodatkowe elementy.
Styl wizualny ustaw na początku i trzymaj się go przez całą sekwencję. Veo 3 ma predefiniowane style: Cinematic, Documentary, Animated, Photorealistic. Dla fikcyjnych storyboardów najlepiej działa Cinematic — dodaje depth of field, naturalne oświetlenie, lekką korekcję kolorystyczną w poście. Documentary sprawdza się do materiałów typu wywiad czy reportaż. Animated to jeszcze beta, ignoruj na razie.
Uwaga ⚠️
Nie zmieniaj stylu wizualnego w środku sekwencji. Veo 3 próbuje utrzymać spójność, ale przeskok z Cinematic na Photorealistic między ujęciami wygląda jak zmiana kamery w trakcie sceny. Zostań przy jednym stylu od początku do końca projektu.
Pierwszy prompt — od czego zacząć sekwencję
Dobre storyboardy zaczynają się od ujęcia ustalającego — wide shot, który pokazuje, gdzie jesteśmy, kto jest główną postacią, jaka jest pora dnia. Veo 3 potrzebuje tych informacji w pierwszym prompcie, bo będzie się do nich odwoływać w kolejnych ujęciach. Nie pisz noweli, ale daj kontekst. Zamiast „kobieta idzie ulicą” napisz „młoda kobieta w czerwonym płaszczu idzie pustą ulicą o zmierzchu, w tle sylwetki budynków, deszcz na asfalcie”.
Struktura promptu to trzy elementy: główny obiekt, akcja, otoczenie. W tej kolejności. Veo 3 najlepiej rozumie angielski, więc prompty piszemy po angielsku, ale nie komplikuj składni. Proste zdania, konkretne rzeczowniki, unikaj metafor. Model nie wie, co to „nostalgiczny klimat”, ale wie, co to „warm golden hour lighting” albo „soft focus background”.
young woman in red coat walking down empty street at dusk, city buildings silhouette in background, wet asphalt reflecting streetlights, cinematic wide shot, 4K
To podstawowy prompt ustalający. Generujesz, czekasz 20-30 sekund (Veo 3 w 4K lubi pomyśleć), dostajesz klip. Jeśli kobieta wygląda ok, tło pasuje, ruch jest naturalny — klikasz „Add to sequence”. Jeśli coś nie gra — edytujesz prompt i generujesz ponownie. Nie ma sensu budować dalszej sekwencji na koślawym pierwszym ujęciu.
Protip ✅
Dodaj „consistent character” na końcu promptu, jeśli planujesz serię ujęć z tą samą postacią. Veo 3 wtedy zapisuje charakterystyczne cechy (fryzura, ubranie, rysy) i próbuje je zachować w kolejnych generacjach. Nie jest idealne, ale poprawia spójność o jakieś 60%.
Kontrola ruchu kamery — jak sterować kadrem
Veo 3 pozwala kontrolować kamerę przez parametry w prompcie albo suwaki w interfejsie. Suwaki to szybsza opcja do testowania, ale prompty dają precyzyjniejszą kontrolę. Filmowcy z Google Creators polecają mieszankę — podstawowy ruch w prompcie, dostrajanie suwakami. Najważniejsze parametry to camera movement i motion intensity.
Camera movement ma pięć trybów: static, pan, tilt, dolly, orbit. Static to kamera w miejscu, postać się rusza. Pan to poziomy ruch kamery w lewo lub prawo. Tilt to pionowy ruch góra-dół. Dolly to najazd lub odjazd od obiektu. Orbit to ruch okrężny wokół postaci. Każdy tryb zmienia dramaturgię ujęcia — static daje spokój, dolly buduje napięcie, orbit pokazuje przestrzeń wokół bohatera.
close-up of young woman's face in red coat, rain drops on skin, camera slowly dollying in, shallow depth of field, emotional expression, 4K cinematic
To drugi klip w sekwencji — po ustalającym wide shot wchodzimy w close-up. Dolly in (najazd) buduje intymność, skupia na emocjach postaci. Veo 3 automatycznie pamięta, że bohaterka ma czerwony płaszcz i mokrą twarz od deszczu, więc nie musisz tego powtarzać. Ale „rain drops on skin” to detale, który wzmacnia spójność — pierwszy klip miał deszcz, drugi też go ma.
Motion intensity to suwak od 1 do 10. Niskie wartości (1-3) dają subtelny ruch, wysokie (7-10) to dynamika jak z filmu akcji. Dla storyboardów dramatycznych trzymaj się 3-5. Dla reklam czy muzycznych teledysków możesz jechać na 7-8, ale uważaj — Veo 3 powyżej 8 czasem przesadza i dostaniesz motion blur, który psuje czytelność kadru.
Protip ✅
Zmiana ruchu kamery między ujęciami to najprostszy sposób na budowanie dynamiki. Sekwencja static → pan → dolly → static tworzy naturalny rytm, który oko widza łatwo śledzi. Nie mieszaj orbit z dolly w dwóch kolejnych klipach — to za dużo ruchu naraz.
Budowanie sekwencji — jak łączyć ujęcia
Masz już dwa klipy w sekwencji: wide shot ustalający i close-up twarzy. Czas na trzeci — medium shot, który pokaże, co bohaterka robi. Veo 3 najlepiej pracuje, gdy kolejne ujęcia logicznie ze sobą łączą akcję. Jeśli w close-up kobieta patrzy w lewo, w medium shot powinna iść w tym kierunku albo patrzeć na coś po lewej stronie kadru.
medium shot of young woman in red coat opening old wooden door, hand on brass doorknob, camera static, warm light spilling from doorway, 4K cinematic
Trzecie ujęcie wprowadza nowy element — drzwi, światło z wnętrza. To natural transition point, miejsce, gdzie sekwencja może się rozgałęzić. Albo wchodzimy za bohaterką do środka (kolejny klip: interior shot), albo zostajemy na zewnątrz i patrzymy, jak znika w drzwiach (wide shot exterior). Veo 3 nie planuje za ciebie dramaturgii, ale jeśli dasz mu logiczny ciąg zdarzeń, podtrzyma spójność wizualną.
Kluczowa zasada: każdy nowy klip powinien dziedziczyć minimum jeden element z poprzedniego. Postać, lokację, oświetlenie, porę dnia. Jeśli przeskakujesz drastycznie — z deszczowej ulicy do słonecznego parku — Veo 3 zinterpretuje to jako dwie osobne sceny i przestanie trzymać spójność bohatera. Możesz to wykorzystać intencjonalnie do montażu równoległego, ale wtedy oznacz wyraźnie w promptach, że to inna lokacja lub czas.
Uwaga ⚠️
Veo 3 ma limit pamięci sekwencji — około 8-10 ujęć, zanim zaczyna zapominać szczegóły z pierwszych klipów. Jeśli budujesz dłuższy storyboard, podziel go na segmenty po 6-8 ujęć, eksportuj, zacznij nowy projekt. Później skleisz w montażu, ale każdy segment będzie wewnętrznie spójny.
Sterowanie oświetleniem i nastrojem
Veo 3 rozumie kinematograficzne terminy oświetleniowe lepiej niż konkurencja. Możesz pisać „golden hour”, „high key lighting”, „chiaroscuro”, „neon glow” i model wie dokładnie, co masz na myśli. To zmienia podejście do tworzenia nastroju — nie opisujesz emocji („smutna scena”), tylko narzędzia filmowe („low key lighting, cool blue tones, shadows on face”).
interior shot of young woman in red coat entering dimly lit room, single table lamp casting warm pool of light, hard shadows on walls, camera pan following her movement, 4K cinematic
Czwarte ujęcie — przechodzimy do wnętrza. Single table lamp to konkretne źródło światła, które Veo 3 umieści w kadrze i użyje do oświetlenia sceny. Hard shadows budują dramatyzm. Camera pan śledzi bohaterkę przez pokój — naturalny ruch, który łączy akcję z poprzedniego ujęcia (otwieranie drzwi) z ekspozycją nowej lokacji.
Kolorystyka też się liczy. Jeśli cała sekwencja ma cool tones (niebieskie, szare), nie wrzucaj nagle warm orange w środku. Chyba że dramaturgicznie to uzasadnione — np. bohaterka wychodzi z zimnego deszczu do ciepłego wnętrza. Veo 3 podchwytuje takie kontrasty i użyje ich jako storytellingowego akcentu.
close-up of woman's hands taking off wet coat, water dripping on wooden floor, shallow focus on droplets, warm ambient light, 4K cinematic detail shot
Piąte ujęcie — detail shot rąk i kaplącej wody. To typ ujęcia, który buduje immersję, daje widzowi czas na złapanie oddechu między większymi akcjami. Veo 3 świetnie radzi sobie z takimi inserts, bo nie musi śledzić całej postaci — tylko detal, ruch, teksturę.
Protip ✅
Dodaj jeden detail shot co 4-5 ujęć. Ręce na klamce, krople na szybie, stopy na schodach. To oddechy w montażu, które dają sekwencji rytm i pomagają Veo 3 zresetować tracking postaci, jeśli zaczyna gubić szczegóły twarzy.
Zaawansowane techniki — match cut i transition
Match cut to przejście między ujęciami, gdzie ruch lub kształt w jednym kadrze łączy się z podobnym elementem w następnym. Veo 3 potrafi to symulować, jeśli dasz precyzyjne instrukcje. Przykład: ostatni klip kończy się close-upem okrągłej lampy, następny zaczyna się od close-upu okrągłego zegara na ścianie. Oko widza śledzi okrągły kształt i płynnie przechodzi między scenami.
extreme close-up of round table lamp, warm glowing bulb filling frame, camera static, 4K cinematic
extreme close-up of round wall clock showing 11:47 PM, second hand ticking, similar warm lighting, camera static, 4K cinematic
Dwa prompty, dwa osobne ujęcia, ale kompozycja i oświetlenie celowo podobne. W montażu to będzie wyglądać jak jedno płynne przejście. Veo 3 nie robi automatycznych przejść typu fade czy dissolve — te musisz dodać w montażu. Ale potrafi stworzyć wizualną ciągłość, która sprawia, że cięcie między ujęciami jest prawie niewidoczne.
Inna technika to leading lines — linie, które prowadzą oko widza przez kadr. Jeśli w jednym ujęciu bohaterka idzie wzdłuż korytarza, który biegnie z lewej dolnej do prawej górnej części kadru, następne ujęcie powinno kontynuować ten kierunek. Veo 3 to pamięta, jeśli w prompcie napiszesz „continuing movement from previous shot” lub „matching screen direction”.
Protip ✅
Screen direction to podstawa filmowej gramatyki. Jeśli postać w ujęciu A patrzy w prawo, w ujęciu B (reakcja drugiej osoby) powinna patrzeć w lewo. Veo 3 tego nie wymusi automatycznie, musisz to kodować w promptach: „looking screen left” vs „looking screen right”.
Eksport i finalizacja sekwencji
Masz gotową sekwencję 6-8 ujęć w Veo 3. Każdy klip możesz eksportować osobno jako MP4 w 4K albo 1080p. Google AI Studio daje też opcję eksportu całej sekwencji jako zip z ponumerowanymi plikami — wygodne, jeśli planujesz import prosto do Premiere, DaVinci albo Final Cut. Pliki są już w kolejności, więc wystarczy drag and drop na timeline.
Veo 3 nie dodaje automatycznego audio — każdy klip to tylko obraz. Ścieżkę dźwiękową musisz dołożyć w montażu. Dla storyboardów to zazwyczaj plus, bo i tak planujesz dialogi, muzykę i efekty osobno. Ale jeśli potrzebujesz szybkiego preview z placeholderem audio, użyj AI Studio do generacji ambientu przez Gemini — ten sam interfejs, zakładka Audio.
Większość filmowców używa eksportu Veo 3 jako bazy do dalszej pracy w tradycyjnym montażu. Przycinają długości ujęć, dodają przejścia, korekcję kolorów, teksty. Veo 3 to narzędzie do prototypowania, nie finalnego produktu. Ale jako prototyp jest wystarczająco dobry, żeby pokazać klientowi, przedstawić pomysł producentowi albo przetestować, czy sekwencja w ogóle działa przed zainwestowaniem w prawdziwą produkcję.
Uwaga ⚠️
Veo 3 generuje watermark Google AI w prawym dolnym rogu każdego klipu. Można go usunąć w Premiere przez crop albo Content-Aware Fill, ale jeśli planujesz komercyjne użycie materiału, sprawdź licencję w Google AI Studio. Obecnie Veo 3 jest w fazie eksperymentalnej i nie wszystkie plany subskrypcji pozwalają na monetyzację wygenerowanych klipów.
Przykłady z życia — co filmowcy robią w Veo 3
Dokumentalista z Toronto użył Veo 3 do storyboardowania 15-minutowego filmu o zmianach klimatu. Zamiast rysować tradycyjne storyboardy (nie umie, kosztowałoby 2000 dolarów zlecone studiu), wygenerował 80 ujęć w Veo 3 przez trzy wieczory. Pokazał funding committee, dostał grant, nakręcił prawdziwy film. Veo 3 storyboard siedzi teraz w archiwum jako preproduction material.
Agencja reklamowa w Londynie używa Veo 3 do pitchów dla klientów, którzy nie mają wyobraźni. Zamiast moodboardów i animatics, pokazują gotowe sekwencje 4K. Klient widzi dokładnie, jak będzie wyglądać spot, zanim agencja wyda złotówkę na prawdziwą produkcję. Współczynnik zaakceptowanych pitchy wzrósł o 40% odkąd przeszli na Veo 3.
Niezależna reżyserka z Berlina testuje w Veo 3 blokowanie scen przed wejściem na plan. Generuje różne warianty tej samej sekwencji — raz z kamerą statyczną, raz z dolly, raz z orbitem. Potem na planie wie dokładnie, który setup działa najlepiej, oszczędza czas ekipy i budżet na niepotrzebne ujęcia. Veo 3 to dla niej wirtualny location scout i rehearsal space w jednym.
Czego Veo 3 jeszcze nie umie
Veo 3 nie radzi sobie z szybkim dialogiem między postaciami. Jeśli generujesz scenę rozmowy, usta bohaterów poruszają się losowo, nie sync z ewentualnym audio. Google pracuje nad lip sync w Veo 4, ale na razie unikaj close-upów mówiących postaci. Albo kadruj tak, żeby twarzy nie było widać — over the shoulder shot, profil, plany ogólne.
Długie ujęcia powyżej 10 sekund gubią spójność ruchu. Veo 3 dobrze generuje pierwsze 5 sekund, potem zaczyna импровизировать. Postać, która szła prosto, nagle skręca w bok. Kamera, która robiła pan, zatrzymuje się w połowie. Trzymaj ujęcia krótkie, montaż potem to sklei.
Tekst na ekranie (napisy, znaki, litery) to nadal loteria. Veo 3 potrafi wygenerować „neon sign”, ale nie kontrolujesz, co na tym neonie będzie napisane. Czasem wyjdzie „OPEN”, czasem bełkot. Jeśli potrzebujesz konkretnego tekstu, dodaj go w postprodukcji graficznie. Nie ufaj modelowi, że odczyta prompt „neon sign saying HOTEL” dosłownie.
Protip ✅
Jeśli Veo 3 generuje coś dziwnego, co psuje sekwencję (np. nagle pojawia się trzecia ręka, klasyka AI), nie próbuj naprawić tego kolejnymi generacjami. Zaakceptuj, że to ujęcie się nie udało, wróć o krok w sekwencji, spróbuj inny kąt kamery albo inny prompt. Czasem prościej ominąć problematyczny kadr niż walczyć z halucynacjami modelu.
Co dalej — jak Veo 3 zmienia preprodukcję
Veo 3 nie zastąpi prawdziwych zdjęć, ale zmienia punkt, w którym decydujesz się na prawdziwą produkcję. Wcześniej storyboard to były szkice, animatics to były slide shows z muzyczką. Teraz możesz pokazać sekwencję, która wygląda w 70% jak finał. To przesuwa moment podejmowania decyzji — widzisz, co działa, zanim wydasz budżet.
Dla małych produkcji i niezależnych twórców to demokratyzacja dostępu. Nie musisz mieć 50 tysięcy na test shoot, żeby sprawdzić, czy pomysł ma sens. Veo 3 kosztuje tyle co abonament Netflixa miesięcznie, a daje nieograniczoną liczbę generacji w rozsądnych limitach. To wyrównuje szanse między dużymi studiami a samotnymi reżyserami z laptopem.
Dla dużych produkcji to narzędzie do iteracji. Możesz przetestować dziesięć wersji tej samej sceny, zanim zdecydujesz, którą kręcić. Director of Photography widzi, co planujesz i może się przygotować technicznie. Location scout wie, jakich miejsc szukać. Każdy na planie ma wspólną wizję zamiast domysłów.
Google zapowiada, że Veo 4 będzie miał lepszy tracking postaci, dłuższe ujęcia i control nety do precyzyjniejszego sterowania kompozycją. Ale Veo 3 już teraz jest wystarczająco dobry, żeby zmienić sposób, w jaki filmowcy planują projekty. I to nie przyszłość za dwa lata — to dzieje się dzisiaj, w AI Studio, za darmo dla pierwszych 50 generacji dziennie.


