Google właśnie zmienił zasady gry w kreowaniu marki osobistej. Nano Banana 2, dostępne od dziś w aplikacji Gemini i AI Studio, potrafi coś, na co konkurencja dopiero poluje — spójność postaci w różnych scenach. Koniec z modleniem się, żeby twoja twarz wyglądała tak samo na trzech obrazkach z rzędu. Model Gemini 3.1 Flash Image zapamięta pięć różnych bohaterów i będzie renderował ich konsekwentnie w rozdzielczości 4K. No i wreszcie ktoś ogarnął tekst na obrazach — bez literówek i dziwnych symboli.
Jeśli tworzysz content do mediów społecznościowych, materiały marketingowe lub po prostu chcesz mieć spójną identyfikację wizualną bez angażowania grafika — to narzędzie jest właśnie dla ciebie. Działa w przeglądarce, integruje się z API i łapie referencje wizualne prosto z sieci. Żadnych skomplikowanych instalacji, żadnych lekcji Photoshopa. Wpisujesz prompt, dostajesz profesjonalny efekt.
Poniżej znajdziesz gotowe prompty, protipy i instrukcję krok po kroku — od pierwszego uruchomienia po eksport serii zdjęć w jednym stylu.
Jak uruchomić Nano Banana 2 — cztery ścieżki dostępu
Google udostępnił Nano Banana 2 w czterech miejscach, każde z innym zastosowaniem. Aplikacja Gemini to najszybszy start dla zwykłych użytkowników — otwierasz chatbota, piszesz prompt i dostajesz obraz. Google AI Studio to plac zabaw dla tych, którzy chcą testować parametry i zapisywać wersje promptów. API Gemini służy deweloperom budującym własne aplikacje z generowaniem obrazów. Vertex AI to opcja dla firm, które potrzebują kontroli dla firm i integracji z Google Cloud.
Dla większości użytkowników najlepszy punkt startu to aplikacja Gemini — dostępna bezpłatnie z kontem Google. Logujesz się na gemini.google.com, wybierasz opcję generowania obrazów i jesteś gotowy. AI Studio wymaga rejestracji w programie deweloperskim Google, ale daje więcej kontroli nad parametrami i historią promptów. API i Vertex to już poziom dla programistów i działów IT w firmach.
Protip ✅
Zacznij od aplikacji Gemini, żeby przetestować możliwości modelu. Gdy opanujesz prompty i będziesz potrzebować powtarzalności — przenieś się do AI Studio i zapisz swoje najlepsze konfiguracje.
Spójność postaci — jak zapamięta twoją twarz
Funkcja konsystencji postaci w Nano Banana 2 działa na zasadzie zapamiętywania cech charakterystycznych z pierwszego wygenerowanego obrazu. Gdy w prompcie użyjesz nazwy postaci i opisu wyglądu, model zapisze te cechy i będzie ich używał w kolejnych generacjach. Możesz mieć do pięciu różnych bohaterów w jednym projekcie — każdy z własnym zbiorem charakterystycznych rysów.
Kluczem jest precyzyjny pierwszy prompt. Zamiast pisać „kobieta w biznesowym stroju”, napisz konkretnie: wiek, kolor włosów, fryzura, kształt twarzy, okulary jeśli nosi, charakterystyczne cechy. Im więcej detali podasz za pierwszym razem, tym lepiej model zachowa spójność w kolejnych obrazach. Po wygenerowaniu pierwszego zdjęcia możesz odnosić się do postaci po nazwie — „Anna stojąca przed białą ścianą” i model użyje zapamiętanych cech.
Professional headshot of Anna, 32-year-old woman, shoulder-length dark brown hair with subtle waves, rectangular black-framed glasses, warm smile, wearing charcoal grey blazer over white blouse, soft studio lighting, neutral grey background, 4K quality
Ten prompt tworzy bazową postać z konkretnymi cechami. Zapisz wygenerowany obraz jako referencję. W kolejnych promptach możesz napisać tylko „Anna sitting at cafe table with laptop” i model zachowa wygląd twarzy, fryzurę i okulary. Działa to zaskakująco dobrze — o wiele lepiej niż próby utrzymania spójności w Midjourney czy Dall-E przez seed i image prompts.
Anna standing in modern office space, holding tablet, floor-to-ceiling windows in background, natural daylight, business casual outfit with navy blue cardigan, confident posture, 4K resolution
Drugi prompt zmienia scenę i strój, ale twarz pozostaje ta sama. Nano Banana 2 wyłapuje kluczowe cechy z pierwszego obrazu i aplikuje je w nowym kontekście. To ogromna oszczędność czasu przy tworzeniu serii zdjęć do mediów społecznościowych czy materiałów promocyjnych.
Uwaga ⚠️
Spójność działa najlepiej, gdy zmieniasz tło i strój, ale zachowujesz podobny kąt kamery i oświetlenie. Drastyczne zmiany perspektywy (profil vs en face) czasem psują konsystencję rysów twarzy.
Renderowanie tekstu — wreszcie bez literówek
Nano Banana 2 ma coś, czego praktycznie żaden konkurent nie potrafi — precyzyjne wstawianie tekstu w obrazy. Midjourney psuje litery, Dall-E wymaga trzech prób, żeby dostać jedno słowo dobrze, a tutaj po prostu piszesz w prompcie, co ma być napisane i gdzie. Model rozumie fonty, umiejscowienie, styl typografii i renderuje tekst bez błędów ortograficznych.
Składnia jest prosta: dodajesz do promptu fragment „text reading 'Twój tekst tutaj’ on [element obrazu]”. Model zinterpretuje kontekst i dobierze odpowiedni font i styl do sceny. Możesz kontrolować wygląd tekstu, dodając opisy jak „bold sans-serif font”, „elegant script typography” czy „neon sign lettering”.
Coffee shop storefront with large window, text reading 'BREW & CODE' in bold modern sans-serif on wooden sign above entrance, warm morning light, potted plants on windowsill, 4K detail
Ten prompt generuje kawiarnię z poprawnie napisaną nazwą. Bez dziwnych symboli, bez literówek, bez losowych znaków, jakie plują inne generatory. Tekst jest ostry, czytelny i pasuje stylistycznie do sceny. To przełom dla twórców mockupów produktowych, grafik social media i materiałów reklamowych.
Anna holding white ceramic mug with text reading 'MONDAY FUEL' in black minimalist lettering, sitting at wooden desk, soft window light from left, cozy home office setting, 4K quality
Tekst na kubku renderuje się bez problemu — dokładnie tam, gdzie powinien być, z odpowiednią krzywizną dopasowaną do powierzchni. To poziom precyzji, którego nie dostaniesz w żadnym innym bezpłatnym generatorze AI.
Protip ✅
Umieszczaj tekst na płaskich lub lekko zakrzywionych powierzchniach — tablice, kubki, torby, ubrania. Skomplikowane kąty i mocno zniekształcone powierzchnie czasem powodują drobne błędy w perspektywie liter.
Gruntowanie w sieci — referencje wizualne na żądanie
Funkcja gruntowania w sieci pozwala Nano Banana 2 wyłapywać aktualne trendy wizualne i konkretne style referencyjne dostępne w internecie. Zamiast zgadywać, jak wygląda „skandynawskie minimalistyczne wnętrze”, model przeszuka przykłady i wygeneruje obraz zgodny z rzeczywistymi standardami tego stylu. To działa również z modą, architekturą, designem produktów i trendami wizualnymi w social media.
Nie musisz podawać URLi ani konkretnych źródeł — wystarczy opisać styl, używając nazw trendów lub ruchów artystycznych. Model sam znajdzie odpowiednie referencje i użyje ich jako bazy wizualnej. Dzięki temu obrazy wyglądają aktualnie i pasują do obecnych standardów estetycznych, zamiast opierać się tylko na danych treningowych z przeszłości.
Product photography of minimalist water bottle in Scandinavian design style, white marble surface, soft diffused natural light, clean composition, neutral color palette with sage green accent, 4K commercial quality
Ten prompt użyje aktualnych przykładów skandynawskiego designu jako referencji wizualnej. Efekt będzie pasował do tego, co widzisz w katalogach IKEA czy na Instagramie minimalistycznych brandów — nie do wyobrażenia AI o tym, jaki był ten styl pięć lat temu.
Protip ✅
Używaj nazw popularnych trendów wizualnych — „cottagecore aesthetic”, „dark academia style”, „brutalist architecture” — model lepiej rozpoznaje konkretne nazwy niż ogólne opisy.
Rozdzielczość 4K — kiedy rozmiar ma znaczenie
Nano Banana 2 renderuje obrazy w natywnej rozdzielczości 4K, co daje wymiary około 3840×2160 pikseli. To wystarczy do druku w formacie A3, billboardów cyfrowych i profesjonalnych materiałów marketingowych. Większość konkurencyjnych generatorów daje 1024×1024 lub w najlepszym wypadku 2K — tutaj dostajesz cztery razy więcej detali bez upscalingu.
Wysoka rozdzielczość oznacza również lepszą jakość detali — tekstury tkanin, pory skóry, refleksy w oczach, drobne elementy tła. Wszystko jest ostre i nadaje się do profesjonalnego użytku bez dodatkowego przetwarzania. Możesz wyeksportować obraz i użyć go bezpośrednio w kampanii reklamowej czy na okładce ebooka.
Close-up portrait of Anna, sharp focus on eyes behind glasses, detailed skin texture, individual hair strands visible, soft catchlight in eyes, blurred background, professional photography quality, 4K resolution
Ten prompt maksymalnie wykorzystuje możliwości 4K — detale twarzy są wyraźne, włosy nie wyglądają jak rozmazana plama, a okulary mają realistyczne refleksy. Wydrukujesz to w formacie 30×40 cm i będzie wyglądało profesjonalnie.
Uwaga ⚠️
Renderowanie 4K trwa dłużej niż standardowe rozdzielczości — zwykle 15-30 sekund zamiast 5-10. Jeśli testujesz prompty, możesz zacząć od niższej rozdzielczości i przejść na 4K dopiero przy finalnej wersji.
Pięć gotowych promptów do marki osobistej
Poniżej znajdziesz prompty gotowe do skopiowania — każdy tworzy inny typ obrazu przydatny w budowaniu spójnej marki osobistej. Wszystkie używają tej samej postaci „Anna” zdefiniowanej w pierwszym prompcie z sekcji o spójności.
Anna recording podcast in home studio, wearing wireless headphones, speaking into professional microphone on boom arm, bookshelf in soft-focus background, warm ambient lighting, authentic and approachable vibe, 4K quality
Klasyczny setup dla twórców contentu — podcaster, YouTuber, trener online. Ciepłe światło i półki z książkami w tle budują autorytet i przystępność jednocześnie.
Anna working on MacBook at minimalist standing desk, large window with city view in background, indoor plants on windowsill, golden hour natural light, productive and focused atmosphere, modern professional workspace, 4K detail
Zdjęcie idealne pod LinkedIn czy Instagram dla freelancerów i przedsiębiorców. Pokazuje profesjonalizm bez sztywności korporacyjnej.
Flat lay composition: Anna's hands typing on laptop keyboard, coffee cup with latte art, smartphone, notebook with handwritten notes, succulent plant, white desk surface, top-down view, clean and organized aesthetic, 4K photography
Perspektywa z góry — ulubieniec Instagrama. Świetne na posty o produktywności, planowaniu, rutynach porannych.
Anna presenting to small group in modern conference room, gesturing towards wall-mounted screen with charts, colleagues sitting at table, natural confident body language, bright professional lighting, corporate but approachable atmosphere, 4K quality
Dla konsultantów, trenerów biznesowych, wykładowców — pokazuje ekspertyzę i umiejętności prezentacyjne w środowisku korporacyjnym.
Candid shot of Anna laughing while working outdoors at cafe table, laptop open, coffee and pastry nearby, dappled sunlight through tree leaves, authentic moment, lifestyle photography style, warm and inviting mood, 4K resolution
Zdjęcie lifestyle’owe — bardziej osobiste, ludzkie, autentyczne. Równoważy profesjonalne portrety i pokazuje osobowość.
Protip ✅
Wygeneruj serię 8-12 zdjęć w jednej sesji, używając spójnej postaci. Będziesz miał bank obrazów na kilka miesięcy postów w social media — wszystkie w tym samym stylu wizualnym i z tą samą twarzą.
Praca z wieloma postaciami — zespół w jednym projekcie
Nano Banana 2 pozwala zarządzać pięcioma różnymi bohaterami jednocześnie w ramach jednego projektu. To przydatne przy tworzeniu materiałów dla zespołów, serii historii z kilkoma głównymi postaciami lub kampanii pokazujących różnorodność. Każda postać wymaga własnego promptu definiującego — podobnie jak w przykładzie z Anną.
Gdy zdefiniujesz wszystkie postaci, możesz mieszać je w różnych konfiguracjach. „Anna i Mark rozmawiają przy stole konferencyjnym”, „Sarah prezentuje wyniki Tomowi i Lindzie” — model zachowa spójność wszystkich twarzy w jednej scenie. To poziom kontroli niedostępny wcześniej bez skomplikowanego kombinowania image promptów i seeds.
Professional team photo: Anna, Mark (tall man, short black hair, beard, navy suit), and Sarah (woman with blonde pixie cut, red blazer) standing together in modern office lobby, confident poses, natural smiles, corporate professional atmosphere, 4K quality
Ten prompt definiuje trzy nowe postaci jednocześnie i umieszcza je w jednej scenie. Zapisz ten obraz jako bazę zespołu. W kolejnych promptach możesz używać tych samych imion i model zastosuje wygląd każdej osoby.
Uwaga ⚠️
Im więcej postaci w jednej scenie, tym mniejsza kontrola nad szczegółami każdej twarzy. Najlepsza spójność jest przy 1-2 postaciach na obraz. Przy pięciu jednocześnie czasem zdarzają się drobne rozbieżności w rysach.
Eksport i integracja z API — automatyzacja produkcji
Obrazy wygenerowane w aplikacji Gemini możesz pobrać bezpośrednio jako pliki PNG w pełnej rozdzielczości 4K. Kliknij prawym przyciskiem myszy i wybierz „Zapisz obraz jako” — standardowa procedura. W AI Studio masz dodatkową opcję eksportu całej historii promptów jako JSON, co ułatwia odtwarzanie udanych konfiguracji.
API Gemini pozwala zautomatyzować generowanie przez skrypty i integracje z innymi narzędziami. Możesz np. stworzyć skrypt, który co tydzień generuje serię postów do mediów społecznościowych, używając losowych scenerii, ale tej samej postaci. Albo połączyć generator z CMS i automatycznie tworzyć grafiki do artykułów blogowych na podstawie tytułów.
Dokumentacja API jest dostępna na ai.google.dev — potrzebujesz klucza API i podstawowej znajomości JavaScriptu lub Pythona. Przykładowy kod wywołania wygląda tak:
const response = await genAI.generateImage({n prompt: "Anna working at laptop in cafe, 4K quality",n model: "gemini-3.1-flash-image",n resolution: "4K"n});
Integracja z Vertex AI daje dodatkowe opcje dla firm — kontrolę kosztów, logi użycia, zarządzanie uprawnieniami zespołu, wersjonowanie projektów. To infrastruktura dla firm dla organizacji, które generują setki obrazów miesięcznie.
Protip ✅
Jeśli planujesz generować więcej niż 50 obrazów miesięcznie, sprawdź cennik API Gemini i Vertex AI — może wyjść taniej niż płatne plany Midjourney czy Adobe Firefly, zwłaszcza przy automatyzacji.
Co to oznacza dla twórców contentu
Nano Banana 2 zmienia ekonomikę tworzenia marki osobistej. Dotychczas spójna identyfikacja wizualna wymagała albo sesji zdjęciowej z fotografem (500-2000 zł), albo wielogodzinnego kombinowania w Photoshopie, albo akceptacji, że każde zdjęcie będzie wyglądało inaczej. Teraz dostajesz profesjonalną jakość w pięć minut bez wychodzenia z domu.
To szczególnie mocno uderzy w rynek stock photos i budżetowych sesji wizerunkowych. Po co płacić fotografowi 800 zł za trzy godziny i dziesięć ujęć, skoro możesz wygenerować dwadzieścia różnych scen w pół godziny? Oczywiście fotografia wciąż wygra autentycznością i subtelnościami ludzkiej ekspresji — ale dla większości postów na LinkedIn czy Instagram wystarczy dobry prompt.
Google nieźle wycelował. Influencerzy, freelancerzy, mali przedsiębiorcy — wszyscy potrzebują spójnych zdjęć, a niewielu stać na regularne sesje. Nano Banana 2 wypełnia tę niszę dokładnie w momencie, gdy personal branding przestał być luksusem i stał się wymogiem w każdej branży. Pytanie, czy rynek przyjmie AI-generowane twarze jako akceptowalny standard, czy będzie to odbierane jako oszustwo. Zobaczymy, co będzie.