StartMidjourney
Kompletny przewodnik po Midjourney w 2025 roku. Jak tworzyć grafiki, które oszukają ludzkie oko?
Sztuczna inteligencja generująca obrazy przestała być nowinką technologiczną, a stała się potężnym narzędziem w rękach artystów, projektantów, marketerów i hobbystów. W epicentrum tej rewolucji niezmiennie od lat stoi Midjourney – platforma, która w 2025 roku osiągnęła poziom realizmu i kontroli, o jakim jeszcze niedawno mogliśmy tylko marzyć. Grafiki tworzone za jej pomocą nie tylko zachwycają, ale często są nie do odróżnienia od profesjonalnych fotografii.
Jeżeli chcesz opanować to narzędzie do perfekcji, tworzyć zapierające dech w piersiach wizualizacje, spójne postacie do swoich opowieści czy fotorealistyczne sceny, które oszukają nawet najbardziej wnikliwe oko – ten przewodnik jest dla Ciebie. Krok po kroku, od absolutnych podstaw po techniki na poziomie mistrzowskim, odkryjemy pełen potencjał Midjourney w jego najnowszej odsłonie.
Czym jest Midjourney i jak zacząć w 2025 roku? Nasze pierwsze kroki
Midjourney to zaawansowany model sztucznej inteligencji, który przekształca opisy tekstowe, zwane “promptami”, w unikalne obrazy. Działa na zasadzie modelu dyfuzyjnego, który uczy się na gigantycznym zbiorze danych zawierającym miliardy par obraz-tekst, aby zrozumieć zależności między słowami a elementami wizualnymi.
Chociaż zespół Midjourney rozwija niezależną platformę webową, sercem społeczności i podstawowym interfejsem wciąż pozostaje aplikacja Discord. To właśnie tam odbywa się cała magia.
Jak rozpocząć swoją przygodę – proces w 4 krokach:
Załóż konto na Discordzie: Jeśli jeszcze go nie posiadasz, wejdź na discord.com i zarejestruj się. To darmowa aplikacja do komunikacji, dostępna na komputer i urządzenia mobilne.
Dołącz do serwera Midjourney: Wejdź na oficjalną stronę midjourney.com i kliknij “Join the Beta”. Zostaniesz automatycznie przekierowany do zaproszenia na serwer Midjourney na Discordzie. Zaakceptuj je.
Wybierz plan subskrypcyjny: Czasy darmowych testów minęły bezpowrotnie. Aby generować obrazy, musisz posiadać aktywną subskrypcję. Wejdź na dowolny kanał dla początkujących (np. #newbies-123) i wpisz komendę /subscribe. Bot wyśle Ci unikalny link do zarządzania Twoim planem. Wybierz opcję, która najbardziej Ci odpowiada – plany różnią się liczbą “szybkich godzin” generowania i dostępem do trybu relax.
Zacznij generować: Najprostszym sposobem na start jest wejście na jeden z kanałów #newbies. Jednakże, aby zachować porządek i prywatność, gorąco polecam stworzenie własnego serwera na Discordzie i zaproszenie na niego Bota Midjourney. Pozwoli Ci to na pracę w spokoju, bez zalewu grafik od innych użytkowników.
Twoją pierwszą i najważniejszą komendą jest /imagine. Po jej wpisaniu pojawi się pole prompt, w którym umieszczasz swój opis.
Przykład:/imagine prompt: a cute robot drinking coffee on a rainy day
Po kilku chwilach otrzymasz siatkę czterech propozycji. Pod nią znajdziesz przyciski U1 do U4 (Upscale – powiększenie wybranego obrazu) oraz V1 do V4 (Variation – stworzenie czterech nowych wariacji na podstawie wybranego obrazu).
Anatomia idealnego promptu. Fundamenty, które musisz znać
Prompt w Midjourney to nie chaotyczny zbiór słów, ale precyzyjna receptura. Im lepiej zrozumiesz jej składniki, tym smaczniejszy (i bardziej przewidywalny) będzie efekt końcowy. W 2025 roku, dzięki modelowi V7, AI rozumie naturalny język znacznie lepiej, ale struktura wciąż ma znaczenie.
Kluczowe składniki mistrzowskiego promptu:
Główny temat (Subject): Kto lub co jest sercem obrazu? Bądź precyzyjny. Zamiast “pies”, napisz “golden retriever puppy”. Zamiast “samochód”, “czerwony, sportowy kabriolet z lat 60.”.
Sceneria i otoczenie (Setting): Gdzie rozgrywa się akcja? “w minimalistycznym lofcie”, “na szczycie mglistej góry o wschodzie słońca”, “na tętniącej życiem ulicy Tokio nocą”.
Medium i styl (Medium & Style): Jak ma wyglądać obraz? To kluczowy element decydujący o charakterze grafiki.
Atmosfera i nastrój (Atmosphere & Mood): Jakie emocje ma wywoływać obraz? serene, melancholic, energetic, dystopian, ethereal, noir aesthetic.
Kolorystyka (Color Palette):vibrant and colorful, monochromatic, pastel colors, earthy tones.
Ciekawostka: Wczesne wersje Midjourney kładły ogromny nacisk na kolejność słów w prompcie. To, co było na początku, miało największą wagę. Model V7 jest znacznie bardziej elastyczny, ale dobra praktyka wciąż sugeruje, aby zaczynać od głównego tematu, a parametry techniczne umieszczać na końcu.
Kluczowe parametry w Midjourney V7. Twoja skrzynka z narzędziami
Prompty to Twoje słowa, ale parametry to Twoje techniczne przełączniki. Umieszcza się je na samym końcu promptu, poprzedzając dwoma myślnikami (--).
--ar 16:9 (panorama, idealny na tapety i miniatury YouTube)
--ar 2:3 lub --ar 3:4 (portret, świetny do plakatów i Pinteresta)
--style raw: To Twój najlepszy przyjaciel w drodze do fotorealizmu. Ten parametr redukuje “artystyczną opinię” Midjourney, sprawiając, że AI trzyma się Twojego promptu znacznie bardziej literalnie. Zamiast domyślnej, nieco bajkowej estetyki, otrzymujesz surowszy, bardziej fotograficzny obraz.
--stylize <0-1000> (lub --s): Określa, jak mocno Midjourney ma “upiększyć” Twój prompt.
--s 0: Maksymalna wierność promptowi, zero własnej inwencji AI.
--s 100: Domyślna wartość, dobry balans.
--s 250: AI zaczyna dodawać więcej detali i artystycznego sznytu.
--s 750: Bardzo wysoka stylizacja, AI ma dużą swobodę artystyczną.
Dla fotorealizmu, trzymaj się niskich wartości, np. --s 50 lub --s 100 w połączeniu z --style raw.
--cref <URL> (Character Reference): Prawdopodobnie najważniejsza funkcja 2025 roku. Pozwala na zachowanie spójności postaci między różnymi generacjami. Użyj URL do obrazu z postacią, a Midjourney spróbuje odtworzyć jej twarz i cechy w nowej scenie.
--cw <0-100> (Character Weight): Działa w parze z --cref. Określa, jak mocno AI ma się trzymać referencji. --cw 100 (domyślnie) kopiuje twarz, włosy i ubranie. --cw 0 skupia się tylko na twarzy, pozwalając na zmianę stroju czy fryzury.
--sref <URL> (Style Reference): Działa podobnie do --cref, ale zamiast kopiować postać, kopiuje ogólną estetykę obrazu – jego kolorystykę, kompozycję, oświetlenie i nastrój. Możesz użyć zdjęcia w stylu noir, aby nadać taki klimat generacji przedstawiającej statek kosmiczny.
--chaos <0-100>: Kontroluje różnorodność w początkowej siatce czterech obrazów. Wyższe wartości (np. --chaos 50) dadzą Ci cztery bardzo różne od siebie propozycje, co jest świetne na etapie poszukiwania inspiracji.
Sztuka fotorealizmu. Prompty, które tworzą iluzję rzeczywistości
Osiągnięcie fotorealizmu to święty Graal dla wielu użytkowników Midjourney. Sekret nie leży w jednym magicznym słowie, ale w synergii precyzyjnego opisu i odpowiednich parametrów. Złota zasada brzmi: Myśl jak fotograf, nie jak malarz.
Najlepsze fotorealistyczne prompty nie są opisami zdjęcia, ale instrukcjami, jak je wykonać. Jesteś reżyserem, operatorem kamery i scenografem – a wszystko to w jednej linijce tekstu.
Oto kilka przykładów promptów z pełną dekonstrukcją, które możesz zaadaptować do swoich potrzeb.
Przykład 1: Intymny portret
/imagine prompt: professional photorealistic portrait of a charismatic 70-year-old man with a white beard and kind, crinkling eyes, looking directly at the camera, soft natural smile, sitting in a leather armchair in a library filled with books, soft window light from the side, shot on a Canon R5 with an 85mm f/1.2 lens, shallow depth of field, hyper-detailed skin texture, realistic catchlights in eyes --ar 2:3 --style raw --s 100
Dekonstrukcja:
professional photorealistic portrait: Jasno określa cel.
charismatic 70-year-old man...: Szczegółowy opis modela.
sitting in a leather armchair...: Konkretne otoczenie.
soft window light from the side: Precyzyjne oświetlenie, które tworzy głębię.
shot on a Canon R5 with an 85mm f/1.2 lens: Sygnał dla AI, aby naśladowała jakość i charakterystykę (piękny bokeh) profesjonalnego sprzętu.
hyper-detailed skin texture, realistic catchlights in eyes: Prośba o kluczowe detale, które budują realizm.
--style raw --s 100: Nasz zestaw startowy do fotorealizmu.
Przykład 2: Epicki krajobraz
/imagine prompt: National Geographic style photograph of the Icelandic highlands in summer, a winding glacial river cutting through a vibrant green valley, volcanic mountains in the background under a dramatic, cloudy sky, volumetric light rays breaking through the clouds, vast and epic scale, taken with a Hasselblad X2D 100C, wide-angle lens, HDR, extremely high detail --ar 16:9 --style raw --s 250
Dekonstrukcja:
National Geographic style photograph: Ustawia poprzeczkę jakości i stylu.
Icelandic highlands...: Precyzyjna lokalizacja i opis sceny.
volumetric light rays: Profesjonalny termin na tzw. “promienie Boga”, dodaje dramatyzmu.
Hasselblad X2D 100C: Wzmianka o aparacie z najwyższej półki sugeruje najwyższą jakość i szczegółowość.
HDR: Technika fotograficzna, która sugeruje szeroki zakres tonalny i bogactwo detali w cieniach i światłach.
--s 250: W przypadku krajobrazów możemy pozwolić sobie na nieco wyższą stylizację, aby AI “dopaliła” scenę.
Przykład 3: Zdjęcie uliczne
/imagine prompt: candid street style photo of a woman in a stylish yellow raincoat walking through a rain-slicked street in Osaka at night, reflections of vibrant neon signs in the puddles on the pavement, cinematic film grain, Blade Runner aesthetic, captured with a FujiFilm X-T5, dynamic motion blur, sense of quiet contemplation --ar 4:5 --style raw --s 120
Dekonstrukcja:
candid street style photo: Sugeruje naturalność, zdjęcie “z ukrycia”.
rain-slicked street... neon signs: Tworzy specyficzny, mokry, miejski klimat.
cinematic film grain: Dodaje analogowego, filmowego charakteru.
Blade Runner aesthetic: Potężna referencja kulturowa, która natychmiastowo narzuca określoną paletę barw i nastrój.
FujiFilm X-T5: Znany z pięknych symulacji kliszy filmowej.
dynamic motion blur: Dodaje realizmu i poczucia ruchu.
Ciekawostka: Przez lata największą zmorą generatorów AI były dłonie. AI nie “rozumie” anatomii, a jedynie statystykę, a dłonie są niezwykle złożone i pojawiają się na zdjęciach w nieskończonej liczbie pozycji. Modele takie jak Midjourney V7, dzięki ulepszonej architekturze i gigantycznym zbiorom danych, wreszcie radzą sobie z tym problemem na poziomie, który przestaje być memem, a staje się normą.
Zaawansowane techniki. Od spójnych postaci po remiksowanie stylów
Gdy opanujesz już podstawy, czas wejść na wyższy poziom.
Tworzenie spójnych postaci z --cref
To rewolucja dla komiksiarzy, storytellerów i marketerów. Koniec z losowymi twarzami w każdej scenie.
Przepływ pracy:
Stwórz arkusz postaci (Character Sheet): Wygeneruj prosty, czysty portret swojej postaci.
Prompt: a beautiful elven princess with silver hair and glowing blue eyes, character sheet, front view, neutral expression, studio lighting, simple grey background --ar 2:3 --style raw
Wybierz i skopiuj URL: Z wygenerowanej siatki wybierz najlepszy obraz, powiększ go (U1-U4), a następnie kliknij na niego prawym przyciskiem myszy i wybierz “Kopiuj link do obrazu”.
Użyj referencji w nowej scenie:
Prompt: [wklejony URL obrazu] a beautiful elven princess reading a glowing book in a mystical ancient library, fantasy illustration --cref --cw 100 --ar 16:9
Midjourney użyje twarzy i cech z Twojego obrazu referencyjnego, umieszczając postać w zupełnie nowym kontekście.
Modyfikowanie obrazu za pomocą Vary (Region)
Czasami 95% obrazu jest idealne, ale jeden element (np. dłoń, wyraz twarzy) wymaga poprawy.
Powiększ obraz, który chcesz edytować.
Kliknij przycisk Vary (Region).
Pojawi się edytor, w którym możesz zaznaczyć obszar do poprawy.
W polu prompt na dole zmodyfikuj opis, skupiając się tylko na tym, co chcesz zmienić w zaznaczonym obszarze. Np. jeśli chcesz, aby postać się uśmiechała, zmień w prompcie “neutral expression” na “gentle smile”.
Midjourney przeliczy tylko zaznaczony fragment, wpasowując go w resztę obrazu.
Podsumowanie: Twoja podróż dopiero się zaczyna
Dotarliśmy do końca tego obszernego przewodnika. Wiesz już, jak skonstruować potężny prompt, jak żonglować kluczowymi parametrami i jak wykorzystać zaawansowane techniki do tworzenia fotorealistycznych obrazów i spójnych postaci.
Pamiętaj, że Midjourney to nie jest magiczna różdżka, ale instrument. Im lepiej go poznasz i im więcej będziesz ćwiczyć, tym piękniejszą muzykę wizualną będziesz w stanie na nim zagrać. Nie bój się eksperymentować, łamać zasady i szukać własnego, unikalnego stylu. Świat generatywnej sztuki w 2025 roku jest niezwykle ekscytujący, a Ty masz teraz wszystkie narzędzia, by stać się jego aktywnym twórcą.
Jeśli ten poradnik okazał się dla Ciebie wartościowy i chcesz zanurzyć się jeszcze głębiej, rozważ wsparcie mojej działalności na Patreonie. Znajdziesz tam ekskluzywne warsztaty, prywatne biblioteki promptów i comiesięczne sesje Q&A, podczas których pomagam rozwiązywać konkretne problemy.
A teraz… idź i stwórz coś niesamowitego!
Piotr OlszewskiPrompt Engineer
Ekspert AI i twórca serwisu Promptowy.com. Codziennie śledzi i komentuje najważniejsze wydarzenia ze świata sztucznej inteligencji, od aktualizacji OpenAI po rewolucje w generowaniu wideo. Jego misją jest tłumaczenie zawiłości technologii na język zrozumiały dla każdego użytkownika.