Skip to content
Premium

Claude Opus 4.8 wysyła do pracy setki podagentów. Programowanie wchodzi w erę rojów

Anthropic wypuścił Claude Opus 4.8 i funkcję Dynamic Workflows, dzięki której Claude Code może koordynować setki podagentów przy dużych zadaniach programistycznych. To ważny krok w stronę AI jako zespołu, nie narzędzia.

4 min read
Nowe modele programistyczne przypominają dyrygenta, który rozdziela pracę między małe wyspecjalizowane agenty

Anthropic wypuścił Claude Opus 4.8, ale najciekawsza nie jest sama cyfra w nazwie modelu. Najważniejsze są Dynamic Workflows: funkcja, która pozwala Claude Code planować duże zadania, uruchamiać setki równoległych podagentów i weryfikować efekty przed oddaniem pracy użytkownikowi. AI przestaje być jednym rozmówcą, a zaczyna przypominać mały zespół roboczy.

W świecie modeli AI łatwo zmęczyć się kolejnymi premierami. Opus 4.6, Opus 4.7, Opus 4.8, następny benchmark, następny wykres, następna obietnica „najlepszego kodowania”. Ale najnowszy ruch Anthropic jest ciekawy nie dlatego, że model ma być lepszy od poprzednika. Jest ciekawy dlatego, że pokazuje zmianę kształtu pracy z AI. Anthropic ogłosił, że Opus 4.8 jest dostępny w tej samej cenie co poprzednik, ma lepiej radzić sobie z oceną własnej niepewności i wprowadza kontrolę poziomu wysiłku. Jednocześnie Claude Code otrzymuje Dynamic Workflows, czyli mechanizm do dużych, wieloetapowych zadań wykonywanych równolegle.

To brzmi jak techniczna funkcja dla programistów, ale ma szersze znaczenie. Dotąd większość użytkowników traktowała AI jak inteligentnego asystenta w oknie czatu. Zadajesz pytanie, dostajesz odpowiedź. Potem model zaczyna korzystać z narzędzi, przeglądać pliki, uruchamiać komendy. Dynamic Workflows idzie dalej: model może rozbić problem na części i koordynować wielu podwykonawców. To nie jest już rozmowa. To zarządzanie pracą.

Od jednego chatbota do roju wykonawców

Anthropic opisuje Dynamic Workflows jako funkcję, w której Claude planuje pracę, uruchamia setki równoległych podagentów w jednej sesji, a potem sprawdza wyniki przed raportem dla użytkownika. Przykładem są migracje kodu na skalę całej bazy, obejmujące setki tysięcy linii. TechCrunch zwraca uwagę, że premiera przyszła zaledwie 41 dni po Opus 4.7, w okresie silnej presji konkurencyjnej ze strony OpenAI i Google.

Najważniejsza zmiana polega na tym, że AI zaczyna przejmować nie tylko wykonanie, ale też orkiestrację. Programista nie prosi już modelu o napisanie jednej funkcji. Może poprosić o analizę całego repozytorium, zaplanowanie migracji, poprawę testów, wdrożenie zmian i weryfikację. Oczywiście w praktyce nadal będzie potrzebny człowiek, szczególnie przy decyzjach architektonicznych i ryzyku produkcyjnym. Ale granica przesuwa się szybko.

„Uczciwszy” model może być ważniejszy niż „mądrzejszy” model

Anthropic mocno akcentuje jeszcze jeden element: Opus 4.8 ma częściej sygnalizować niepewność i rzadziej przepuszczać własne błędy bez komentarza. Firma twierdzi, że w jej ewaluacjach model jest około cztery razy mniej skłonny niż poprzednik do pozostawiania niezauważonych wad w napisanym przez siebie kodzie. To może brzmieć mniej efektownie niż rekordowy wynik w benchmarku, ale dla realnej pracy jest kluczowe.

Najgorszy asystent AI to nie ten, który czegoś nie wie. Najgorszy jest ten, który nie wie, ale mówi pewnym tonem. W zadaniach agentowych ten problem rośnie. Jeżeli model wykonuje wiele kroków, używa narzędzi i koordynuje podagentów, ma więcej okazji do popełnienia błędu. Potrzebuje więc nie tylko inteligencji, ale także dobrego osądu: kiedy zatrzymać się, kiedy zgłosić problem, kiedy poprosić o decyzję, kiedy nie udawać sukcesu.

Praca programisty zmienia się mniej romantycznie, niż obiecywano

Przez długi czas narracja była prosta: AI napisze kod za ludzi. W praktyce zmiana jest bardziej złożona. Programowanie coraz bardziej przypomina nadzorowanie systemów, które potrafią produkować kod, testy i analizy w dużej skali. Człowiek przesuwa się w stronę definiowania celu, ograniczeń, standardów jakości i akceptacji ryzyka. To może zwiększyć produktywność, ale też podnieść wymagania wobec tych, którzy mają oceniać pracę AI.

Dynamic Workflows może być szczególnie ważne w firmach, które mają duże, stare bazy kodu. Modernizacja takich systemów jest nudna, droga i ryzykowna. Jeśli AI potrafi bezpiecznie przeprowadzać część migracji, porządkować zależności i pilnować testów, oszczędności mogą być ogromne. Ale słowo „bezpiecznie” robi tu całą robotę. Błąd w prostym skrypcie jest irytujący. Błąd w migracji systemu płatności, dokumentacji medycznej albo infrastruktury krytycznej jest zupełnie inną kategorią problemu.

Dlatego ta premiera jest ważna, nawet jeśli nie trzeba od razu wierzyć we wszystkie obietnice. Claude Opus 4.8 pokazuje, że wyścig modeli przesuwa się z „kto odpowiada najlepiej” na „kto potrafi wykonać złożony proces od początku do końca”.

Era pojedynczego promptu nie znika. Ale najciekawsze rzeczy będą działy się tam, gdzie prompt uruchamia cały rój pracy. To będzie produktywne, kosztowne i niebezpiecznie łatwe do przecenienia. Czyli dokładnie takie, jak każda prawdziwa rewolucja w technologii.

Piotr Olszewski

ADMINISTRATOR

Entuzjasta technologii, od 5 lat śledzi rozwój sztucznej inteligencji. Specjalizuje się w modelach językowych i Midjourney.