„2025 będzie rokiem agentów AI” – krzyczały nagłówki na początku roku. Dziś, pod koniec 2025, możemy wreszcie zweryfikować te zapowiedzi. Spoiler: rzeczywistość okazała się znacznie bardziej… skomplikowana.
Obietnica: Rok Agentów
Na początku 2025 roku branża technologiczna była w ekstazy. 99% deweloperów budujących aplikacje AI dla przedsiębiorstw deklarowało, że eksploruje lub rozwija agentów AI, według badania IBM i Morning Consult. Jensen Huang z Nvidii ogłosił triumfalnie nadejście „ery agentycznej AI”, a prognozy były zawrotne.
Globalny rynek narzędzi agentycznej AI miał osiągnąć 10,41 miliarda dolarów w 2025 roku, notując wzrost CAGR na poziomie około 56,1%. Brzmiało to jak kolejna rewolucja technologiczna tuż za rogiem.
Forbes, Time, Reuters – wszyscy pisali o transformacji, która miała odmienić nasze życie zawodowe i prywatne. Autonomiczne agenty miały przejąć skomplikowane zadania, działać samodzielnie w zmieniających się środowiskach i stać się naszymi „wirtualnymi współpracownikami”.
Rzeczywistość: 70% porażek
A teraz brutalny powrót na ziemię. Najlepsze agenty AI obecnie zawodzą w około 70% przydzielonych im zadań, według badań Carnegie Mellon University. Tak, dobrze czytacie – siedemdziesiąt procent.
Szczegóły są jeszcze bardziej przygnębiające. OpenAI GPT-4o miał wskaźnik niepowodzeń na poziomie 91,4%, podczas gdy Meta Llama-3.1-405b notował porażki w 92,6% przypadków. Amazon Nova-Pro-v1 zawiódł w absurdalnych 98,3% zadań biurowych.
Nawet „najlepszy” w klasie Google Gemini 2.5 Pro radzi sobie z zaledwie 30% zadań do końca. Po sześciu miesiącach intensywnego rozwoju, wskaźnik sukcesu wzrósł… do 34%. „To trochę rozczarowujące, że ten benchmark nie został podjęty przez duże laboratoria. Może jest zbyt trudny i sprawia, że wyglądają źle” – komentuje z przekąsem Graham Neubig z CMU.
Gartner: „Agent washing” i masowe anulowania
Konsultanci z Gartnera są bezlitośni w swojej ocenie. Ponad 40% projektów agentycznej AI zostanie anulowanych do końca 2027 roku z powodu eskalujących kosztów, niejasnej wartości biznesowej lub nieadekwatnych kontroli ryzyka.
Co gorsza, większość tego, co sprzedaje się jako „agentyczna AI”, to zwykły marketing. Gartner szacuje, że tylko około 130 z tysięcy dostawców agentycznej AI jest prawdziwych. Reszta to „agent washing” – przeklejanie etykietek na stare chatboty i skrypty RPA.
Anushree Verma z Gartnera nie owija w bawełnę: „Większość projektów agentycznej AI to obecnie eksperymenty na wczesnym etapie lub proof of concepts, które są głównie napędzane hype’em i często źle zastosowane”.
Copilot Microsoftu: Sukces czy porażka?
Microsoft Copilot miał być sztandarowym przykładem sukcesu AI w przedsiębiorstwach. I rzeczywiście, liczby wyglądają imponująco: 77% wczesnych użytkowników w organizacjach korporacyjnych raportowało, że Copilot uczynił ich bardziej produktywnymi.
Ale diabeł tkwi w szczegółach. Według badania CNBC Technology Executive Council, choć 79% firm używa Copilota, tylko 50% respondentów stwierdziło, że ich organizacje podjęły decyzję o wdrożeniu technologii dla wszystkich pracowników, kolejne 17% zdecydowało się nie przyjmować w pełni Copilota, a jedna trzecia firm pozostaje w fazie testów.
Przy cenie 30 dolarów miesięcznie na użytkownika, wiele firm waha się przed pełnym wdrożeniem. Dla 10 000 pracowników to 3,6 miliona dolarów rocznie – niemała suma za narzędzie, którego ROI pozostaje niejasne.
Fiaska, które zapamiętamy
2024 i 2025 przyniosły nam całą galerię spektakularnych wpadek AI:
McDonald’s i 260 McNuggetsów: Po trzech latach współpracy z IBM, McDonald’s zakończył swój eksperyment z AI przyjmującym zamówienia w drive-thru. Jeden z wiralowych filmików na TikToku pokazywał dwóch klientów błagających AI, by przestało dodawać kolejne McNuggetsy do ich zamówienia, ostatecznie dochodząc do 260 sztuk.
Willy’s Chocolate Experience: Wydarzenie reklamowane fantastycznymi obrazami wygenerowanymi przez AI okazało się słabo udekorowanym magazynem. Setki ludzi w Dublinie wyszło na ulice na paradę halloweenową, która… nigdy nie istniała, bo była wymysłem AI generującego treści SEO.
Google AI Overviews: Sugerował dodawanie kleju do pizzy i jedzenie małych kamieni. Problem? Systemy AI nie potrafią odróżnić wiarygodnej historii z wiadomości od żartu na Reddicie.
Dlaczego agenci zawodzą?
Marina Danilevsky z IBM trafia w sedno: „Wciąż walczę z przekonaniem, że to naprawdę różni się od zwykłej orkiestracji. Zmieniliście nazwę orkiestracji, ale teraz nazywa się to agentami, bo to fajne słowo”.
Problem jest głębszy niż tylko nazewnictwo. Obecne modele językowe, mimo całego hype’u, po prostu nie rozumieją świata. Nie mają modeli przyczynowo-skutkowych, kontekstu ani zdolności do prawdziwego rozumowania. To, co robią, to statystyczne przewidywanie następnego tokenu – imponujące, ale fundamentalnie ograniczone.
Gary Marcus, krytyk AI, podsumowuje: „Porażka obecnych agentów w dostarczeniu trwałej wartości będzie kiedyś postrzegana jako bolesne odzwierciedlenie ogromnej pomyłki, intelektualnie i ekonomicznie: pomyłki inwestowania niemal wyłącznie w LLM-y jako rodzaj pełnej nadziei drogi na skróty”.
Co faktycznie działa?
Nie wszystko jest stracone. Niektóre wąskie zastosowania pokazują obietnicę:
- RAG (Retrieval-Augmented Generation): Dominuje z 51% adopcji, dramatyczny wzrost z 31% w zeszłym roku. To praktyczne podejście łączące modele językowe z bazami wiedzy.
- Asystenci kodowania: Częściowe sugestie kodu mogą być użyteczne, nawet jeśli nie są perfekcyjne. Programiści mogą je poprawić i dostosować.
- Automatyzacja prostych, powtarzalnych zadań: Tam gdzie margines błędu jest akceptowalny, a człowiek może zweryfikować wyniki.
Prognoza na przyszłość
Do 2029 roku agentyczna AI ma autonomicznie rozwiązywać 80% typowych problemów obsługi klienta bez interwencji człowieka, prowadząc do 30% redukcji kosztów operacyjnych – prognozuje Gartner. Ale czy to realistyczne?
Patrząc na obecne wskaźniki niepowodzeń i tempo postępu (wzrost z 30% do 34% sukcesu w ciągu sześciu miesięcy), te prognozy wydają się być mocno na wyrost.
Vyoma Gajjar z IBM oferuje bardziej wyważoną perspektywę: „Zdecydowanie widzę agentów AI zmierzających w tym kierunku, ale jeszcze tam nie jesteśmy. Budowanie agentów AI, które mogą autonomicznie radzić sobie ze złożonym podejmowaniem decyzji, wymaga więcej niż tylko lepszych algorytmów. Będziemy potrzebować dużych skoków w rozumowaniu kontekstowym i testowaniu przypadków brzegowych”.
Wnioski: Między hype’em a rzeczywistością
Rok 2025 nie był rokiem agentów AI – był rokiem zderzenia z rzeczywistością. Obietnice autonomicznych asystentów przejmujących nasze biura okazały się przedwczesne o co najmniej kilka lat, jeśli nie dekadę.
To nie znaczy, że AI nie ma wartości. Ma – ale w znacznie bardziej ograniczonym zakresie niż obiecywano. Zamiast rewolucyjnych agentów otrzymaliśmy ulepszone narzędzia wspomagające, które wymagają ciągłego nadzoru człowieka.
Być może najważniejszą lekcją z 2025 roku jest to, że w świecie AI marketing wyprzedził technologię o lata świetlne. Inwestycje w AI wzrosły do 131,5 miliarda dolarów w 2024, wzrost o 52% w porównaniu do 2023, ale zwrot z tych inwestycji pozostaje mglisty.
Jak podsumował to Jeremy Kahn z Fortune: prawdziwa transformacja wymaga nie tylko większych modeli i więcej danych, ale fundamentalnego przełomu w tym, jak AI rozumie i wchodzi w interakcje ze światem. Do tego czasu będziemy żyć w erze „prawie działających” agentów – fascynujących demonstracji, rozczarowujących wdrożeń i obietnic, że przełom jest tuż za rogiem.
Może w 2026? A może lepiej już przestańmy wierzyć w coroczne przepowiednie o „roku AI”. Bo jak pokazuje historia, jedyną pewną rzeczą w świecie sztucznej inteligencji jest to, że rzeczywistość zawsze okaże się bardziej skomplikowana niż najśmielsze prognozy.
Artykuł powstał na podstawie analizy najnowszych raportów branżowych, badań naukowych i danych z wdrożeń korporacyjnych AI w 2024-2025.