GOOGLE GEMINI AI PRO - VOUCHER NA 18 MIESIĘCY 50% TANIEJ DO PIĄTKU Z TYM KODEM ➡️ MAJUFKA GEMINI AI PRO: 50% taniej z kodem MAJUFKA SPRAWDŹ 🔥SPRAWDŹ
Skip to content
Premium

Robot pokonujący ludzi w ping-ponga pokazuje, dlaczego fizyczna AI jest trudniejsza niż ChatGPT

Sony AI pokazało robota grającego w tenisa stołowego na poziomie, który jeszcze niedawno wydawał się demonstracją z przyszłości. To ważniejszy sygnał dla robotyki niż kolejny chatbot.

4 min read
Dwa robotyczne ramiona i mała piłka między nimi przypominają, że świat fizyczny nie wybacza halucynacji.

ChatGPT przekonał świat, że sztuczna inteligencja może stać się powszechna z dnia na dzień. Wystarczyło okno tekstowe, kilka zdań i poczucie, że komputer odpowiada jak ktoś po drugiej stronie rozmowy. Robotyka nie miała jeszcze takiego momentu. Każdy film z robotem budzi emocje, ale też sceptycyzm: czy to działa poza laboratorium, czy tylko w idealnych warunkach? Najnowsze pokazy robota Sony AI grającego w tenisa stołowego są ważne, bo dotyczą jednego z najtrudniejszych testów dla fizycznej AI: szybkiego, nieprzewidywalnego świata.

Według relacji z kwietnia robotyczne ramię Sony, określane jako Ace, potrafiło rywalizować z bardzo dobrymi graczami. Maszyna korzysta z wielu kamer rozmieszczonych wokół stołu, śledzi ruch piłki, a nawet jej logo, aby oceniać rotację. Uczyła się przy użyciu metod reinforcement learning, czyli uczenia przez wzmacnianie. To brzmi jak sportowa ciekawostka, ale w rzeczywistości jest małym laboratorium przyszłych robotów.

Piłeczka jest trudniejsza niż akapit

Model językowy może wygenerować błędne zdanie i poprawić się w kolejnej odpowiedzi. Robot nie ma takiego luksusu. Jeśli źle oceni trajektorię, piłka minie rakietkę. Jeśli spóźni ruch, nie będzie drugiej wersji. Jeśli źle zinterpretuje rotację, odbicie poleci w siatkę. Świat fizyczny jest bezlitosny, bo błędy mają natychmiastowe konsekwencje.

Tenis stołowy wymaga przewidywania trajektorii w ułamkach sekund, koordynacji ruchu, adaptacji do stylu przeciwnika i pracy z obiektem, który zmienia prędkość oraz rotację po każdym odbiciu. Człowiek robi to intuicyjnie, bo ciało przez lata uczyło się świata. Robot musi tę intuicję zbudować z danych, kamer, modeli i sterowania.

Dlaczego to nie jest tylko sport

Jeśli robot potrafi reagować na szybką piłkę, może w przyszłości lepiej radzić sobie z zadaniami w magazynie, fabryce, kuchni, szpitalu albo domu. W takich miejscach obiekty też się przesuwają, spadają, odbijają, są częściowo zasłonięte i zachowują się nieidealnie. Robot pracujący obok człowieka musi nie tylko wykonywać zaprogramowane ruchy, ale przewidywać, co wydarzy się za chwilę.

Tenis stołowy jest więc elegancką demonstracją robotycznej percepcji. Pokazuje, czy maszyna widzi wystarczająco szybko, czy potrafi planować ruch i czy uczy się na błędach. Nie chodzi o to, że roboty zastąpią sportowców. Chodzi o to, że sport staje się testem sterowania w świecie, którego nie można całkowicie przewidzieć.

Roboty nadal są daleko od ChatGPT

Największa różnica między chatbotem a robotem to skalowanie. Chatbota można udostępnić milionom ludzi przez serwery. Robot wymaga sprzętu, produkcji, napraw, bezpieczeństwa, energii, certyfikacji i fizycznej obecności. Dlatego robotyka rozwija się wolniej, nawet jeśli algorytmy robią szybkie postępy.

Dochodzi jeszcze kwestia zaufania. Gdy chatbot napisze głupotę, użytkownik może się zirytować. Gdy robot źle złapie przedmiot albo uderzy ramieniem, problem jest poważniejszy. Fizyczna AI musi być nie tylko inteligentna, ale też przewidywalna i bezpieczna. To znacznie trudniejsza kombinacja niż elokwentna odpowiedź na ekranie.

Uczenie przez wzmacnianie wraca do centrum

Pokaz Sony dobrze pasuje do szerszego trendu: powrotu zainteresowania systemami, które uczą się przez działanie. Modele językowe zdominowały debatę, ale robotyka wymaga innych kompetencji. Tu liczy się doświadczenie, symulacja, iteracja i ocena skutków. Robot musi próbować, przegrywać, poprawiać ruch i budować strategie.

To zbliża robotykę do tradycji AlphaGo bardziej niż do tradycji ChatGPT. W grze, sporcie i ruchu nie wystarczy przewidzieć kolejne słowo. Trzeba przewidzieć konsekwencję działania. Właśnie dlatego tenis stołowy jest tak dobrym symbolem fizycznej AI.

Moment ChatGPT dla robotów będzie cichszy

Możliwe, że roboty nie będą miały jednego spektakularnego momentu jak ChatGPT. Ich przełom może przyjść stopniowo: najpierw lepsze ramiona w fabrykach, potem bardziej elastyczne roboty magazynowe, później maszyny usługowe i domowe. Każda z nich będzie mniej efektowna niż chatbot w mediach społecznościowych, ale bardziej namacalna.

Robot grający w ping-ponga pokazuje, że AI zaczyna wychodzić z tekstu do ruchu. To jest znacznie trudniejsza droga, ale potencjalnie większa rewolucja. Bo kiedy sztuczna inteligencja przestanie tylko pisać o świecie, a zacznie działać w świecie, zmieni nie tylko biurka i przeglądarki. Zmieni pracę fizyczną.

Piotr Olszewski

ADMINISTRATOR

Entuzjasta technologii, od 5 lat śledzi rozwój sztucznej inteligencji. Specjalizuje się w modelach językowych i Midjourney.