GOOGLE GEMINI AI PRO - VOUCHER NA 18 MIESIĘCY 50% TANIEJ DO PIĄTKU Z TYM KODEM ➡️ MAJUFKA GEMINI AI PRO: 50% taniej z kodem MAJUFKA SPRAWDŹ 🔥SPRAWDŹ
Skip to content
Premium

David Silver po AlphaGo buduje „superlearners”. To krytyka AI, która tylko czyta internet i udaje rozumienie

Człowiek stojący za AlphaGo uważa, że obecna fala modeli językowych nie wystarczy. Jego nowa firma ma postawić na uczenie przez działanie, symulację i konsekwencje.

4 min read
Kręgi wokół jednego układu scalonego pokazują inną wizję AI: mniej przewidywania słów, więcej uczenia się przez działanie.

David Silver ma w świecie sztucznej inteligencji status człowieka, który pokazał przyszłość zanim przyszłość stała się produktem masowym. AlphaGo, projekt Google DeepMind, nie zachwycił ludzi elokwencją, tylko obcą skutecznością. Pokonał najlepszych graczy w go, wykonując ruchy, które dla ekspertów wyglądały nienaturalnie, a okazywały się genialne. Teraz Silver wraca z tezą, że dzisiejsza AI może iść zbyt wąską drogą. Zamiast kolejnych modeli karmionych internetem proponuje systemy, które uczą się przez działanie.

Według WIRED jego nowa firma Ineffable Intelligence ma pracować nad „superlearners”, czyli systemami zdolnymi do samodzielnego uczenia się strategii przez symulacje, eksperymenty i konsekwencje. To ważna różnica. Dzisiejsze modele językowe są niezwykle użyteczne, ale ich podstawową umiejętnością jest przewidywanie kolejnych fragmentów języka. Silver przypomina, że inteligencja nie musi zaczynać się od zdania. Może zaczynać się od ruchu, próby i błędu.

AlphaGo nie wygrało dzięki czytaniu

Historia AlphaGo jest wciąż jednym z najlepszych argumentów za inną drogą rozwoju AI. System nie stał się wybitny dlatego, że przeczytał wszystkie komentarze o go i nauczył się stylu mistrzów. Kluczowe było uczenie przez wzmacnianie, samodzielna gra, symulacja i ocena skutków decyzji. AlphaGo potrafiło odkrywać strategie, których ludzie wcześniej nie traktowali poważnie, bo nie musiało myśleć w ludzkich nawykach.

To kontrastuje z dzisiejszą dominacją modeli językowych. Chatbot może brzmieć genialnie, ale często opiera się na śladach cudzych wypowiedzi. Potrafi złożyć informacje, wyjaśnić pojęcie, napisać kod i streścić dokument. Nie znaczy to jednak automatycznie, że rozumie świat w sposób aktywny. Silver sugeruje, że prawdziwie przełomowa AI będzie musiała uczyć się jak gracz, badacz albo robot, a nie tylko jak czytelnik.

Superuczenie kontra wielkie papugowanie

To nie jest prosta krytyka ChatGPT czy Claude’a. Modele językowe są ogromnym osiągnięciem i bez nich nie byłoby obecnego boomu. Problem polega na tym, że rynek zaczął utożsamiać inteligencję z płynną rozmową. Jeśli system odpowiada pewnym tonem, używa dobrych metafor i potrafi napisać kod, bardzo łatwo uznać, że jesteśmy blisko czegoś ogólnego.

Silver mówi raczej: język jest ważny, ale nie wystarczy. Systemy, które mają odkrywać nowe leki, projektować materiały, sterować robotami, optymalizować energię albo planować złożone strategie, muszą testować hipotezy w środowisku. Muszą mieć sposób zdobywania doświadczenia, nie tylko przetwarzania tego, co ludzie już zapisali.

Dlaczego inwestorzy płacą za alternatywną drogę

Według doniesień Ineffable Intelligence przyciąga kapitał na poziomie typowym raczej dla największych laboratoriów niż młodych startupów. To pokazuje, że rynek zaczyna szukać dróg poza skalowaniem modeli językowych. Coraz więcej osób pyta, czy dodawanie danych i mocy obliczeniowej wystarczy, czy raczej dochodzimy do punktu, w którym potrzebny jest inny mechanizm uczenia.

Uczenie przez wzmacnianie ma swoje problemy: jest kosztowne, trudne, często wymaga symulacji i starannego projektowania środowisk. Ale ma jedną ogromną zaletę. Pozwala systemowi zdobywać kompetencję przez konsekwencje. W świecie, w którym wiele najważniejszych problemów nie ma gotowych odpowiedzi w internecie, to może być przewaga fundamentalna.

Robotyka, nauka i świat poza ekranem

Najbardziej oczywiste zastosowania tej filozofii widać w robotyce. Robot nie może tylko przeczytać instrukcji podnoszenia kubka. Musi nauczyć się siły, kąta, tarcia, ryzyka upuszczenia i zachowania przedmiotu. Podobnie w nauce: model może przeczytać artykuły o białkach, ale odkrycie nowej strategii wymaga eksperymentu, nawet jeśli najpierw będzie to eksperyment w symulacji.

To dlatego koncepcja superlearners jest tak ważna. Może oznaczać AI mniej efektowną dla zwykłego użytkownika niż chatbot, ale potencjalnie bardziej przełomową dla nauki i przemysłu. Nie będzie pisała zabawnych odpowiedzi. Będzie uczyła się, jak wygrywać w środowiskach, których człowiek nie potrafi w pełni opisać.

Najciekawsza przyszłość połączy obie drogi

Najbardziej prawdopodobny scenariusz nie polega na tym, że modele językowe znikną. Raczej staną się interfejsem do systemów głębszego uczenia. Człowiek będzie rozmawiał z modelem, ale za tą rozmową mogą działać mechanizmy symulacji, planowania, testowania i samodzielnego doskonalenia. Język będzie twarzą AI, a uczenie przez działanie jej silnikiem.

Silver przypomina branży coś niewygodnego: inteligencja, która tylko dobrze mówi, może być zbyt ludzka w najgorszym sensie. Powtarza nasze ślady, nasze dane i nasze ograniczenia. Prawdziwy przełom może nadejść z systemów, które nie będą brzmiały jak człowiek, ale będą potrafiły odkrywać skuteczne strategie w sposób, którego człowiek wcześniej nie widział.

Piotr Olszewski

ADMINISTRATOR

Entuzjasta technologii, od 5 lat śledzi rozwój sztucznej inteligencji. Specjalizuje się w modelach językowych i Midjourney.