Skip to content
Premium

Modele sztucznej inteligencji jak nowe leki. Czy przed premierą będą musiały przechodzić testy bezpieczeństwa?

7 min read
Historia nowoczesności jest historią wynalazków, które najpierw zachwycały, a dopiero później nauczyliśmy się je kontrolować.

Najpotężniejsze modele sztucznej inteligencji coraz mniej przypominają zwykłe produkty cyfrowe. Są raczej jak substancje o nieznanym działaniu społecznym: mogą pomagać, uzdrawiać procesy, przyspieszać naukę i oszczędzać czas, ale w niewłaściwej dawce, w niewłaściwych rękach albo bez testów mogą przynieść skutki, których nie przewidzieli nawet ich twórcy.

Każda wielka technologia w końcu trafia na stół kontrolny

Historia nowoczesności jest historią wynalazków, które najpierw zachwycały, a dopiero później nauczyliśmy się je kontrolować. Samochód był wolnością, zanim stał się systemem przepisów, testów zderzeniowych, praw jazdy, ubezpieczeń i norm bezpieczeństwa. Lek był nadzieją, zanim stał się procedurą badań klinicznych, rejestracji, monitorowania skutków ubocznych i odpowiedzialności producenta. Samolot był cudem inżynierii, zanim stał się jedną z najbardziej regulowanych technologii świata.

Ze sztuczną inteligencją dzieje się coś podobnego, tylko szybciej. Przez pierwsze lata masowej fascynacji generatywnymi modelami językowymi dominował język zabawy i produktywności. Pisz szybciej. Twórz lepsze pomysły. Ucz się łatwiej. Programuj bez wysiłku. Zrób prezentację. Streść raport. Zaprojektuj kampanię. To był internetowy odpowiednik pierwszej jazdy samochodem po pustej drodze: zachwyt nad prędkością, zanim pojawi się świadomość wypadków.

Dziś do tej opowieści wchodzi drugie słowo: dopuszczenie. Czy najpotężniejsze modele powinny trafiać do ludzi tak po prostu, z dnia na dzień, po konferencji i efektownym filmie demonstracyjnym? Czy raczej powinny przechodzić niezależne testy, zanim ich zdolności zostaną udostępnione milionom użytkowników, firmom, państwom i potencjalnym przestępcom?

Dlaczego porównanie do leków wcale nie jest przesadą

Oczywiście model sztucznej inteligencji nie jest tabletką. Nie połykamy go, nie metabolizujemy, nie ma dawki w miligramach. Ale porównanie do leków działa na innym poziomie. Chodzi o technologię, która ma silny wpływ, jest trudna do oceny na pierwszy rzut oka i może ujawniać skutki uboczne dopiero po wdrożeniu na dużą skalę.

Lek testuje się nie tylko dlatego, że może nie działać. Testuje się go także dlatego, że może działać zbyt mocno, wchodzić w nieoczekiwane interakcje albo szkodzić szczególnym grupom ludzi. Podobnie model może być „dobry” w standardowych zadaniach, a jednocześnie niebezpieczny w scenariuszach granicznych. Może odpowiadać rozsądnie zwykłemu użytkownikowi, ale dawać ryzykowne wsparcie komuś, kto potrafi obejść zabezpieczenia. Może być pomocny w edukacji, a jednocześnie podatny na halucynacje w medycynie, prawie, finansach albo cyberbezpieczeństwie.

Największe ryzyko polega na tym, że testy robione przez samych producentów nie zawsze wystarczą. Firmy mają interes w tym, aby model wyglądał dobrze, działał szybko, zachwycał na pokazie i jak najszybciej wszedł na rynek. Państwo, społeczeństwo i użytkownicy mają trochę inny interes: chcą wiedzieć, co stanie się w mniej wygodnych scenariuszach.

Frontier models to nie zwykłe chatboty

Najpotężniejsze modele, często nazywane modelami granicznymi, różnią się od zwykłych narzędzi tym, że ich pełne możliwości nie są łatwe do opisania listą funkcji. To nie jest program, który robi jedną rzecz. To system, który potrafi pisać, analizować, kodować, planować, tłumaczyć, streszczać, wykrywać wzorce, pracować z obrazem, a coraz częściej również korzystać z narzędzi i wykonywać sekwencje działań.

W praktyce oznacza to, że jeden model może być asystentem lekarza, copywriterem, korepetytorem, analitykiem cyberbezpieczeństwa, doradcą prawnym, planistą kampanii, konsultantem biznesowym i operatorem narzędzi. To ogromna siła. Ale właśnie dlatego klasyczne pytanie „czy produkt jest bezpieczny?” staje się za małe. Trzeba pytać: bezpieczny dla kogo, w jakim kontekście, z jakimi narzędziami, przy jakiej wiedzy użytkownika i przy jakim poziomie presji?

To przypomina testowanie nie samego silnika, ale całego pojazdu w różnych warunkach: na mokrej drodze, przy awaryjnym hamowaniu, z niedoświadczonym kierowcą, po latach używania i przy próbie nadużycia. Model, który wygląda stabilnie w laboratorium, może zachowywać się inaczej w świecie pełnym manipulacji, złych intencji i nieprzewidzianych zastosowań.

Test przed premierą nie musi być cenzurą

Branża technologiczna bardzo często reaguje alergicznie na słowo „regulacja”. W jej języku brzmi ono jak spowolnienie, kara za innowacyjność i prezent dla konkurencji z krajów, które nie przejmują się zasadami. To zrozumiały lęk, ale nie zawsze uczciwy. Test bezpieczeństwa nie musi oznaczać zakazu. Może oznaczać wiedzę.

Jeżeli państwowe lub niezależne laboratorium dostaje dostęp do modelu przed premierą, może sprawdzić, czy system potrafi pomagać w tworzeniu złośliwego kodu, planowaniu ataków, omijaniu procedur, generowaniu przekonującej dezinformacji albo wykonywaniu długich zadań bez nadzoru. Celem nie musi być natychmiastowe zablokowanie produktu. Celem może być wskazanie obszarów, które wymagają zabezpieczeń, monitoringu, ograniczeń lub dodatkowych ostrzeżeń.

Najlepsze firmy również powinny tego chcieć. Jeżeli model jest naprawdę potężny, jego błędy mogą uderzyć w reputację twórców mocniej niż opóźniona premiera. Historia technologii zna wiele przypadków, w których presja wyścigu doprowadziła do wypuszczenia produktu zbyt wcześnie. W sztucznej inteligencji taki błąd może mieć skalę globalną.

Problemem jest także to, kto testuje testerów

Sam pomysł testowania modeli brzmi rozsądnie, ale natychmiast rodzi kolejne pytanie: kto ma prawo oceniać tak potężne systemy? Państwo? Niezależne instytuty? Konsorcja naukowe? Organizacje międzynarodowe? A może konkurencyjne firmy? Każda odpowiedź ma wadę.

Państwo może mieć zasoby i dostęp do informacji o bezpieczeństwie narodowym, ale może też działać politycznie. Firmy mają najlepszą wiedzę techniczną, ale są zainteresowane własnym sukcesem. Organizacje akademickie mogą być niezależne, ale często nie mają dostępu do pełnych modeli ani mocy obliczeniowej. Instytucje międzynarodowe mogłyby tworzyć standardy, lecz działają wolniej niż branża.

Dlatego najprawdopodobniej powstanie model mieszany. Firmy będą prowadzić własne testy. Państwo będzie wymagać dostępu do najważniejszych modeli. Naukowcy i organizacje społeczne będą próbować naciskać na przejrzystość. A użytkownicy i media będą rozliczać najbardziej spektakularne porażki. To nie będzie elegancki system. Bardziej przypominać będzie improwizowaną kontrolę nad technologią, która rozwija się szybciej niż prawo.

Najtrudniejsze będą nie awarie, lecz zdolności

W przypadku wielu technologii boimy się głównie awarii. Samolot ma nie spaść. Lek ma nie zaszkodzić. Most ma się nie zawalić. W przypadku najpotężniejszych modeli problem jest subtelniejszy: one mogą być niebezpieczne nie dlatego, że zawodzą, lecz dlatego, że działają zbyt dobrze.

Model, który świetnie tłumaczy trudne zagadnienia biologiczne, może pomagać naukowcom i lekarzom. Ten sam typ zdolności, w niewłaściwym scenariuszu, może wspierać kogoś zainteresowanego szkodliwą wiedzą. Model, który analizuje kod i znajduje błędy, może naprawiać oprogramowanie. Może też pomagać w ataku. Model, który rozumie psychologię odbiorcy, może poprawiać edukację. Może też tworzyć bardzo skuteczną manipulację.

To odwraca klasyczną logikę bezpieczeństwa. Nie wystarczy zapytać, czy model mówi bzdury. Trzeba zapytać, czy w pewnych obszarach mówi zbyt dużo, zbyt precyzyjnie i zbyt skutecznie. Właśnie dlatego najpoważniejsze testy nie mogą ograniczać się do sprawdzania halucynacji. Muszą sprawdzać kompetencje.

Świat nie zatrzyma tej technologii, więc musi nauczyć się ją dawkować

Nie ma realnego scenariusza, w którym rozwój modeli granicznych zostaje po prostu zamrożony. Zbyt dużo pieniędzy, prestiżu, infrastruktury i ambicji państwowych jest już zaangażowanych w ten wyścig. USA nie chcą oddać pola Chinom. Chiny nie chcą polegać na zachodnich modelach. Europa chce chronić obywateli, ale jednocześnie boi się technologicznej peryferyjności. Firmy chcą przychodów, inwestorzy chcą wzrostu, użytkownicy chcą coraz lepszych narzędzi.

Skoro nie da się łatwo zatrzymać tej fali, trzeba nauczyć się nią zarządzać. To oznacza testy przed premierą, klasyfikację ryzyka, ograniczony dostęp do najbardziej niebezpiecznych zdolności, przejrzyste raporty, procedury reagowania i odpowiedzialność za skutki wdrożeń. Brzmi nudno. Ale właśnie takie nudne mechanizmy odróżniają cywilizację techniczną od eksperymentu na żywym organizmie społecznym.

Najważniejsze pytanie: czy będziemy mądrzejsi przed katastrofą?

Wiele regulacji powstawało dopiero po tragedii. Katastrofa pokazywała, że dotychczasowe standardy były za słabe, a społeczeństwo dopiero wtedy akceptowało ostrzejsze przepisy. W przypadku sztucznej inteligencji stawką jest to, czy uda się zrobić coś rzadkiego: zbudować poważne testy zanim wydarzy się coś naprawdę poważnego.

Porównanie modeli do leków jest więc nie tyle techniczną analogią, ile ostrzeżeniem. Nie wszystko, co działa, powinno natychmiast trafić do masowego użytku. Nie wszystko, co imponuje na pokazie, jest gotowe na kontakt z milionami ludzi. Nie wszystko, co przynosi firmie przewagę, jest bezpieczne dla świata.

Modele sztucznej inteligencji będą coraz silniejsze. To zdanie nie jest już futurologią, lecz roboczym założeniem państw, firm i inwestorów. Pytanie brzmi, czy równie szybko będą dojrzewały instytucje, które potrafią je badać. Bo jeśli nie, będziemy w sytuacji, w której najpierw wypuszczamy substancję do krwiobiegu cywilizacji, a dopiero potem sprawdzamy ulotkę.

Piotr Olszewski

ADMINISTRATOR

Entuzjasta technologii, od 5 lat śledzi rozwój sztucznej inteligencji. Specjalizuje się w modelach językowych i Midjourney.