Skip to content
Premium

Sztuczna inteligencja, która wykrywa luki w kodzie lepiej niż hakerzy. Biały Dom nagle zrozumiał, że deregulacja może być ryzykowna

7 min read
Najbardziej niepokojące w najnowszej fazie rozwoju sztucznej inteligencji jest to, że dotyczy ona nie abstrakcyjnego „myślenia”, lecz bardzo konkretnych, praktycznych umiejętności.

Jeszcze niedawno opowieść o sztucznej inteligencji w USA była prosta: mniej regulacji, więcej innowacji, szybciej do przodu. Problem w tym, że najpotężniejsze modele przestały być tylko narzędziami do pisania maili i streszczania dokumentów. Coraz częściej wyglądają jak systemy, które mogą znaleźć słabość tam, gdzie człowiek jej nie zauważył: w kodzie, infrastrukturze, procedurach i cyfrowych nerwach państwa.

Najpierw miała być produktywność. Potem pojawił się kod

Najbardziej niepokojące w najnowszej fazie rozwoju sztucznej inteligencji jest to, że dotyczy ona nie abstrakcyjnego „myślenia”, lecz bardzo konkretnych, praktycznych umiejętności. Modele nie tylko piszą teksty, tworzą obrazki i pomagają w analizie dokumentów. Coraz lepiej rozumieją kod. Potrafią go czytać, streszczać, poprawiać, przepisywać, testować i szukać w nim miejsc, które dla człowieka byłyby nudne, ukryte albo po prostu zbyt obszerne do przejrzenia.

Dla firm to brzmi jak błogosławieństwo. Każdy zespół technologiczny zna problem długu technicznego, starych bibliotek, zapomnianych funkcji, szybkich łatek i fragmentów systemu, których nikt nie dotyka, bo „działają”. Model, który potrafi analizować ogromne repozytoria kodu, może przyspieszyć audyty, wyłapać błędy logiczne, podpowiedzieć poprawki i zmniejszyć liczbę podatności. W idealnej wersji jest to cyfrowy inspektor bezpieczeństwa, który nie śpi, nie nudzi się i nie przewija wzrokiem monotonnego pliku konfiguracyjnego.

Ale ta sama cecha ma drugą stronę. Jeśli sztuczna inteligencja umie znajdować luki, może robić to także dla ludzi, którzy nie chcą ich naprawiać. Może pomagać w rekonesansie. Może analizować publiczne projekty, dokumentację, zależności i błędy konfiguracji. Może budować listę potencjalnych punktów wejścia szybciej niż zespół początkujących hakerów. Im bardziej rośnie jej zdolność do planowania, łączenia faktów i wykonywania wieloetapowych zadań, tym mniej przypomina narzędzie biurowe, a bardziej przypomina silnik operacyjny.

Nowa generacja zagrożeń nie wygląda jak film o hakerach

Popkultura przyzwyczaiła nas do obrazu hakera jako samotnej postaci w kapturze, siedzącej w ciemnym pokoju i włamującej się do systemu przez migający terminal. Tymczasem najbardziej realistyczny obraz nadchodzącej cyberwojny jest dużo mniej efektowny. To setki automatycznych analiz, miliony linii kodu, zależności oprogramowania, błędne uprawnienia, źle zabezpieczone interfejsy API, skrypty administracyjne, formularze, logi, repozytoria i dokumentacje techniczne. Atak nie zawsze zaczyna się od spektakularnego przełamania zabezpieczeń. Czasem zaczyna się od cierpliwego znalezienia jednego miejsca, w którym ktoś popełnił mały błąd.

Właśnie dlatego sztuczna inteligencja jest tak ważna. Nie musi „myśleć jak geniusz”, żeby zmienić krajobraz cyberbezpieczeństwa. Wystarczy, że będzie bezwzględnie szybka, cierpliwa i dobra w łączeniu wzorców. System, który potrafi przeczytać dokumentację, napisać test, uruchomić symulację i zasugerować exploita, nie musi mieć złych intencji. Wystarczy, że dostanie zły cel.

Najgroźniejsza nie jest więc wizja modelu, który sam z siebie postanawia zaatakować bank albo elektrownię. Dużo bardziej prawdopodobny jest scenariusz prozaiczny: ktoś używa go jako bardzo wydajnego asystenta do pracy, którą kiedyś trzeba było wykonywać ręcznie. Dawniej atakujący musiał mieć wiedzę, czas i zespół. Jutro część tej przewagi może dostać w interfejsie czatu.

Rząd odkrywa, że dobrowolne testy to za mało lub prawie za mało

Dlatego rośnie znaczenie państwowych testów najpotężniejszych modeli przed ich publicznym wypuszczeniem. W USA kluczową rolę odgrywa dziś Center for AI Standards and Innovation, czyli instytucja działająca przy NIST. Jej zadaniem jest ocena najnowszych systemów pod kątem zdolności, które mogą mieć znaczenie dla bezpieczeństwa narodowego: cyberataków, biozagrożeń, chemii, manipulacji, autonomicznego planowania i ogólnej skali ryzyka.

Sam fakt, że najwięksi gracze mają dopuszczać rządowych testerów do modeli przed ich premierą, jest symbolicznym przesunięciem. Jeszcze niedawno branża próbowała sprzedawać opinię, że wystarczy samoregulacja, wewnętrzne zespoły bezpieczeństwa i trochę dobrych praktyk. Teraz sytuacja wygląda inaczej. Modele są zbyt ważne, aby państwo mogło powiedzieć: ufamy laboratoriom, że same ocenią skutki własnej pracy.

To nie jest jeszcze pełna regulacja w stylu dopuszczania leków do obrotu. To raczej początek hybrydowego modelu: firmy nadal rozwijają technologię, ale państwo chce wcześniej zobaczyć, co naprawdę potrafią najnowsze systemy. Szczególnie istotne jest to, że testy często wymagają wersji modeli z ograniczonymi lub zdjętymi zabezpieczeniami. Dopiero wtedy można sprawdzić, jakie są realne zdolności, a nie tylko to, co model zgadza się pokazać zwykłemu użytkownikowi.

Deregulacja brzmi dobrze, dopóki nie zacznie dotyczyć broni cyfrowej

Politycznie to niewygodne. Hasło deregulacji jest proste, atrakcyjne i dobrze brzmi w epoce globalnego wyścigu technologicznego. Amerykańskie firmy mają konkurować z Chinami, startupy mają budować szybciej, laboratoria mają nie bać się biurokracji, a administracja ma nie przeszkadzać. Problem w tym, że sztuczna inteligencja nie jest kolejną aplikacją do zamawiania jedzenia.

Jeśli model potrafi projektować kampanie dezinformacyjne, wspierać cyberataki, analizować kod infrastruktury krytycznej albo pomagać w obejściu zabezpieczeń, przestaje być wyłącznie produktem. Staje się elementem bezpieczeństwa narodowego. A wtedy pytanie nie brzmi już: jak nie hamować innowacji? Pytanie brzmi: jak nie wypuścić na rynek czegoś, czego skutków nie rozumiemy?

To napięcie będzie jednym z najważniejszych sporów kolejnych lat. Dolina Krzemowa będzie przekonywać, że zbyt mocna kontrola zabije konkurencyjność. Urzędnicy będą odpowiadać, że zbyt słaba kontrola może stworzyć narzędzie, którego nikt nie będzie umiał zatrzymać. Obie strony mają częściowo rację. I właśnie dlatego ten spór jest tak trudny.

Największy problem: testowanie inteligencji, która się wymyka

Tradycyjne testy bezpieczeństwa zakładają, że produkt ma dość stabilne właściwości. Samochód hamuje albo nie hamuje. Lek działa albo powoduje skutki uboczne. System informatyczny spełnia określone wymogi albo ich nie spełnia. Modele sztucznej inteligencji są bardziej kłopotliwe. Potrafią reagować inaczej w zależności od kontekstu, promptu, narzędzi, dostępu do internetu, pamięci, dodatkowych modułów i tego, czy działają samodzielnie, czy jako część większego systemu agentowego.

Model może przejść prosty test bezpieczeństwa, a potem zachować się inaczej w rękach użytkownika, który potrafi go obejść. Może odmówić odpowiedzi w jednym scenariuszu, ale dać niebezpieczną podpowiedź w innym. Może nie napisać instrukcji ataku wprost, ale pomóc w tysiącu drobnych zadań, które razem prowadzą do tego samego celu. To jest właśnie problem emergencji: nie zawsze widać ryzyko, gdy patrzy się na pojedynczą odpowiedź.

Dlatego testowanie takich modeli musi przypominać nie tyle egzamin, ile symulację świata. Trzeba sprawdzać je w długich zadaniach, z narzędziami, pod presją, w scenariuszach oszustwa, w warunkach ograniczonej informacji i przy próbach manipulacji. Innymi słowy: trzeba traktować je nie jak kalkulator, ale jak potencjalnego aktora w systemie.

Cyberbezpieczeństwo stanie się wyścigiem modeli

Najbardziej prawdopodobny scenariusz nie polega na tym, że sztuczna inteligencja zniszczy cyberbezpieczeństwo. Raczej zmieni jego tempo. Dobre zespoły obronne będą używać modeli do wykrywania podatności, automatycznego monitoringu, analizy incydentów, pisania reguł, streszczania logów i szybszego reagowania. Złe grupy będą używać tych samych klas narzędzi do rekonesansu, phishingu, tworzenia exploitów i skalowania ataków.

W efekcie nie wygra ten, kto „ma sztuczną inteligencję”. Będą ją mieli wszyscy. Wygra ten, kto lepiej połączy modele z procedurami, infrastrukturą i ludźmi. Firma, która kupi najdroższy model, ale nadal będzie miała chaos w uprawnieniach i nieaktualne systemy, pozostanie łatwym celem. Państwo, które ogłosi strategię AI, ale nie stworzy realnych testów, audytów i zespołów reagowania, będzie tylko produkować dokumenty.

To dlatego najnowsze ruchy amerykańskich instytucji są tak ważne. Pokazują, że debata o sztucznej inteligencji zaczyna dojrzewać. Mniej w niej zachwytu nad chatbotem piszącym wiersz, więcej pytań o to, co stanie się, gdy podobna technologia dostanie dostęp do kodu, narzędzi i infrastruktury.

Najuczciwszy wniosek: nie trzeba panikować, ale nie wolno spać

Nie każdy model jest cyberbronią. Nie każda funkcja analizy kodu jest zagrożeniem. Nie każdy użytkownik z asystentem AI staje się hakerem. Ale skala zmiany jest zbyt duża, aby udawać, że mamy do czynienia tylko z kolejnym etapem automatyzacji biura.

Sztuczna inteligencja wchodzi w obszar, w którym błąd może kosztować nie utratę wygody, lecz realne bezpieczeństwo: firm, szpitali, sieci energetycznych, administracji, wojska i zwykłych obywateli. Jeżeli najpotężniejsze modele są w stanie znajdować luki lepiej niż większość ludzi, to państwo musi wiedzieć, jak dobrze to robią, zanim trafią do powszechnego obiegu.

Największym błędem byłaby wiara, że rynek sam wszystko naprawi. Drugim największym błędem byłaby regulacja tak ślepa, że udusi pożyteczne zastosowania. Między tymi skrajnościami zaczyna się prawdziwa polityka sztucznej inteligencji: nudna, techniczna, pełna testów, audytów, wyjątków i sporów o szczegóły.

To może być mniej efektowne niż opowieść o buncie maszyn. Ale właśnie tam rozstrzygnie się przyszłość cyberbezpieczeństwa. Nie w momencie, gdy model odpowie na pytanie w czacie, lecz w momencie, gdy ktoś użyje go do znalezienia błędu, którego nikt inny nie widział.

Piotr Olszewski

ADMINISTRATOR

Entuzjasta technologii, od 5 lat śledzi rozwój sztucznej inteligencji. Specjalizuje się w modelach językowych i Midjourney.