Patrząc na rozwój sztucznej inteligencji, można mieć wrażenie, że jest to technologia, która za jakiś czas całkowicie wywróci nasze życie do góry nogami. Wiele osób postrzega ją jako realne zagrożenie dla ich pracy, która może z jakiś czas zostać po prostu zautomatyzowana. Nie jest to oczywiście myślenie całkowicie pozbawione sensu.
Jakiś czas temu aktualny dyrektor generalny NVIDII — Jensen Huang — przyznał, że jego celem jest wprowadzenie nawet 100 milionów takich asystentów opartych o AI. Dzięki temu praca ma być wydajniejsza, bo ludzie nie będą skupiać się na rutynowych i często jałowych zajęciach. Brzmi to ciekawie, ale nie tylko on ma takie ambicje.
Z bardzo podobnym pomysłem wystąpiła ostatnio firma Anthropic, która zaprezentowała coś równie interesującego. Tym razem mowa o asystentach, którzy byliby częścią naszych komputerów i odwalali za nas całą „brudną robotę”. Jak to dokładnie miałoby działać?
Model Claude od Anthropic jako narzędzie do sterowania naszym komputerem

Kilka dni temu firma Anthropic ogłosiła oficjalnie, że udało się jej osiągnąć coś naprawdę wyjątkowego. Zgodnie z tym, co zostało przedstawione, najnowsza wersja ich modelu AI nazywanego Claude została przystosowana do wykonywania szeregu czynności na komputerze. Na pierwszy rzut oka nie jest to nic nadzwyczajnego, ale drzemie w tym spory potencjał.
Mowa dokładnie o otwieraniu przeglądarek, wyszukiwania rzeczy w internecie czy wprowadzania danych za pomocą myszy i klawiatury. Faktycznie więc są to bardzo podstawowe rzeczy, jednak już na tym etapie są wystarczające do tego, aby ów model znacząco zwiększył swoją użyteczność.
Podczas specjalnej demonstracji przygotowanej dla redakcji Wired, przedstawiono nowe możliwości Claude'a. Dla przykładu poproszono ów model o zaplanowanie wycieczki tak, aby móc obejrzeć zachód słońca na moście Golden Gate w San Francisco.

Efekt? Claude wyszukał za pomocą przeglądarki Chrome odpowiednie informacje (nawet idealnie miejsce na oglądanie zachodu), a następnie otworzył aplikację Kalendarz, zaplanował wydarzenie i udostępnił je osobie, która na ów wycieczkę została zaproszona.
Drugim wyzwaniem było zbudowanie prostej witryny internetowej, będącej jednocześnie miejscem promocji tego modelu. Z tym zadaniem model także sobie poradził, korzystając przy tym z Visual Studio Code od Microsoftu. Pewnym mankamentem jednak okazało się to, że strona początkowo zbyt mocno stylizowana była na lata 90. XX wieku.
Co ciekawe, kiedy poproszono model o poprawienie błędów, które się pojawiły, ten wrócił do edytora kodu, znalazł odpowiednie bugi i je skasował. W ten oto sposób AI stworzyło samo dla siebie stronę internetową bez większej ingerencji programistycznej ze strony człowieka.
Claude wielką nadzieją automatyzacji prac biurowych?
Dyrektor ds. nauki w Anthropic i profesor nadzwyczajny w Johns Hopkins Uniwersytet — Jared Kaplan — stwierdził, że w ten właśnie sposób wkraczamy nowy etap rozwoju AI. Dzięki ich innowacji modele mogą korzystać ze wszystkich narzędzi cyfrowych dostępnych człowiekowi i tym samym znacząco ułatwiać mu pracę.
Inny z przedstawicieli przedsiębiorstwa — Mike Krieger — zdradził, że całe przedsiębiorstwo ma nadzieję, iż agenci oparci o AI z czasem zautomatyzują pewne rutynowe zadania. Ma to oczywiście przełożyć się na większą produktywność ludzi, mogących skupić się na czymś bardziej wymagającym. Sam zainteresowany wyznał, że w sytuacji, w której model AI odwalałby za niego „brudną robotę”, on poszedłby pograć na gitarze.
Wedle informacji przekazanych przez firmę już teraz kilka innych przedsiębiorstw testuje omawiany model w celach badania automatyzacji. Wymieniono tutaj konkretnie zastosowanie w przypadku Canvy (pomoc w projektowaniu i edycji) oraz Replit (zadania związane z kodowaniem).
Grono pierwszych podmiotów, które korzystają z Claude jest większe i zapewne z czasem będzie się tylko rozrastać. Obrazuje to jednak, że zainteresowanie takimi technologiami wśród firm jest spore, bo może być traktowane jako swoista droga ku lepszej wydajności i efektywności.
Do pełni szczęścia jeszcze długa droga

Mimo że już teraz zdolności Claude'a są imponujące, tak do pełnej implementacji i wykorzystania go jako pełnoprawnego asystenta AI jeszcze długa droga. Mowa w końcu o czymś, co powinno być niezawodne, aby nie generować kosztownych dla firm strat. To okazuje się na ten moment niemożliwe.
Nawet jeśli Anthropic twierdzi, że ich model aktualnie przewyższa modele takie jak ChatGPT 4 i Gemini, tak nadal jest on „wysoce niedoskonały”. Testy w OSWorld wykazały, że Claude faktycznie radzi sobie lepiej od konkurencji (14,9% poprawnie wykonanych zadań kontra 7,7% osiągniętych przez ChatGPT4), ale do ludzkiej precyzji brakuje mu jeszcze sporo.
Jest w tym jednak spory potencjał rozwojowy, a dalszy kierunek rozwoju dyktowany będzie przez firmy zainteresowane takimi narzędziami. Bardzo możliwe, że za jakiś czas tacy komputerowi asystenci AI będą standardem dla wielu typowo biurowych stanowisk. Na razie jednak droga do tego zdaje się długa i szalenie wyboista.