AI już przewiduje długość Twojego życia

Nasze życie, podobnie jak opowieści, podąża za narracyjnymi łukami. Każde z nich rozwija się unikalnie w rozdziałach noszących znajome tytuły: szkoła, kariera, przeprowadzka, kontuzja, choroba. Każda historia życia ma początek, środek i nieprzewidywalny koniec.

Teraz, według naukowców, każda historia życia to kronika z góry zapowiedzianej śmierci. Korzystając z danych rejestru Danii, które zawierają bogate informacje na temat edukacji, wynagrodzenia, pracy, godzin pracy, mieszkania i wizyt u lekarza, akademicy opracowali algorytm, który może przewidzieć przebieg życia danej osoby, w tym przedwczesną śmierć, w podobny sposób, w jaki duże modele językowe (LLM) takie jak ChatGPT mogą przewidywać zdania. Algorytm okazał się lepszy od innych modeli przewidywania, w tym tabel aktuarialnych używanych przez branżę ubezpieczeniową.

To, że nasze złożone istnienia można analizować jak kawałki tekstu, jest zarówno ekscytujące, jak i niepokojące. Choć wiemy, że hojny dochód koreluje z wydłużonym przewidywanym okresem życia, łączenie ogromnych ilości różnych danych może ujawnić inne sposoby, w jakie czynniki społeczne wpływają na zdrowie. To może być cenne dla decydentów, którzy dążą do poprawy naszych szans na dłuższe, zdrowsze życie.

Z drugiej strony, idea “DeathGPT” wydaje się prawie absurdalnie uproszczona. Każdy element naszego życia – uczestnictwo w lekcjach, wzrost wynagrodzenia, utrata rodzica – wydaje się zbyt osobisty, aby stanowić podstawę dla przewidywalnego zbioru danych. Jednak w epoce big data i sztucznej inteligencji do jej wykorzystania, będziemy musieli zaakceptować, że te głęboko odczuwane doświadczenia jakościowe mogą być uchwycone ilościowo w sposób, który, w granicach błędu, szkicuje indywidualne przeznaczenie.

Sune Lehmann, z Technical University of Denmark, który kierował badaniami opublikowanymi w zeszłym miesiącu w Nature Computational Science, nie uważa tej idei za dezorientującą. “Uważam, że podobieństwo między tekstem a życiem jest głębokie i wieloaspektowe”, powiedział mi w wiadomości e-mail. “Dla mnie ma sens, że nasz algorytm może przewidywać kolejny krok w ludzkim życiu.”

Zarówno język, jak i życie, składają się z sekwencji. Badacze, pochodzący z Uniwersytetu Kopenhagi i Northeastern University w Bostonie, wykorzystali te podobieństwo. Po pierwsze, stworzyli “słownik” wydarzeń życiowych, tworząc rodzaj syntetycznego języka, i użyli go do tworzenia “zdania”. Przykładowe zdanie mogłoby brzmieć: “W trzecim roku szkoły średniej Hermione uczestniczyła w pięciu zajęciach wyborczych.”

Podobnie jak LLMs analizują tekst, aby zrozumieć relacje między słowami, algorytm life2vec, zasilany odtworzonymi historiami życia 6 milionów mieszkańców Danii między 2008 a 2015 rokiem, analizował te podsumowania w poszukiwaniu podobnych relacji.

Nadszedł moment prawdy: jak dobrze można było zastosować to rozległe szkolenie do przewidywania od 2016 do 2020 roku? Wśród prób działania algorytmu, badacze przeanalizowali próbkę 100 000 osób w wieku od 35 do 65 lat, z których połowa jest znana z przeżycia, a połowa zmarła w tym okresie. Kiedy poproszono o odgadnięcie, które z nich zmarły, life2vec udzielił poprawnej odpowiedzi w 79 procentach przypadków (losowe zgadywanie daje 50 procent trafności). Przewyższył on inne najlepsze modele przewidywania, jak powiedział Lehmann, o 11 procent.

Chociaż w artykule twierdzi się, że “dokładne indywidualne prognozy są możliwe”, algorytm dostarcza prawdopodobieństwa śmierci w określonym okresie, a nie dokładnej daty. Istnieją zastrzeżenia: to, co ma zastosowanie w Danii, może nie mieć zastosowania gdzie indziej, a algorytm zakodowuje uprzedzenia w danych szkoleniowych. Niemniej jednak, ze względu na jego potencjał do precyzyjnego dostosowywania prognoz ryzyka, wpływ na branżę ubezpieczeniową będzie wart obserwacji. Co do badaczy, nie chcą, aby ich praca była wykorzystywana przez ubezpieczycieli i na razie trzymają algorytm i dane w tajemnicy.

Jednak bardziej ekscytujące niż wyniki, podkreślają badacze, jest to, że life2vec jest ogólny, a nie zadaniowy. W istniejących modelach przewidywania badacze muszą wcześniej określić zmienne, które są istotne, takie jak wiek, płeć i dochód. W przeciwnym razie podejście to pochłania wszystkie dane i samodzielnie wybiera istotne czynniki (zauważyło, że dochód ma pozytywny wpływ na przeżycie, na przykład, a diagnoza zdrowia psychicznego ma wpływ negatywny). To może skierować badaczy na wcześniej niezbadane wpływy na zdrowie – i może odkryć nowe związki między pozornie niepowiązanymi wzorcami zachowań.

Jednym z rosnących obaw Lehmann jest prywatność; zwraca uwagę, że firmy takie jak Google tworzą potężne maszyny przewidywań, wykorzystując obfitość danych osobowych pozyskanych z internetu.

To jest era niezrównanej przewidywalności w ludzkim życiu – i era niezrównanej siły dla tych, którzy potrafią czytać nasze historie, zanim je przeżyjemy.