Trenowanie sztucznej inteligencji to proces wymagający i trudny z wielu względów. Z jednej strony wymaga on sporych nakładów czasowych i energii elektrycznej, ale jednocześnie ogromnych ilości danych, które dany model będzie w stanie wykorzystać do odpowiedniego przetworzenia i nauki.
Ten ostatni element okazuje się dla wielu korporacji szalenie problematyczny, sprawiając, że muszą one uciekać się do nielegalnych praktyk. Z tego też powodu od czasu do czasu słyszymy o wykorzystaniu danych, do których dane przedsiębiorstwo nie miało prawa. To oczywiście wzbudza słuszne oburzenie wielu zwykłych ludzi, którzy chcą, aby regulatorzy proceder ten ukrócili.
Okazuje się, że teraz z takimi oskarżaniami mierzyć się musi Microsoft. Zarzuty są bardzo poważne i choć firma się ich wypiera, to wzbudza to spory niesmak. O co dokładnie chodzi?
Dane z pakietu Office wykorzystane do szkolenia?
Według autora portalu Cyberciti.biz o pseudonimie nixCraft jedna z funkcji pakietu MS Office może w nielegalny sposób zbierać dane użytkowników i wykorzystywać je potem do szkolenia sztucznej inteligencji. Mowa dokładnie o opcji Connected Experiences, która pozwala kilku użytkownikom na pracę nad dokumentami w czasie rzeczywistym za pomocą internetu. Okazuje się, że domyślnie włączona opcja.
Może to oznaczać, że wszystkie dokumenty, arkusze i wprowadzane do nich dane mogą być potencjalne przetwarzane przez usługę. To zaś prowadzi do sytuacji, w których Microsoft może zbierać je i dostarczać do szkolenia sztucznej inteligencji np. na potrzeby programu Copilot.
Z perspektywy europejskich użytkowników jest to intrygujące, że owa funkcja jest domyślnie włączona. To zaś kłóci się z przepisami RODO, które wymagają od producentów domyślnego wyłączania opcji, które przetwarzają dane użytkowników.
Dodatkowo autor tekstu twierdzi, że producent systemu operacyjnego Windows nie informuje w odpowiedni sposób swoich użytkowników o prawach, jakie im przysługują ani tym bardziej o działaniach, jakie firma podejmuje.
Microsoft zaprzecza, ale gdzie leży prawda?
Po co Microsoftowi te dane? Zasilając swoje modele językowe, firma może zapewnić sobie możliwie najlepszą jakoś treści do nauki, która dodatkowo jest niemal nieograniczona. To zaś daje jej ogromną przewagę nad rozwiązaniami konkurencji.
Oczywiście Microsoft stanowczo zaprzecza tym informacjom i podkreśla, że nie szkoli swoich modeli na bazie danych z programów Office lub Microsoft 365. Wspomniana funkcja jest włączona, ale tylko dlatego ze względu na opisaną wyżej możliwość współtworzenia dokumentów.
Jaka jest ostatecznie prawda? Oczywiście nie sposób jednoznacznie stwierdzić i raczej nie ma większych szans na to, że Microsoft nagle przyzna się do naginania prawa. Z drugiej strony twardych dowodów, które potwierdzałby winę brak i te też raczej zdają się niemożliwe do wskazania.
Sytuacja ta pokazuje jednak, jak dużym problemem ostatnimi czasy staje się kwestia prywatności, zwłaszcza kiedy w grę wchodzi trenowanie AI. Nawet jeśli Microsoft jest tutaj bez winy, to inne korporacje bardzo chętnie będą korzystać z naszych danych i naszego dorobku, aby szkolić AI.
Czy można temu zapobiec? Oczywiście, wystarczy nie korzystać z programów i aplikacji konkretnych spółek. Wówczas jednak pozbawiamy się pewnych funkcjonalności. Jest to więc bardzo patowa sytuacja…