Gemini 3.1 Ultra nauczył się czytać polskie faktury i umowy — OCR z rozumieniem kontekstu
Gemini 3.1 Ultra od Google nauczył się rozumieć polskie dokumenty — faktury, umowy, kontrakty z pełnym OCR i kontekstem prawno-finansowym. Dostęp publiczny 5 kwietnia.
Google w ciszy zrobił coś, na co polskie firmy czekały od dawna. Gemini 3.1 Ultra właśnie nauczył się rozumieć polskie dokumenty — nie tylko odczytywać tekst jak prosty OCR, ale faktycznie rozumieć co czyta. Faktury VAT, umowy handlowe, kontrakty — wszystko z pełnym rozpoznawaniem kontekstu prawnego i finansowego. Dostępne w Google Workspace od dzisiaj, publiczny dostęp 5 kwietnia.
To nie jest kolejne „wspieramy teraz język polski” na poziomie czatbota. To system, który wie czym różni się faktura VAT od faktury proforma, rozumie polskie standardy rachunkowe i potrafi wyciągnąć kluczowe dane z umowy bez gubienia niuansów prawnych. Dla działów księgowości i prawnych to konkretna różnica między „musimy to ręcznie sprawdzić” a „AI już to przetworzyła”.
Co Gemini faktycznie potrafi z polskimi dokumentami
Ekstrakcja tekstu z PDF-ów istnieje od lat. Problem w tym, że zwykły OCR wyrzuca tekst bez kontekstu — kolumny się mieszają, tabele rozjeżdżają, a model nie wie czy „1000 zł” to kwota netto czy brutto. Gemini 3.1 Ultra podchodzi do tego inaczej.
Model rozpoznaje strukturę polskich dokumentów finansowych. Wie gdzie szukać numeru NIP, rozumie układ pozycji na fakturze, wyłapuje klauzule w umowach. Google nie podał dokładnych liczb, ale w briefu mowa o „pełnej ekstrakcji tekstu i rozpoznawaniu kontekstu” — co w praktyce oznacza że AI rozumie nie tylko co jest napisane, ale co to znaczy w kontekście polskiego prawa i standardów księgowych.

Protip ✅
Jeśli testujesz OCR w Gemini, zacznij od standardowych faktur VAT. Model najlepiej radzi sobie z dokumentami o ustalonej strukturze — umowy w swobodnej formie wymagają więcej iteracji promptu.
Workspace dostaje narzędzie, publiczny dostęp za tydzień
Google wdrożył nową funkcję najpierw w Google Workspace — logiczny ruch, bo to tam pracują zespoły księgowe i prawne potrzebujące automatyzacji. Użytkownicy Workspace mogą już teraz wrzucić polski PDF do Gemini i dostać ustrukturyzowane dane: kwoty, daty, numery NIP, klauzule umowne.
Publiczny dostęp rusza 5 kwietnia. Wtedy każdy z kontem Google będzie mógł przetestować jak model radzi sobie z polskimi dokumentami. Google nie podał informacji o limitach — czy wersja darmowa też dostanie pełne wsparcie, czy zostanie ograniczone do planów płatnych. Typowo dla Google — szczegóły cenowe pojawiają się tuż przed premierą.
Dla polskich firm to może zmienić sposób pracy z dokumentami. Zamiast przepisywać dane z faktur ręcznie albo korzystać z dedykowanych systemów OCR, wystarczy Gemini zintegrowane z Google Drive. Upload, prompt, gotowe dane do arkusza. Jeden przepływ pracy zamiast trzech narzędzi.
Kontekst prawny i finansowy — co to w praktyce oznacza
„Rozpoznawanie kontekstu prawnego i finansowego” brzmi jak marketingowe zaklęcie, ale tu faktycznie chodzi o coś konkretnego. Gemini 3.1 Ultra rozumie specyfikę polskich dokumentów — wie że VAT to 23%, rozpoznaje格式owanie dat w formacie DD.MM.RRRR, wyłapuje klauzule dotyczące odpowiedzialności i terminów płatności.
W przypadku faktur model potrafi odróżnić kwotę netto, VAT i brutto bez manualnego wskazywania. W umowach znajduje zapisy o karach umownych, okresach wypowiedzenia, warunkach gwarancji. To poziom rozumienia którego zwykły OCR nigdy nie osiągnie — bo OCR widzi tylko tekst, a Gemini rozumie co ten tekst znaczy w kontekście polskiego systemu prawnego.

Uwaga ⚠️
Model nadal może pomylić się przy skomplikowanych układach graficznych dokumentów. Jeśli faktura ma niestandardowy layout z wieloma ramkami i tabelami w tabelach — lepiej sprawdź wynik ręcznie zanim wprowadzisz dane do systemu księgowego.
Przykładowy prompt do ekstrakcji danych z faktury
Żeby wyciągnąć maksimum z nowej funkcji Gemini, trzeba wiedzieć jak poprawnie sformułować prompt. Oto przykład do ekstrakcji danych z polskiej faktury VAT:
Przeanalizuj załączoną fakturę VAT i wyodrębnij następujące informacje w formacie JSON:
– numer faktury
– data wystawienia
– termin płatności
– dane sprzedawcy (nazwa, NIP, adres)
– dane nabywcy (nazwa, NIP, adres)
– pozycje faktury (nazwa, ilość, cena netto, VAT, cena brutto)
– suma netto
– suma VAT
– suma brutto
– forma płatności
– numer konta bankowego
Taki prompt da ci ustrukturyzowane dane gotowe do importu. Możesz zmodyfikować listę pól w zależności od tego jakich informacji potrzebujesz — model dostosuje ekstrakcję.
Dla umów handlowych działa podobny schemat:
Przeanalizuj załączoną umowę i wyodrębnij kluczowe informacje:
– strony umowy (pełne dane)
– przedmiot umowy
– wartość kontraktu
– warunki płatności
– terminy realizacji
– klauzule dotyczące kar umownych
– warunki wypowiedzenia
– okres obowiązywania umowy
Wynik przedstaw w przejrzystej strukturze punktowej.
Protip ✅
Dodaj na końcu promptu „Jeśli jakiejś informacji nie ma w dokumencie, napisz 'brak danych’ zamiast wymyślać”. Gemini czasem próbuje uzupełniać luki — lepiej wymusić jawne oznaczanie brakujących danych.
Gdzie to faktycznie ma zastosowanie
Księgowość to oczywisty case — automatyzacja wprowadzania faktur do systemów księgowych oszczędza godziny pracy. Ale jest więcej scenariuszy gdzie rozpoznawanie polskich dokumentów ma sens.
Działy prawne mogą analizować kontrakty hurtowo — wrzucić 50 umów i kazać AI wyciągnąć wszystkie klauzule dotyczące terminów płatności albo kar umownych. Zamiast czytać każdą umowę osobiście, dostajesz podsumowanie w 10 minut.
Firmy zajmujące się compliance mogą skanować dokumenty pod kątem zgodności z wymogami prawnymi. Gemini sprawdzi czy wszystkie faktury mają wymagane elementy, czy umowy zawierają konieczne klauzule RODO, czy dokumenty kadrowe spełniają standardy.
HR może automatyzować przetwarzanie CV i dokumentów aplikacyjnych. Model rozpozna polskie wykształcenie, doświadczenie, certyfikaty — wszystko gotowe do wrzucenia do ATS bez ręcznego przepisywania.
Konkurencja śpi czy po prostu Google przyśpieszył
OpenAI ma GPT-4 Vision który też czyta dokumenty, ale wsparcie dla polskiego kontekstu prawno-finansowego jest tam… nazwijmy to delikatnie, podstawowe. Microsoft w Azure Document Intelligence oferuje OCR dla polskiego, ale bez zrozumienia specyfiki dokumentów — to wciąż ekstrakcja tekstu na poziomie „widzę znaki”.
Google faktycznie wyprzedził konkurencję w tym konkretnym aspekcie. Gemini 3.1 Ultra to pierwszy model który nie tylko rozpoznaje polski tekst, ale rozumie polski kontekst biznesowy. Dla firm działających w Polsce to przewaga która ma znaczenie — w końcu nie chodzi o to żeby AI potrafiła czytać po polsku, tylko żeby rozumiała polskie realia prawne i księgowe.
Pytanie brzmi ile czasu minie zanim OpenAI i Microsoft dogonią. Knowing Google — mają może kwartał przewagi zanim GPT-5 i następna wersja Azure dorównają funkcjonalnością. Ale ten kwartał wystarczy żeby sporo polskich firm przesiało się na Workspace i zostało tam.
Co to zmienia dla polskich firm
Jeśli prowadzisz firmę w Polsce i masz do czynienia z dużą ilością dokumentów — faktury, umowy, pisma urzędowe — Gemini 3.1 Ultra właśnie stał się narzędziem wartym przetestowania. Nie musisz już inwestować w dedykowane systemy OCR ani zatrudniać dodatkowych osób do przepisywania danych.
Dla małych firm to może oznaczać oszczędność kilku godzin tygodniowo na administracji. Dla średnich i dużych — potencjalnie cały dział obsługi dokumentów może działać wydajniej. Google nie podał konkretnych liczb ROI, ale jeśli model faktycznie działa tak dobrze jak obiecują — zwrot z integracji przyjdzie szybko.
Publiczny dostęp 5 kwietnia to dobry moment żeby przetestować czy hype jest uzasadniony. Wrzuć kilka swoich faktur, umów, zobacz jak Gemini sobie radzi. Jeśli wyniki będą spójne — warto pomyśleć o integracji z procesami w firmie. Jeśli nie — przynajmniej wiesz że trzeba poczekać na następną iterację modelu.


