OpenAI rozszerzył tryb głosowy GPT-5 na 15 języków, w tym polski i niemiecki. Funkcja Advanced Voice Mode 2.0 debiutuje we wtorek dla użytkowników ChatGPT Plus i klientów dla firm. To pierwszy raz, gdy najnowszy model OpenAI obsługuje rozmowy głosowe poza angielskim od pierwszego dnia premiery.
Sam Altman na blogu OpenAI napisał: „Nie ma powodu, dla którego technologia głosowa miałaby należeć tylko do anglojęzycznych użytkowników”. Firma testowała wielojęzyczny Voice Mode przez cztery miesiące w zamkniętej grupie 12 tysięcy użytkowników z Polski, Niemiec, Francji i Japonii.

Co nowego w Voice Mode 2.0
Advanced Voice Mode 2.0 rozpoznaje kontekst emocjonalny w rozmowie i dostosowuje ton odpowiedzi. Jeśli przerwiesz GPT-5 w połowie zdania — model przełączy się płynnie i odpowie na nowe pytanie. W praktyce oznacza to koniec sztywnych dialogów „pytanie-odpowiedź-pytanie”.
Model obsługuje code-switching — przełączanie między językami w jednej rozmowie. Możesz zapytać po polsku, poprosić o wyjaśnienie po angielsku, wrócić do polskiego. GPT-5 trzyma kontekst przez cały czas.
Protip ✅
Jeśli GPT-5 Voice źle wymawia polskie nazwiska — przerwij i przeliteruj powoli. Model uczy się on-the-fly i zapamiętuje poprawioną wymowę na resztę sesji.
Lista wspieranych języków: polski, niemiecki, francuski, hiszpański, włoski, portugalski, japoński, koreański, chiński (mandaryński i kantoński), hindi, arabski, rosyjski, turecki, holenderski. OpenAI zapowiedział dodanie kolejnych sześciu języków do czerwca 2026.

Dostępność i ceny
ChatGPT Plus ($20/miesiąc) otrzyma nielimitowany dostęp do Voice Mode 2.0 od wtorku. Użytkownicy darmowego ChatGPT — 15 minut dziennie z głosem po angielsku, reszta języków wyłączona. Klienci dla firm płacą $60 za użytkownika miesięcznie i dostają API z Voice Mode.
OpenAI uruchomił również standalone aplikację „GPT Voice” na iOS i Android — tylko rozmowy głosowe, bez interfejsu tekstowego. Subskrypcja $10/miesiąc, 200 minut rozmów w dowolnym z 15 języków. Aplikacja wystartuje w czwartek.
Uwaga ⚠️
Voice Mode 2.0 nie zapisuje dźwięku — tylko transkrypcję. Jeśli chcesz zachować dokładną wymowę lub intonację, musisz włączyć nagrywanie lokalnie na urządzeniu.
Co to oznacza dla polskich użytkowników
Polski Voice Mode to przełom dla korepetycji językowych, nauki i obsługi klienta. Firmy z Polski testowały boty głosowe GPT-5 w call center — 40% mniej porzuconych połączeń niż z GPT-4o Voice. Model rozumie polskie akcenty regionalne i potoczny język.
Anthropic milczy w temacie głosowego Claude — ostatnia aktualizacja Claude Code nie dodała Voice Mode. Google Gemini 3 ma głos w sześciu językach (bez polskiego). xAI testuje Grok Voice tylko po angielsku. OpenAI ma gigantyczną przewagę nad konkurencją w wielojęzycznych rozmowach.
Ale jest haczyk: Voice Mode 2.0 wymaga stabilnego połączenia minimum 5 Mb/s. Na mobilnym LTE w zatłoczonych miejscach model się zacina. OpenAI pracuje nad trybem offline na podstawie cache’owanych odpowiedzi — premiera jesienią 2026.