OpenAI wprowadza tryb głosowy dla GPT-5 – pogaduchy w 15 językach

GPT-5 Voice Mode obsługuje polski, niemiecki i 13 innych języków. Zaawansowany Voice Mode 2.0 debiutuje dla ChatGPT Plus i dla firm we wtorek.
OpenAI wprowadza tryb głosowy dla GPT-5 – pogaduchy w 15 językach
Głosowa era wielojęzycznego AI

OpenAI rozszerzył tryb głosowy GPT-5 na 15 języków, w tym polski i niemiecki. Funkcja Advanced Voice Mode 2.0 debiutuje we wtorek dla użytkowników ChatGPT Plus i klientów dla firm. To pierwszy raz, gdy najnowszy model OpenAI obsługuje rozmowy głosowe poza angielskim od pierwszego dnia premiery.

Sam Altman na blogu OpenAI napisał: „Nie ma powodu, dla którego technologia głosowa miałaby należeć tylko do anglojęzycznych użytkowników”. Firma testowała wielojęzyczny Voice Mode przez cztery miesiące w zamkniętej grupie 12 tysięcy użytkowników z Polski, Niemiec, Francji i Japonii.

Rozpoznawanie emocji w czasie rzeczywistym
Rozpoznawanie emocji w czasie rzeczywistym

Co nowego w Voice Mode 2.0

Advanced Voice Mode 2.0 rozpoznaje kontekst emocjonalny w rozmowie i dostosowuje ton odpowiedzi. Jeśli przerwiesz GPT-5 w połowie zdania — model przełączy się płynnie i odpowie na nowe pytanie. W praktyce oznacza to koniec sztywnych dialogów „pytanie-odpowiedź-pytanie”.

Model obsługuje code-switching — przełączanie między językami w jednej rozmowie. Możesz zapytać po polsku, poprosić o wyjaśnienie po angielsku, wrócić do polskiego. GPT-5 trzyma kontekst przez cały czas.

Protip ✅

Jeśli GPT-5 Voice źle wymawia polskie nazwiska — przerwij i przeliteruj powoli. Model uczy się on-the-fly i zapamiętuje poprawioną wymowę na resztę sesji.

Lista wspieranych języków: polski, niemiecki, francuski, hiszpański, włoski, portugalski, japoński, koreański, chiński (mandaryński i kantoński), hindi, arabski, rosyjski, turecki, holenderski. OpenAI zapowiedział dodanie kolejnych sześciu języków do czerwca 2026.

15 języków w jednym modelu
15 języków w jednym modelu

Dostępność i ceny

ChatGPT Plus ($20/miesiąc) otrzyma nielimitowany dostęp do Voice Mode 2.0 od wtorku. Użytkownicy darmowego ChatGPT — 15 minut dziennie z głosem po angielsku, reszta języków wyłączona. Klienci dla firm płacą $60 za użytkownika miesięcznie i dostają API z Voice Mode.

OpenAI uruchomił również standalone aplikację „GPT Voice” na iOS i Android — tylko rozmowy głosowe, bez interfejsu tekstowego. Subskrypcja $10/miesiąc, 200 minut rozmów w dowolnym z 15 języków. Aplikacja wystartuje w czwartek.

Uwaga ⚠️

Voice Mode 2.0 nie zapisuje dźwięku — tylko transkrypcję. Jeśli chcesz zachować dokładną wymowę lub intonację, musisz włączyć nagrywanie lokalnie na urządzeniu.

Co to oznacza dla polskich użytkowników

Polski Voice Mode to przełom dla korepetycji językowych, nauki i obsługi klienta. Firmy z Polski testowały boty głosowe GPT-5 w call center — 40% mniej porzuconych połączeń niż z GPT-4o Voice. Model rozumie polskie akcenty regionalne i potoczny język.

Anthropic milczy w temacie głosowego Claude — ostatnia aktualizacja Claude Code nie dodała Voice Mode. Google Gemini 3 ma głos w sześciu językach (bez polskiego). xAI testuje Grok Voice tylko po angielsku. OpenAI ma gigantyczną przewagę nad konkurencją w wielojęzycznych rozmowach.

Ale jest haczyk: Voice Mode 2.0 wymaga stabilnego połączenia minimum 5 Mb/s. Na mobilnym LTE w zatłoczonych miejscach model się zacina. OpenAI pracuje nad trybem offline na podstawie cache’owanych odpowiedzi — premiera jesienią 2026.

Midjourney V7 dostał Magic Canvas – nowa funkcja do edycji tła

Midjourney V7 dostał Magic Canvas – nowa funkcja do edycji tła

Prev
Hugging Face zebrał 300 milionów dolarów – wycena sięga 41 miliardów

Hugging Face zebrał 300 milionów dolarów – wycena sięga 41 miliardów

Next