GPT-5.2 OpenAI: nowy model dla profesjonalistów

OpenAI oficjalnie potwierdziło doniesienia i zaprezentowało nową rodzinę zaawansowanych modeli językowych – GPT-5.2. Premiera następuje w kluczowym momencie, gdy konkurencja, na czele z Google Gemini 3, zaczęła przejmować prowadzenie w niezależnych rankingach wydajności. Firma podkreśla jednak, że prace nad tą iteracją trwały od wielu miesięcy, a jej celem jest dostarczenie narzędzi przede wszystkim dla profesjonalnej pracy wymagającej wiedzy. Nowa oferta ma trzy oblicza: szybkie, myślące i profesjonalne.

Odpowiedź na wyzwanie i wewnętrzny „Code Red”

Wydanie GPT-5.2 zbiegło się w czasie z medialnymi doniesieniami o wewnętrznym alarmie „Code Red” w OpenAI, który miał zmobilizować zespół do poprawy ChatGPT po sukcesie konkurencyjnego Geminiego. Kierownictwo firmy przyznało, że taka inicjatywa miała miejsce, ale stanowczo odcięło się od sugestii, że nowy model został pospiesznie wypuszczony wyłącznie w odpowiedzi na działania Google.

Planowana premiera, a nie paniczna reakcja

Fidji Simo, dyrektor generalny ds. Aplikacji w OpenAI, wyjaśnił, że „Code Red” służył skoncentrowaniu zasobów firmy na kluczowym obszarze, ale nie był głównym motorem harmonogramu premiery. „To [wydanie] było planowane od bardzo, bardzo wielu miesięcy” – dodał Max Schwarzer, lider zespołu post-treningowego. Rzecznik firmy doprecyzował, że wezwanie do działania dotyczyło głównie produktu ChatGPT, a nie wyłącznie rozwoju modelu.

Trzy oblicza GPT-5.2: Instant, Thinking i Pro

Aby zbalansować wysokie koszty obliczeniowe zaawansowanych modeli z potrzebą szybkości, OpenAI segmentuje nową rodzinę na trzy wyraźne warstwy dostępne w ChatGPT i poprzez API. Każda z nich adresuje inne potrzeby użytkowników.

GPT-5.2 Instant: szybkość na co dzień

Ten wariant jest zoptymalizowany pod kątem szybkości i codziennych zadań, takich jak pisanie, tłumaczenie czy wyszukiwanie informacji. To rozwiązanie dla tych, którzy priorytetowo traktują niskie opóźnienia.

GPT-5.2 Thinking: moc rozumowania dla złożonych projektów

Zaprojektowany do „złożonej, ustrukturyzowanej pracy” i długotrwałych agentów. Wykorzystuje głębsze łańcuchy rozumowania (chain-of-thought), co czyni go idealnym do kodowania, matematyki i wieloetapowych projektów. Kontekst wejściowy wynosi aż 400 000 tokenów, co pozwala na analizę setek dokumentów naraz.

GPT-5.2 Pro: flagowa precyzja

Opisywany jako „najmądrzejsza i najbardziej godna zaufania opcja”. Ma dostarczać najwyższą dokładność w odpowiedziach na trudne pytania, gdzie jakość przeważa nad szybkością reakcji. Jego limit tokenów wyjściowych to 128 000, umożliwiając generowanie obszernych raportów czy aplikacji za jednym razem.

„Zaprojektowaliśmy 5.2, aby odblokować jeszcze większą wartość ekonomiczną dla ludzi. Jest lepszy w tworzeniu arkuszy kalkulacyjnych, budowaniu prezentacji, pisaniu kodu, percepcji obrazów, rozumieniu długiego kontekstu, korzystaniu z narzędzi i obsłudze skomplikowanych, wieloetapowych projektów” – powiedział Fidji Simo z OpenAI.

Liczby nie kłamią: nowe rekordy na benchmarkach

OpenAI przedstawiło wyniki nowego modelu na kluczowych testach porównawczych, podkreślając jego dominację w dziedzinach związanych z pracą profesjonalną. Firma wprowadziła nowy benchmark GDPval, mierzący wykonanie dobrze określonych zadań wiedzowych z 44 zawodów. Według Simo, GPT-5.2 Thinking jest obecnie najlepszy w tym teście, pokonując lub dorównując ekspertom w 70.9% zadań.

Przełom w automatyzacji kodowania

W kluczowej dziedzinie inżynierii oprogramowania GPT-5.2 Thinking ustanowił nowy rekord na wymagającym benchmarku SWE-bench Pro, osiągając wynik 55.6%. To znaczący skok, potwierdzający jego zdolność do radzenia sobie z rzeczywistymi, złożonymi problemami programistycznymi.

Wyniki w nauce i rozumowaniu

Na innych testach model również błyszczy: GPT-5.2 Pro zdobył 93.2% w naukowym GPQA Diamond, a na benchmarku ogólnego rozumowania ARC-AGI-1 jako pierwszy przekroczył próg 90%, osiągając 90.5%. W zadaniach matematycznych FrontierMath wariant Thinking rozwiązał 40.3% problemów, w porównaniu do 31.0% swojego poprzednika.

Cena inteligencji i era „mega-agentów”

Wydajność ma swoją cenę, co widać szczególnie w cenniku API. GPT-5.2 Thinking kosztuje 1.75$ za milion tokenów wejściowych i 14$ za milion wyjściowych, co stanowi wzrost o 40% w stosunku do GPT-5.1. Flagowy GPT-5.2 Pro to już koszt 21$ i 168$ odpowiednio, co daje łącznie 189$ za milion tokenów. OpenAI argumentuje, że większa efektywność tokenów i zdolność do rozwiązywania zadań w mniejszej liczbie interakcji uzasadniają ten koszt w wysokowartościowych workflowach przedsiębiorstw.

Praktyczne zastosowania i wizja przyszłości

Poza suchymi liczbami, firma pokazuje praktyczne zastosowania. Wspomina o firmie Box, która odnotowała 40% szybsze wydobywanie informacji z dokumentów oraz startupie Augment Code, który wybrał GPT-5.2 do zasilenia swojego agenta recenzji kodu. Nowy model lepiej radzi sobie też z rozumieniem zrzutów ekranu (86.3% dokładności w ScreenSpot-Pro) i, według deklaracji, „halucynuje” o 38% rzadziej niż GPT-5.1.

Co ciekawe, OpenAI przyznaje, że nie wszyscy użytkownicy mogą od razu preferować nowy model ze względu na zmianę „vibe’u” – charakteru odpowiedzi. Z tego powodu starsze wersje pozostaną dostępne. W zakresie bezpieczeństwa, firma zapowiada wprowadzenie „Trybu dla dorosłych” (Adult Mode) w pierwszym kwartale przyszłego roku, po udoskonaleniu systemu przewidywania wieku użytkowników.

„Modele zmieniają się za każdym razem. Niektórzy użytkownicy mogą stwierdzić, że wolą charakterystykę poprzedniego modelu, nawet jeśli uważamy, że najnowszy jest ogólnie znacznie lepszy” – skomentował Max Schwarzer z OpenAI.

Podsumowanie: nowy gracz na rynku enterprise AI

Premiera GPT-5.2 to strategiczny ruch OpenAI, mający na celu odzyskanie pozycji lidera w segmencie profesjonalnym i przedsiębiorczym. Z ofertą wyraźnie segmentowaną pod kątem prędkości, głębi rozumowania i maksymalnej precyzji, firma stara się dotrzeć do różnych przypadków użycia. Mimo wysokich kosztów API, przedstawione benchmarki i wczesne studia przypadków wskazują na znaczący skok jakościowy, szczególnie w kodowaniu i złożonych, agentycznych workflowach. Brak aktualizacji w generowaniu obrazów może być rozczarowaniem dla części użytkowników, ale OpenAI zapowiada, że w tej dziedzinie „więcej nadchodzi”. Dla firm stojących przed wyborem platformy AI, GPT-5.2 staje się poważnym, choć kosztownym, kandydatem do automatyzacji najbardziej wymagającej pracy wiedzowej.

Źródło