OpenAI udostępnia GPT-5.6: trzy modele, nowa jakość bezpieczeństwa

OpenAI rozpoczęło właśnie ograniczony podgląd swojej najnowszej rodziny modeli – GPT-5.6. W jej skład wchodzą trzy warianty: flagowy Sol, zbalansowany Terra oraz szybki i tani Luna. Każdy z nich ma inny profil wydajności i kosztów, co daje użytkownikom i deweloperom elastyczność w doborze narzędzia do konkretnego zadania. Producent zapowiada, że modele trafią do szerszego grona odbiorców w ciągu najbliższych tygodni – na razie jednak dostęp do nich mają jedynie zaufani partnerzy, a proces ten został uzgodniony z rządem USA.

To nie jest typowa aktualizacja. GPT-5.6 Sol jest najsilniejszym modelem w historii OpenAI, a jednocześnie pierwszym, który wprowadza system zabezpieczeń zaprojektowany od podstaw z myślą o realnych atakach. W artykule przyjrzymy się zarówno jego możliwościom, jak i mechanizmom, które mają powstrzymać nadużycia bez blokowania legalnych zastosowań.

Trzy modele, trzy podejścia do pracy z AI

Nowa nomenklatura GPT-5.6 zastępuje dotychczasowy sposób nazewnictwa. Liczba 5.6 oznacza generację, a nazwy własne (Sol, Terra, Luna) wskazują trwałe poziomy możliwości, które mogą być rozwijane niezależnie. Dzięki temu użytkownik od razu wie, czego się spodziewać – flagowej mocy, codziennej równowagi lub maksymalnej oszczędności.

Sol – siła obliczeniowa na nowym poziomie

GPT-5.6 Sol to model przeznaczony do najbardziej złożonych zadań. Wprowadza między innymi nowy tryb max reasoning effort, który pozwala modelowi poświęcić więcej czasu na głęboką analizę, oraz ultra mode – rozwiązanie wykraczające poza możliwości pojedynczego agenta, wykorzystujące subagentów do przyspieszenia skomplikowanych procesów. W testach kodowania na benchmarku Terminal-Bench 2.1 (oceniającym pracę z wierszem poleceń: planowanie, iterację i koordynację narzędzi) Sol ustanowił nowy stan sztuki.

Równie imponujące są wyniki w dziedzinie biologii. Na GeneBench v1, który mierzy zdolność do długoterminowych analiz genomicznych i ilościowych, Sol osiąga lepsze rezultaty niż GPT-5.5, zużywając przy tym mniej tokenów. Oznacza to, że bioinformatycy i badacze mogą liczyć na szybsze i tańsze wnioskowanie.

Terra i Luna – wydajność w codziennej pracy i niskim budżecie

Terra została zaprojektowana jako model do codziennych zastosowań – ma konkurencyjną wydajność względem GPT-5.5, ale jest od niego dwukrotnie tańsza. Z kolei Luna to najszybszy i najbardziej ekonomiczny wariant, który oferuje solidne możliwości przy najniższym koszcie. Taki podział pozwala firmom dobierać model do konkretnego przepływu pracy: do prostych, powtarzalnych zadań Luna, do średnio skomplikowanych – Terra, a do wymagających analiz – Sol.

Bezpieczeństwo warstwowe – jak OpenAI chroni przed nadużyciami

Według informacji producenta, GPT-5.6 Sol, Terra i Luna wyposażono w najsilniejsze zabezpieczenia w historii firmy. Kluczowym założeniem jest podejście warstwowe – żadna pojedyncza technika nie jest wystarczająca wobec zdeterminowanego atakującego, dlatego OpenAI zastosowało kilka poziomów ochrony.

Ochrona na poziomie modelu i generowania

Model trenowano tak, aby odmawiał pomocy w zakresie zabronionych działań cybernetycznych – nawet gdy użytkownik próbuje zamaskować swoje intencje lub dokonać jailbreaka. To pierwsza bariera. Kolejną stanowią klasyfikatory działające w czasie rzeczywistym, które oceniają generowany tekst. W przypadku podejrzenia naruszenia, generacja może zostać wstrzymana, a jej kontekst przeanalizowany przez większy model wnioskujący. Jeśli wynik zostanie uznany za niedozwolony, odpowiedź nie trafia do użytkownika.

Analiza kont i odróżnianie dobrej woli od złośliwości

Systemy OpenAI uwzględniają także sygnały na poziomie konta – wykryte podejrzane aktywności są analizowane w kontekście innych rozmów i sygnałów ryzyka. To pozwala odróżnić uporczywe, złośliwe zachowanie od legalnych działań defensywnych (takich jak przegląd kodu, badanie podatności czy tworzenie poprawek). Specjaliści podkreślają: te same techniczne koncepty mogą pojawić się w bardzo różnych kontekstach, dlatego system musi być w stanie rozpoznać intencję.

Automated red-teaming – 700 tysięcy godzin na testy

OpenAI przeznaczyło do automatycznego czerwonego testowania ponad 700 tysięcy godzin GPU (w przeliczeniu na A100). Celem było znalezienie uniwersalnych jailbreaków – ataków działających na wiele różnych promptów, a nie tylko na jeden wąski scenariusz. Dzięki temu możliwe było przetestowanie zabezpieczeń wykraczające poza znane wcześniej słabości. Prace nad wzmacnianiem systemów trwają nadal – po wykryciu nowej luki uruchamiany jest szybki proces replikacji, oceny i naprawy, a następnie test dodaje się do zestawu bieżących ewaluacji.

Równolegle z automatycznym testowaniem prowadzono testy przez zewnętrznych ekspertów (human expert red teaming), które będą kontynuowane w okresie podglądu. Łącznie te działania mają sprawić, że model będzie odporny nie tylko na znane ataki, ale także na nowatorskie, kreatywne próby nadużyć.

Cyberbezpieczeństwo: wsparcie dla obrońców, nie napastników

W obszarze cyberbezpieczeństwa GPT-5.6 Sol zmienia granicę wydajności i efektywności kosztowej. Na benchmarku ExploitBench model osiąga wyniki porównywalne z Mythos Preview, potrzebując zaledwie około jednej trzeciej tokenów wyjściowych. Na ExploitGym (stworzonym przez badaczy z UC Berkeley we współpracy z OpenAI i innymi laboratoriami) wszystkie trzy modele – Sol, Terra i Luna – wykazują silne ulepszenia zdolności cybernetycznych wraz ze wzrostem czasu wnioskowania.

OpenAI podkreśla, że silniejsze zdolności idą w parze z silniejszymi zabezpieczeniami. Sol nie przekracza progu Cyber Critical określonego w ich frameworku gotowości. W testach dotyczących Chromium i Firefox model identyfikował błędy i prymitywy eksploitacji, ale nie był w stanie samodzielnie wyprodukować w pełni funkcjonalnego exploit’a. Producent zastrzega jednak, że żadne testy nie oddają w pełni wszystkich realnych kombinacji narzędzi i scenariuszy.

Z tego względu zdecydowano się na fazowane udostępnianie. Celem jest maksymalne ograniczenie możliwości wykorzystania modelu do ataków, przy jednoczesnym zachowaniu dostępu dla obrońców – osób zajmujących się przeglądem kodu, badaniem podatności, tworzeniem poprawek, debugowaniem, edukacją bezpieczeństwa i testami defensywnymi. W ocenie twórców, model przyniesie znaczące korzyści legalnym działaniom obronnym, jednocześnie utrudniając, spowalniając i zwiększając wykrywalność działań ofensywnych.

Dostępność, ceny i przyszłość rodziny GPT-5.6

W fazie podglądu modele dostępne są przez API i Codex dla wyselekcjonowanych partnerów. OpenAI planuje rozszerzyć dostęp do użytkowników ChatGPT, Codex i API w najbliższych tygodniach. Cennik za 1 milion tokenów wygląda następująco: Sol – 5 USD (wejście) / 30 USD (wyjście), Terra – 2,50 USD / 15 USD, Luna – 1 USD / 6 USD. Wprowadzono także bardziej przewidywalny system cache’owania promptów, w tym jawne punkty przerwania i minimalny czas życia cache’u wynoszący 30 minut. Zapis do cache’u jest rozliczany w stawce 1,25x niescache’owanej stawki wejściowej, a odczyt z cache’u nadal otrzymuje 90% zniżki.

Dodatkowo, od lipca GPT-5.6 Sol będzie dostępny na platformie Cerebras z prędkością do 750 tokenów na sekundę – to przełom w szybkości wnioskowania dla frontiery inteligencji. Początkowo dostęp będzie ograniczony do wybranych klientów.

Podsumowując, rodzina GPT-5.6 to nie tylko skok wydajnościowy, ale przede wszystkim zmiana podejścia do bezpieczeństwa. Warstwowa ochrona, ogromne nakłady na testy i transparentna faza podglądu to sygnał, że producent traktuje odpowiedzialne wdrażanie AI co najmniej tak poważnie, jak rozwój samych możliwości. Dla polskich firm i developerów oznacza to więcej opcji i większą kontrolę nad tym, jak i do czego wykorzystują zaawansowane modele językowe.

Źródło