Nowości
OpenAI pokazuje flagowy model GPT-5.6 Sol, ale rząd USA kontroluje dostęp do niego

OpenAI udostępniło ograniczony podgląd rodziny GPT-5.6 z flagowym modelem Sol, który dorównuje Claude Mythos 5 w kodowaniu i cyberbezpieczeństwie, ale trafia do klientów tylko za zgodą amerykańskiego rządu wydawaną osoba po osobie. Firma nazwała ten mechanizm rozwiązaniem, które nie powinno stać się normą na stałe.
Spis treści
OpenAI ogłosiło ograniczony podgląd nowej rodziny modeli GPT-5.6, w skład której wchodzą trzy warianty: flagowy Sol, średni Terra i szybki, tani Luna. To bezpośrednia odpowiedź na czerwcową premierę Claude Sonnet 5 od Anthropic i wcześniejsze udostępnienie znacznie mocniejszego Claude Mythos 5, wobec którego Sol ma konkurować na wprost.
Największa nowość dotyczy nie samych możliwości modelu, lecz sposobu, w jaki trafia on do klientów. Rząd Stanów Zjednoczonych wymaga zgody na dostęp do Sol wydawanej dla każdego klienta z osobna, co powtarza mechanizm zastosowany wcześniej wobec Anthropic i jego modeli klasy Mythos. OpenAI nie kryje niezadowolenia z takiego rozwiązania.
Trzy modele, trzy budżety
Sol to model flagowy, kierowany do najbardziej wymagających zadań: programowania agencyjnego, pracy badawczej i obsługi komputera. Terra ma oferować wydajność zbliżoną do GPT-5.5 przy o połowę niższym koszcie, a Luna jest najszybszym i najtańszym wariantem, przeznaczonym do zadań o dużej skali. Ceny liczone za milion tokenów wynoszą odpowiednio 5 i 30 dolarów dla Sol, 2,5 i 15 dolarów dla Terra oraz 1 i 6 dolarów dla Luna, licząc osobno za dane wejściowe i wyjściowe.
Na razie modele są dostępne wyłącznie przez API i Codex dla wąskiej grupy zaufanych partnerów. GPT-5.6 nie trafił jeszcze do ChatGPT, a OpenAI zapowiada szersze udostępnienie w najbliższych tygodniach, o ile pozwolą na to dalsze przeglądy bezpieczeństwa prowadzone przez administrację USA.
Wyniki w kodowaniu i cyberbezpieczeństwie
Na benchmarku Terminal-Bench 2.1, który sprawdza pracę z wierszem poleceń wymagającą planowania i koordynacji narzędzi, Sol osiągnął wynik 88,8 procent, praktycznie dorównując Claude Mythos 5 z wynikiem 88 procent. Wariant Sol Ultra, uruchamiany z maksymalnym trybem rozumowania, doszedł do 91,9 procent i jest jedynym modelem w rodzinie z dostępem do tego trybu.
OpenAI opisuje Sol jako swój najbardziej zaawansowany model w zadaniach związanych z cyberbezpieczeństwem, w tym w badaniu podatności i przygotowywaniu łańcuchów eksploitacji. W testach na przeglądarkach Chromium i Firefox model identyfikował błędy i elementy niezbędne do ataku, ale w warunkach testowych nie złożył ich samodzielnie w pełny, działający exploit. Firma podkreśla, że Sol nie przekracza progu nazywanego Cyber Critical w jej wewnętrznych ramach oceny ryzyka, a zadania cyberbezpieczeństwa realizuje przy użyciu około jednej trzeciej mniejszej liczby tokenów wyjściowych niż konkurencyjne modele.
Rządowa kontrola nad najsilniejszym modelem
Amerykańska administracja objęła dostęp do Sol procesem zatwierdzania na poziomie pojedynczych klientów, analogicznym do tego, jaki w czerwcu zmusił Anthropic do czasowego wyłączenia Claude Fable 5 i Mythos 5 z powodów bezpieczeństwa narodowego. OpenAI otwarcie skrytykowało ten model nadzoru.
Nie wierzymy, by tego rodzaju rządowy proces dostępu miał stać się długoterminową normą, bo odcina najlepsze narzędzia od użytkowników, deweloperów, firm, obrońców cyberbezpieczeństwa i partnerów na całym świecie. - OpenAI
To kolejny odcinek trwającego od kilku tygodni sporu o to, kto i na jakich zasadach powinien mieć dostęp do najpotężniejszych modeli AI. Wcześniej dotyczyło to głównie Anthropic, teraz ten sam mechanizm objął również model OpenAI, co pokazuje, że ograniczenia eksportowe i wymogi zgody rządowej stają się standardową praktyką wobec każdego dostawcy osiągającego podobny poziom możliwości, a nie jednorazowym wyjątkiem.
Prędkość i co dalej
OpenAI zapowiedziało też, że jeszcze w lipcu Sol trafi na specjalizowany sprzęt Cerebras, oferując przepustowość do 750 tokenów na sekundę, czyli nawet piętnastokrotnie więcej niż standardowa usługa priorytetowa OpenAI. Dostęp do tej wersji na start ma być mocno ograniczony i rozszerzany stopniowo wraz ze wzrostem dostępnej mocy obliczeniowej.
Dla polskich firm i deweloperów kluczowe będzie tempo, w jakim rządowe zatwierdzenia klientów faktycznie się rozszerzą. Jeśli proces okaże się powolny, europejscy odbiorcy mogą przez dłuższy czas mieć dostęp tylko do tańszych wariantów Terra i Luna, podczas gdy najsilniejszy Sol pozostanie zarezerwowany dla wąskiej listy zatwierdzonych podmiotów, głównie amerykańskich.
Źródła: OpenAI Developer Community (community.openai.com), The Decoder (the-decoder.com), Pulse2 (pulse2.com).


