Nowości
Waszyngton znosi kontrolę eksportu wobec modeli Anthropic Fable 5 i Mythos 5
Posłuchaj tego artykułu

Rząd USA nałożył na Anthropic zakaz udostępniania Fable 5 i Mythos 5 użytkownikom zagranicznym po odkryciu metody obejścia zabezpieczeń, po dwóch tygodniach kontrolę zdjęto i firma wróciła z modelem globalnie z nowym filtrem bezpieczeństwa.
Przez dwa tygodnie żaden użytkownik spoza Stanów Zjednoczonych nie mógł legalnie korzystać z najmocniejszych modeli Anthropic. 12 czerwca rząd USA nakazał firmie natychmiastowe zawieszenie dostępu do Claude Fable 5 i Claude Mythos 5 dla wszystkich obcokrajowców, powołując się na uprawnienia dotyczące bezpieczeństwa narodowego. 30 czerwca kontrolę zdjęto, a 1 lipca Anthropic przywróciło Fable 5 globalnie, z nowym filtrem bezpieczeństwa i zaostrzoną współpracą z Waszyngtonem.
Co wykryto
Iskrą zapalną był raport badaczy Amazona, którzy znaleźli sposób na obejście zabezpieczeń Fable 5 w postaci starannie skonstruowanego promptu. Model dawał się nakłonić do wskazania konkretnych luk w oprogramowaniu i opisania metod ich wykorzystania, czyli dokładnie tego, przed czym miały chronić wbudowane bariery bezpieczeństwa.
Rząd uznał to za wystarczający powód, by zablokować dostęp cudzoziemcom do modelu, zarówno tym przebywającym za granicą, jak i na terytorium USA. Decyzja dotyczyła Fable 5, publicznie dostępnej wersji z zabezpieczeniami, oraz Mythos 5, tej samej architektury bez ograniczeń cybernetycznych, udostępnianej wyłącznie specjalistom od cyberbezpieczeństwa w programie Project Glasswing.
Dwa tygodnie negocjacji
Sekretarz Handlu USA Howard Lutnick napisał na platformie X, że rząd spędził dwa tygodnie pracując wspólnie z Anthropic nad dopasowaniem Fable do interesów bezpieczeństwa Stanów Zjednoczonych. Efektem jest nowy klasyfikator bezpieczeństwa, który blokuje konkretną technikę opisaną w raporcie Amazona w ponad 99 procentach przypadków, przekierowując zablokowane zapytania do starszego modelu Claude Opus 4.8.
Anthropic rozszerzyło przy tym tak zwany margines bezpieczeństwa, co oznacza, że filtr blokuje też więcej nieszkodliwych zapytań niż wcześniej. Firma potwierdziła równocześnie, że testy wykazały identyczną podatność w innych modelach, w tym GPT-5.5 od OpenAI i Kimi K2.7, co sugeruje, że problem nie był unikalny dla Fable 5, tylko dotyczył całej klasy dzisiejszych systemów.
Wspólne standardy branżowe
W odpowiedzi na incydent Anthropic zadeklarowało głębszą współpracę z rządem oraz, razem z Amazonem, Microsoftem i Google, opracowanie wspólnych ram oceny powagi jailbreaków. Cztery kryteria tej oceny to zysk w zdolnościach modelu po obejściu zabezpieczeń, szerokość tego zysku, łatwość uzbrojenia luki oraz łatwość jej odkrycia przez osoby trzecie.
To pierwszy tak wyraźny sygnał, że główni gracze branży chcą ustalić wspólny język do opisywania poważnych incydentów bezpieczeństwa modeli, zamiast oceniać każdy przypadek osobno. Dla Waszyngtonu jest to też sposób na selektywne otwieranie rynków globalnych dla laboratoriów, które potrafią wykazać realne zabezpieczenia, przy jednoczesnym utrzymaniu twardej blokady wobec Chin.
Znaczenie dla branży
Epizod przypada na moment, gdy chińskie modele otwarte, takie jak GLM-5.2, depczą po piętach zachodnim liderom kosztem ułamka ceny. Analitycy cytowani przez media finansowe zwracają uwagę, że szybkie odblokowanie Fable 5 dla rynków zagranicznych daje Anthropic przewagę w wyścigu o klientów instytucjonalnych i naukowych, którzy czekali z decyzjami zakupowymi na wyjaśnienie sytuacji prawnej.
Dla firm i instytucji w Polsce korzystających z Claude poprzez interfejs API oznacza to koniec dwutygodniowej niepewności, ale też sygnał, że dostęp do najmocniejszych modeli może być w każdej chwili czasowo zawieszony decyzją administracyjną w USA, niezależnie od tego, gdzie znajduje się użytkownik. Firmy planujące wdrożenia oparte na najnowszych modelach Anthropic powinny liczyć się z tym ryzykiem regulacyjnym przy projektowaniu architektury systemów krytycznych.
Źródła: Redeploying Claude Fable 5 (anthropic.com), Anthropic restoring access to its most powerful AI models signals a necessary truce with the U.S. government (fortune.com), Trump Just Cleared Anthropic to Go Global, and Google DeepMind Should Be Sweating (247wallst.com)


