Przeciek wewnętrznych dokumentów firmy Anthropic odsłonił plany dotyczące nowego, zaawansowanego modelu sztucznej inteligencji, znanego pod roboczymi nazwami „Claude Mythos” lub „Capybara”. Incydent, wynikający z błędnej konfiguracji systemu zarządzania treścią (CMS), doprowadził do upublicznienia blisko 3000 wewnętrznych zasobów, w tym wczesnych wersji wpisów na blogu, plików PDF i obrazów. To nieplanowane ujawnienie rzuca światło nie tylko na kolejny krok w wyścigu gigantów AI, ale przede wszystkim na związane z nim – zdaniem samego twórcy – poważne zagrożenia dla cyberbezpieczeństwa.
Szczegóły wycieku danych i model „Capybara”
Wyciek nastąpił z powodu domyślnego ustawienia w systemie CMS, które automatycznie publikowało przesłane pliki. Wśród ujawnionych materiałów znalazły się dwie wersje robocze wpisu na blogu: jedna nazywała model „Mythos”, a druga „Capybara”. Co ciekawe, nawet w wersji „Capybara” podtytuł głosił: „Ukończyliśmy trenowanie nowego modelu AI: Claude Mythos”, co wskazuje na wewnętrzną ewolucję nazewnictwa.
Anthropic potwierdził incydent, opisując ujawnione materiały jako „wczesne szkice treści rozważane do publikacji”. Firma ukończyła już trenowanie modelu i testowała go z wybranymi klientami, planując ostrożne wdrożenie. Sam przeciek jest natomiast ciekawym studium przypadku dla specjalistów DevOps i web developmentu, pokazując, jak krytyczna jest właściwa konfiguracja systemów hostingowych i zarządzania treścią w procesach (pipeline'ach) rozwoju zaawansowanych technologii.
Możliwości nowego modelu: Krok poza Opus

Z wyciekłych dokumentów wynika, że „Capybara” ma reprezentować nowy, wyższy poziom (tier) w ofercie Anthropic, plasujący się powyżej obecnego flagowego modelu Claude Opus. Model jest opisany jako „większy i bardziej inteligentny niż nasze modele Opus – które do tej pory były naszymi najpotężniejszymi rozwiązaniami”.
Konkretne deklaracje dotyczące jego wydajności obejmują „radykalnie wyższe wyniki” niż w przypadku Claude Opus 4.6 w testach z zakresu inżynierii oprogramowania, rozumowania akademickiego i cyberbezpieczeństwa. Anthropic wspomina o „skokowej zmianie” w zdolnościach rozumowania, kodowania i cyberbezpieczeństwa. Model ma być jednak „bardzo kosztowny w utrzymaniu” zarówno dla dostawcy, jak i przyszłych klientów, co skłoniło firmę do pracy nad poprawą efektywności przed oficjalną premierą.
Alarmujące ryzyka cyberbezpieczeństwa i reakcja rynku

Najbardziej poruszający aspekt ujawnionych dokumentów to nacisk, jaki Anthropic kładzie na bezprecedensowe, krótkoterminowe zagrożenia dla cyberbezpieczeństwa. Firma ostrzega wprost, że model może umożliwić ataki napędzane przez AI i pomóc hakerom w obchodzeniu istniejących zabezpieczeń.
W wyciekłym szkicu czytamy: „Przygotowując się do wydania Claude Capybara, chcemy działać z wyjątkową ostrożnością i zrozumieć ryzyko, jakie stwarza – wykraczające poza to, czego dowiemy się z naszych własnych testów. W szczególności chcemy zrozumieć potencjalne krótkoterminowe zagrożenia modelu w sferze cyberbezpieczeństwa i podzielić się wynikami, aby pomóc w przygotowaniach specjalistom ds. bezpieczeństwa”. Anthropic planuje zewnętrzne testy wykraczające poza wewnętrzne oceny oraz dzielenie się wynikami z branżą security.
Doniesienia o tych ostrzeżeniach wywołały natychmiastową reakcję rynków finansowych. Według raportów Bloomberga, 27 marca 2026 roku spółki z sektora cyberbezpieczeństwa straciły łącznie 14,5 miliarda dolarów wartości rynkowej.
Wnioski: Nowa era odpowiedzialności w AI
Przeciek modelu Capybara to coś więcej niż zwykły news technologiczny. To sygnał, że w miarę jak modele AI stają się potężniejsze w dziedzinach takich jak programowanie i analiza systemów, ich potencjalne nadużycie do tworzenia exploitów czy automatyzacji ataków staje się realnym i bezpośrednim zagrożeniem. Proaktywna deklaracja Anthropic dotycząca współpracy z ekspertami ds. cyberbezpieczeństwa wskazuje na rosnącą świadomość tej odpowiedzialności wśród twórców najnowocześniejszych systemów.
Incydent ten stanowi też ważną lekcję na temat infrastruktury: nawet firmy rozwijające przełomowe technologie są narażone na podstawowe błędy konfiguracyjne w systemach wspierających, takich jak CMS. Dla świata web developmentu i DevOps to przypomnienie, że bezpieczeństwo procesu publikacyjnego jest integralną częścią bezpieczeństwa produktu końcowego – zwłaszcza gdy produkt ten może zmienić krajobraz zagrożeń w cyberprzestrzeni.

