Anthropic zakończyło wsparcie dla kontekstu o rozmiarze miliona tokenów w modelach Claude Sonnet 4 oraz Claude Sonnet 4.5. Od 30 kwietnia 2026 deweloperzy korzystający z tych wersji nie będą mogli wysyłać zapytań przekraczających standardowe 200 tysięcy tokenów. Próba wysłania większego promptu zakończy się błędem.
Zmiana wymaga natychmiastowej reakcji zespołów technicznych. Jeśli wasze aplikacje opierają się na przetwarzaniu dużych bloków kodu źródłowego, pełnych repozytoriów czy złożonej dokumentacji, konieczne będzie przejście na nowsze modele. Anthropic przygotowało już ścieżkę migracji, która nie wiąże się z dodatkowymi opłatami.
Najważniejsze informacje
- Claude Sonnet 4 i 4.5 nie obsługują już okna 1M tokenów – zapytania powyżej 200k tokenów zwracają błąd
- Claude Sonnet 4 i 4.5 to docelowe modele dla deweloperów potrzebujących dłuższego kontekstu
- Claude Sonnet 4 i 4.5 oferują 1M tokenów domyślnie na API Claude, Amazon Bedrock i Vertex AI
- Nagłówek beta
context-1m-2025-08-07został wycofany i nie działa na starszych modelach - Nowe modele nie wymagają żadnego nagłówka beta – dłuższe okno działa standardowo
Dlaczego ta decyzja ma znaczenie
W branży web developmentu, AI i DevOps umiejętność pracy z długim kontekstem jest kluczowa. Dotyczy to analizy wieloplikowych refaktoryzacji, debugowania rozproszonych systemów czy generowania dokumentacji pokrywającej setki plików jednocześnie. Narzędzia takie jak Claude Code umożliwiły przetwarzanie całych projektów w jednym zapytaniu.
Ograniczenie do 200 tysięcy tokenów znacząco zmniejsza możliwości agentów AI. Nie można zmieścić dużej bazy kodu w tak wąskim oknie, co prowadzi do przerwania ciągłości pracy – kontekst między zapytaniami zostaje utracony, a model przestaje "rozumieć" architekturę całego projektu.
Anthropic wprowadziło nowe modele, które oferują to samo okno 1M tokenów w stabilnej, ogólnie dostępnej formie – bez eksperymentalnych nagłówków. Cena pozostała na tym samym poziomie.
Co zmienia się operacyjnie

Stare zapytania przestaną działać. Jeśli wasze pipeline'y CI/CD, agenci vibe codingu czy asystenci kodowania opierają się na modelach Sonnet 4 lub 4.5, napotkacie błąd przy próbie przesłania promptu >200k tokenów. To nie jest subtelna zmiana – to twarde ograniczenie.
Deweloperzy powinni natychmiast zaktualizować konfiguracje API, wskazując claude-sonnet-4 lub claude-sonnet-4.5 jako domyślny model. Te same modele oferują również 1M tokenów na platformach trzecich – Amazon Bedrock, Vertex AI – co ułatwia pracę zespołom korzystającym z chmury.
Na nowszych modelach (Claude Sonnet 4 i 4.5) API może zatrzymać generowanie, gdy suma tokenów wejściowych i max_tokens przekroczy rozmiar okna. Otrzymacie wtedy stop_reason: "model_context_window_exceeded", ale samo żądanie nie zostanie odrzucone – to istotny detal dla każdego, kto buduje złożone przepływy agentowe.
Migracja krok po kroku

Przejście na nowe modele jest proste. Nie trzeba zmieniać struktury promptów ani logiki aplikacji. Wystarczy podmienić ID modelu w wywołaniu API. Nowe modele nie potrzebują już nagłówka beta – okno 1M tokenów działa domyślnie w standardowym modelu cenowym.
Dla zespołów korzystających z Claude Code czy innych narzędzi, Anthropic zaleca natychmiastowe przejście na wyższe wersje modeli Sonnet 4 i 4.5. Dotyczy to zwłaszcza długotrwałych sesji debugowania czy scenariuszy związanych z rozległymi refaktoryzacjami.
Podsumowanie
Anthropic wygasza eksperymentalny dostęp do długiego kontekstu i przenosi go do głównego nurtu swoich modeli. 1M tokenów staje się standardem. Dla branży web developmentu, AI i DevOps to istotna zmiana: można planować architekturę aplikacji, wiedząc, że długie konteksty będą obsługiwane na produkcji. Dla osób pracujących z kodem na co dzień to zachowanie ciągłości pracy – bez niespodzianek przy następnym git push.


Dodaj komentarz