Claude Platform otrzymuje ważne aktualizacje: większa kontrola nad streamingiem i nowe pola w API

Platforma Claude od Anthropic właśnie zyskała dwie istotne, choć na pierwszy rzut oka dyskretne, nowości dla deweloperów. Chodzi o możliwość programistycznego sprawdzania możliwości modeli oraz większą kontrolę nad strumieniowaniem odpowiedzi w trybie rozszerzonego myślenia (extended thinking). To drobne, ale ważne zmiany, które ułatwiają budowanie bardziej przewidywalnych i wydajnych aplikacji.

Zasadniczo, korzystając z API Claude, trzeba wiedzieć, z czym dokładnie ma się do czynienia – jakie limity tokenów obowiązują i które funkcje są wspierane. Do tej pory informacje te trzeba było sprawdzać w dokumentacji. Teraz można to zrobić bezpośrednio w kodzie.

Nowe pola w Models API: `max_input_tokens`, `max_tokens` i `capabilities`

Od 18 marca 2026 roku endpointy GET /v1/models oraz GET /v1/models/{model_id} zwracają trzy nowe pola. Są to max_input_tokens, max_tokens oraz obiekt capabilities. Co one oznaczają?

max_input_tokens określa maksymalną liczbę tokenów, jaką model może przyjąć na wejściu w pojedynczym żądaniu. max_tokens to z kolei limit tokenów, które model może wygenerować w odpowiedzi. Najciekawszy jest jednak obiekt capabilities. Choć szczegóły nie zostały jeszcze szeroko opisane, można się spodziewać, że będzie on przechowywał informacje o tym, czy dany model obsługuje np. extended thinking, wizję czy konkretne narzędzia (tool use).

To zmiana jakościowa dla deweloperów integrujących Claude'a. Zamiast ręcznie aktualizować konfigurację w kodzie przy każdym wydaniu nowego modelu, można napisać logikę, która dynamicznie odczyta jego możliwości bezpośrednio z API. W praktyce ułatwia to zarządzanie wersjami modeli i tworzenie bardziej odpornych na zmiany integracji.

Kontrola nad streamingiem odpowiedzi z „myśleniem”: pole `display`

Druga aktualizacja, z 16 marca, dotyczy trybu extended thinking. To funkcja, w której Claude, zamiast od razu podawać finalną odpowiedź, najpierw prezentuje swój tok rozumowania prowadzący do rozwiązania. Jest to niezwykle przydatne do debugowania i zrozumienia procesu, ale w niektórych aplikacjach produkcyjnych te dodatkowe dane mogą nie być potrzebne użytkownikowi końcowemu, a ich przesyłanie wydłuża czas uzyskania ostatecznej odpowiedzi.

Teraz deweloperzy zyskują nad tym kontrolę. W żądaniu można ustawić parametr thinking.display: "omitted". W efekcie w strumieniowanej odpowiedzi bloki thinking będą przychodziły z pustą zawartością, ale ich sygnatura (struktura) zostanie zachowana. Dlaczego to ważne?

Zachowanie struktury jest kluczowe dla ciągłości w rozmowach wieloturowych. Systemy, które analizują i przetwarzają odpowiedzi modelu w czasie rzeczywistym, często polegają na tej strukturze, aby odróżnić proces myślenia od finalnej odpowiedzi. Gdyby struktura uległa zmianie, mogłoby to zaburzyć logikę aplikacji. Teraz aplikacja może bezpiecznie pomijać treść myślenia przed użytkownikiem, zachowując jednocześnie pełną informację dla własnej logiki przetwarzania. Co istotne, sposób rozliczania za użycie modelu pozostaje bez zmian – płaci się zarówno za tokeny zużyte na myślenie, jak i na odpowiedź.

Kontekst: potężne modele 4.6 i milion tokenów kontekstu

Te techniczne aktualizacje API wpisują się w szerszy trend rozwoju Claude'a, który w 2026 roku przyspieszył. Flagowe modele, Claude Opus 4.6 i Claude Sonnet 4.6, oferują już kontekst miliona tokenów (1M) w wersji ogólnodostępnej (generally available). Oznacza to, że modele mogą analizować ogromne zbiory danych – na przykład całe bazy kodu liczące miliony linii, długie transkrypcje sądowe lub kompleksowe raporty due diligence.

Wcześniej korzystanie z okna 1M tokenów wymagało specjalnego nagłówka beta. Od 13 marca dla Opus 4.6 i Sonnet 4.6 to ograniczenie zniesiono. Jeśli żądanie przekracza 200 tysięcy tokenów, system automatycznie użyje pełnego, milionowego kontekstu. Jednocześnie usunięto specjalne limity rate limits dla 1M tokenów, co oznacza, że obowiązują teraz standardowe limity konta.

Co to oznacza dla deweloperów webowych i AI?

Dla osób budujących aplikacje z użyciem AI, zwłaszcza w obszarach web developmentu, programowania czy DevOps, te zmiany mają konkretne przełożenie.

Po pierwsze: większa przejrzystość i automatyzacja. Dynamiczne odczytywanie możliwości modeli pozwala na tworzenie systemów, które same dostosowują się do dostępnych funkcji. Można sobie wyobrazić aplikację, która sprawdza, czy wybrany model obsługuje wizję, i dopiero wtedy umożliwia przesyłanie obrazów. Albo system monitorujący, który wysyła alert, gdy prompt zbliża się do limitu max_tokens dla danego modelu.

Po drugie: lepsze doświadczenie użytkownika w aplikacjach strumieniujących. Tryb thinking.display: "omitted" pozwala na szybsze dostarczenie użytkownikowi końcowemu finalnej, „czystej” odpowiedzi, szczególnie w chatbotach wsparcia czy interfejsach konwersacyjnych. W tle aplikacja nadal otrzymuje pełną strukturę, więc może logować proces myślenia do celów analitycznych lub używać go w kolejnych turach rozmowy, ale użytkownik nie musi na to czekać.

Po trzecie: łatwiejsze zarządzanie kosztami i wydajnością. Wiedza o dokładnych limitach tokenów (max_input_tokens, max_tokens) pomaga precyzyjniej projektować prompty i przewidywać zużycie. Łącząc to z innymi nowościami, jak automatyczne buforowanie promptów (automatic caching), deweloperzy mogą budować wydajniejsze i tańsze w utrzymaniu aplikacje.

Podsumowanie: ewolucja w kierunku platformy dla deweloperów

Aktualizacje z marca 2026 roku, choć techniczne, pokazują wyraźny kierunek rozwoju platformy Claude. Anthropic nie tylko wypuszcza coraz potężniejsze modele, jak Opus 4.6 czy Sonnet 4.6, ale też konsekwentnie dopracowuje warstwę programistyczną – API, SDK i narzędzia deweloperskie.

Dodanie pól capabilities i kontroli nad display w streamingu to kroki w stronę większej programowalności i kontroli. Platforma staje się nie tylko źródłem zaawansowanej sztucznej inteligencji, ale też przewidywalnym i dobrze udokumentowanym środowiskiem do budowania aplikacji. Dla deweloperów pracujących nad złożonymi agentami AI, systemami przetwarzania dokumentów czy narzędziami do modernizacji kodu, takie usprawnienia na poziomie API są bezcenne. Pozwalają skupić się na logice biznesowej, zamiast na ręcznym dostosowywaniu się do zmian w modelach.

Nowe pola w Models API: `max_input_tokens`, `max_tokens` i `capabilities`

Kontrola nad streamingiem odpowiedzi z „myśleniem”: pole `display`

Kontekst: potężne modele 4.6 i milion tokenów kontekstu

Co to oznacza dla deweloperów webowych i AI?

Podsumowanie: ewolucja w kierunku platformy dla deweloperów

Komentarze

Dodaj komentarz Anuluj pisanie odpowiedzi

Więcej wpisów

OpenAI Codex 0.115.0: Pełna kontrola nad agentami i nowa inspekcja wizualna