Anthropic wprowadza Rate Limits API i pamięć dla agentów Claude

Anthropic wprowadza Rate Limits API i pamięć dla agentów Claude

Anthropic, firma odpowiedzialna za modele Claude, wprowadziła na swojej platformie dwa istotne udogodnienia dla programistów. Od 24 kwietnia 2026 roku dostępne jest Rate Limits API, które umożliwia sprawdzanie konfiguracji limitów użycia API na poziomie organizacji i workspace'ów. Również od 23 kwietnia 2026 roku w publicznej beta dostępna jest Memory for Claude Managed Agents, funkcja, która zapewnia agentom Claude pamięć stanu, co poprawia ich działanie w długotrwałych workflowach. Te zmiany są ogłoszone w kontekście wydania najnowszych modeli z rodziny Claude.

Najważniejsze informacje

  • Rate Limits API umożliwia programowe sprawdzanie limitów przepustowości dla organizacji i workspace'ów.
  • Memory for Claude Managed Agents weszła w fazę publicznej beta, pozwalając na utrzymanie stanu w długotrwałych sesjach.
  • Nowe API dostarcza szczegółów dotyczących limitów dla Messages API i pokrewnych zasobów.
  • Pamięć dla Managed Agents ma znaczenie dla aplikacji agentowych, takich jak asystenci, automatyzacje workflowów czy systemy obsługi klienta.
  • Te zmiany są związane z wydaniem najnowszych modeli Claude, co pokazuje rozwój platformy.

Rate Limits API: programowa kontrola przepustowości

Nowe Rate Limits API to endpoint, który odzwierciedla informacje widoczne w sekcji Limits w konsoli Claude. Jest to kluczowe udogodnienie dla zespołów platformowych i DevOps. Wcześniej informacje o limitach były dostępne tylko przez UI konsoli. Teraz platformy mogą dynamicznie odczytywać aktualne limity, aby synchronizować swoje gatewaye i proxy, budować alerty na podstawie użycia w porównaniu do konfiguracji oraz auditować workspace'y w kontekście automatyzacji provisioningu. Ważne: domyślny workspace nie może mieć nadpisanych limitów.

Dlaczego API limitów jest ważne dla zespołów DevOps i web dev

W kontekście AI-native SaaS, narzędzi do kodowania oraz zaawansowanych systemów agentowych, limity przepustowości są często zmiennym celem. Firmowe proxy, gatewaye i middleware muszą być świadome limitów, aby efektywnie kształtować ruch i implementować logikę awaryjną. Hardcoding limitów prowadzi do problemów, gdy Anthropic zmienia swoje polityki – jak wprowadzenie tygodniowych limitów dla użytkowników Claude Code w sierpniu 2025 roku.

TechCrunch informował, że Anthropic wprowadził dodatkowe tygodniowe limity dla subskrybentów Pro i Max, pozostawiając istniejące 5-hour rolling limits. Firma wskazała, że to odpowiedź na użytkowników, którzy "ciągle w tle, 24/7" używali Claude Code oraz na nadużycia związane z dzieleniem kont czy resellingiem. Subskrybenci Max mogą kupować dodatkowe użycie według standardowych stawek API. Według Anthropic, zmiany dotknęły poniżej 5% subskrybentów, bazując na wzorcach użycia.

W kontekście tych zmian, nowe Rate Limits API daje administratorom widoczność w struktury limitów, które coraz bardziej kształtują zarządzanie workflowami opartymi na Claude. Jest to szczególnie ważne dla platform wielo-tenantowych, systemów orkiestracji agentów czy narzędzi dla programistów, które kierują zapytania do różnych modeli Claude.

Memory for Claude Managed Agents: stanowa pamięć dla agentów

Memory for Claude Managed Agents: stanowa pamięć dla agentów

Równolegle, Memory for Claude Managed Agents weszła w publiczną beta. Ta funkcja jest kluczowa dla agentowych workflowów – długotrwałych, stateful procesów, gdzie agent musi zachować kontekst między różnymi krokami czy sesjami. Dotyczy to np. agentów kodujących, którzy pracują nad projektem przez wiele godzin; agentów wsparcia klienta, którzy prowadzą konwersację; czy automatyzacji workflowów, które koordynują wieloetapowe zadania.

Pamięć pozwala agentowi Claude utrzymywać stan między różnymi interakcjami, co redukuje potrzebę ciągłego rekonstruowania kontekstu i poprawia efektywność oraz doświadczenie użytkownika.

Warto zauważyć, że Rate Limits API wyraźnie wyklucza Managed Agents z endpointu limitów organizacji, co sugeruje, że Managed Agents mają swoje własne powierzchnie produktowe i mogą być zarządzane oddzielnie. To pokazuje, że Anthropic rozwija infrastrukturę enterprise/agent w sposób modularny.

Kontekst zmian modelowych: Claude i wycofanie Haiku

Rate Limits API pojawia się w czasie, gdy Anthropic wydał najnowsze modele z rodziny Claude. Z drugiej strony, firma stopniowo skupia się na nowszych rodzinach modeli i bardziej zaawansowanych kontrolach platformowych.

Wnioski dla developerów i platform engineers

Dla zespołów web dev, AI, hosting i DevOps te zmiany są wyraźnym sygnałem: planowanie operacyjne w integracji z Claude staje się konieczne.


Źródła

Komentarze

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Wymagane pola są oznaczone *