Autor: redakcja

  • Claude Code v2.1.81 wprowadza flagę `–bare` dla automatyzacji i naprawia kluczowe błędy

    Claude Code v2.1.81 wprowadza flagę `–bare` dla automatyzacji i naprawia kluczowe błędy

    Nowa wersja Claude Code, wydana 20 marca 2026 roku, przynosi istotne udoskonalenia w automatyzacji workflowów i rozwiązuje szereg problemów wpływających na stabilność środowiska programistycznego. Wersja 2.1.81 bazuje na fundamentach wcześniejszej aktualizacji 2.1.80, która poprawiała wsparcie dla pluginów i widoczność limitów rate limitingu, ale idzie o krok dalej, skupiając się na niezawodności i efektywności operacji skryptowych.

    Nowa flaga --bare usprawnia automatyzację

    Najbardziej znaczącą zmianą w tym wydaniu jest wprowadzenie flagi --bare. To specjalny tryb przeznaczony dla wywołań skryptowych z parametrem -p (prompt). Jego działanie jest radykalne: całkowicie omija uruchamianie hooków, Language Server Protocol (LSP), synchronizację pluginów oraz przeszukiwanie katalogów skill. Funkcja auto-memory jest w tym trybie całkowicie wyłączona.

    Do działania tego trybu wymagane jest przekazanie klucza API Anthropic poprzez zmienną środowiskową ANTHROPIC_API_KEY lub za pomocą apiKeyHelper w parametrze --settings (uwierzytelnianie OAuth i keychain są wyłączone). Flaga --bare jest skierowana głównie do środowisk DevOps, CI/CD pipelines i przetwarzania wsadowego (batch processing). Szczególnie przydaje się w scenariuszach "vibe coding", gdzie skrypty działają bez interaktywnego UI i zależności od pluginów.

    Choć oficjalne statystyki wydajności nie zostały udostępnione, cel jest jasny: minimalizacja opóźnień przy wysokiej częstotliwości wywołań automatycznych. To przejście Claude Code z roli narzędzia głównie interaktywnego w stronę stabilnego i szybkiego silnika do operacji backendowych.

    Usprawnienia UX: od MCP do zarządzania sesjami

    Usprawnienia UX: od MCP do zarządzania sesjami

    Poza automatyzacją, wersja 2.1.81 skupia się na poprawie codziennego user experience. W Model Control Protocol (MCP) wywołania narzędzi read i search są teraz zwijane do jednej linii Queried {server} dla większej czytelności. Pełny output można rozwinąć za pomocą skrótu Ctrl+O.

    Claude w trybie interaktywnym sugeruje teraz użycie trybu bash (!) dla poleceń systemowych, co ułatwia odkrywanie tej funkcji. Mechanizm odświeżania pluginów został uszczelniony – pluginy śledzone przez ref (np. przez Git) są teraz ponownie klonowane przy każdym ładowaniu, co zapewnia natychmiastową aktualizację z upstreamu.

    W przypadku sesji Remote Control tytuły są odświeżane już po trzeciej wiadomości, a generowane przez AI tytuły pojawiają się w ciągu sekund. Tryb Plan domyślnie ukrywa teraz opcję "clear context", co zapobiega przypadkowemu usunięciu kontekstu (można ją przywrócić ustawieniem "showClearContextOnPlanAccept": true). Sesje są teraz również poprawnie wznawiane w oryginalnym worktree.

    Rozwiązanie krytycznych błędów dla stabilności

    Rozwiązanie krytycznych błędów dla stabilności

    To wydanie jest również istotnym patchem stabilizacyjnym. Naprawiono uciążliwy problem z OAuth/Authentication, w którym równoległe sesje wymagały niepotrzebnego ponownego uwierzytelniania podczas odświeżania tokena. Jest to kluczowe dla osób pracujących nad wieloma projektami jednocześnie.

    W trybie voice naprawiono błąd, przez który błąd ponowienia (retry failure) był ignorowany, a użytkownik widział tylko ogólny komunikat "check network". Teraz wyświetlane są rzeczywiste błędy. Dodano też mechanizm recovery audio przy zerwaniu połączenia WebSocket.

    Dla użytkowników enterprise korzystających z proxy (np. Vertex, Bedrock), flaga CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS teraz poprawnie blokuje nagłówki structured-outputs, co eliminuje błędne kody 400.

    Naprawiono race condition w agentach działających w tle, która mogła prowadzić do zawieszania się procesów podczas pollingu. W obszarze bezpieczeństwa hooki PreToolUse nie omijają już reguł deny. Dodano nową funkcję --channels permission relay — serwery kanałów deklarujące odpowiednie zdolności mogą teraz przekazywać prośby o zatwierdzenie użycia narzędzi na telefon użytkownika.

    Lista pozostałych poprawek jest obszerna: zachowanie znaków CRLF w narzędziu Write, wycieki pamięci przy komunikatach o postępie, działanie hooków pluginów w usuniętych katalogach, błędy krytyczne w Node.js 18 oraz zbędne prośby o uprawnienia Bash. Na systemie Windows wyłączono line-by-line streaming z powodu problemów z renderowaniem i naprawiono obsługę zmiennej PATH dla VS Code z Git Bash.

    Wnioski

    Claude Code v2.1.81 to wydanie, które choć nie rewolucjonizuje głównej funkcjonalności AI, znacząco wzmacnia fundamenty narzędzia. Flaga --bare otwiera nowe możliwości w automatyzacji, gdzie szybkość i brak narzutu (overheadu) są kluczowe. Liczne poprawki uwierzytelniania, trybu voice, obsługi proxy i stabilności sesji sprawiają, że środowisko jest bardziej niezawodne w profesjonalnych, złożonych sesjach programistycznych.

    To wyraźny sygnał, że rozwój Claude Code zmierza w stronę nie tylko inteligentniejszego asystenta, ale także stabilnego i łatwego w integracji narzędzia deweloperskiego, zdolnego do pracy zarówno w trybie interaktywnym, jak i w zautomatyzowanych pipeline'ach.

  • Claude Code 2.1.80: lepsze wsparcie pluginów i widoczność limitów szybkości

    Claude Code 2.1.80: lepsze wsparcie pluginów i widoczność limitów szybkości

    Kolejna aktualizacja Claude Code, oznaczona numerem wersji 2.1.80, przynosi znaczące usprawnienia w dwóch kluczowych dla programistów obszarach: zarządzaniu wtyczkami i monitorowaniu zużycia zasobów. To nie tylko kosmetyczne poprawki, ale zmiany, które realnie wpływają na codzienną pracę z tym asystentem AI.

    Choć oficjalne release notes są dość oszczędne w szczegóły, udało się wyłuskać najważniejsze nowości i poprawki, które trafiły do narzędzia. Wersja 2.1.80 skupia się na większej przejrzystości i wygodzie, zwłaszcza dla osób, które intensywnie korzystają z Claude.ai i rozbudowują swoje środowisko o dodatkowe funkcje.

    Monitoring rate limitów bezpośrednio w statusline

    Jedną z najbardziej praktycznych nowości jest dodanie monitorowania limitów (rate limits) API Claude.ai bezpośrednio do paska statusu. Do skryptów statusline dodano nowe pole rate_limits, które wyświetla wykorzystanie limitów w dwóch horyzontach czasowych: pięciogodzinnym oknie kroczącym i tygodniowym pułapie.

    Co to oznacza w praktyce? Programiści mogą teraz na bieżąco śledzić used_percentage – czyli procent wykorzystanego limitu – oraz sprawdzać znacznik czasowy resets_at, który informuje, kiedy limity zostaną zresetowane. To cenna informacja, zwłaszcza dla zespołów pracujących nad większymi projektami, gdzie zużycie tokenów i godzin obliczeniowych może szybko rosnąć.

    Warto przypomnieć, że Claude Code działa w systemie dwupoziomowym. Pierwsza warstwa to pięciogodzinne okno kroczące, które kontroluje aktywność w krótkich seriach. Druga to tygodniowy limit, który ogranicza całkowitą liczbę aktywnych godzin obliczeniowych. Dla planu Pro przekłada się to na około 40–80 godzin tygodniowo przy użyciu modeli Sonnet, a najwyższy plan Max oferuje nawet do 480 godzin Sonnet lub 40 godzin Opus – w zależności od liczby równoległych sesji i złożoności modeli.

    Podgląd nowej funkcji: Kanały (Channels)

    Podgląd nowej funkcji: Kanały (Channels)

    Wersja 2.1.80 wprowadza nową, eksperymentalną funkcję oznaczoną jako research preview. Chodzi o flagę --channels, która umożliwia serwerom MCP bezpośrednie przesyłanie wiadomości do sesji użytkownika. Ta nowa funkcja pozwala na kontrolę asystenta przez zewnętrzne kanały, takie jak Telegram czy Discord, i wymaga logowania przez claude.ai (klucze API nie są obsługiwane).

    Na razie to tylko zapowiedź możliwości, ale kierunek jest ciekawy. Taki mechanizm może pozwolić na bardziej dynamiczne interakcje, np. otrzymywanie powiadomień z systemów CI/CD, alertów monitoringu czy wiadomości z czatów zespołowych bezpośrednio w interfejsie Claude Code.

    Podsumowanie

    Aktualizacja Claude Code do wersji 2.1.80 nie jest rewolucją, ale solidnym krokiem w ewolucji narzędzia. Skupia się na tym, co ważne dla programistów na co dzień: przejrzystości (rate limits) i nowych możliwościach integracji (kanały).

    Nowy system monitoringu limitów to odpowiedź na realną potrzebę użytkowników, którzy chcą kontrolować koszty i zużycie zasobów. Eksperymentalna funkcja kanałów pokazuje kierunek rozwoju w stronę bardziej dynamicznej i zintegrowanej komunikacji.

    Wersja 2.1.80 utrzymuje trend, w którym Claude Code staje się nie tylko asystentem AI, ale coraz bardziej zintegrowanym środowiskiem deweloperskim, które dba o widoczność kluczowych metryk i oferuje sensowne, pragmatyczne ulepszenia interfejsu.

  • Gemini CLI nabiera rozpędu: stabilna wersja 0.35.2 z klawiszami Vima i trybem Plan

    Gemini CLI nabiera rozpędu: stabilna wersja 0.35.2 z klawiszami Vima i trybem Plan

    Projekt Gemini CLI nie zwalnia tempa. Właśnie opublikowano nową stabilną wersję, która wprowadza długo wyczekiwane usprawnienia dla programistów, zwłaszcza fanów Vima. To jednak tylko część obrazu, bo równolegle trwają intensywne prace na kanale nightly, zwiastujące kolejne poważne zmiany w tej otwartoźródłowej konsolowej bramie do modeli Gemini. Wygląda na to, że narzędzie systematycznie przekształca się z ciekawostki w dojrzałe i potężne środowisko pracy.

    Stabilny fundament: co nowego w najnowszej wersji

    Najnowsza stabilna odsłona skupia się na tym, co najważniejsze: produktywności i elastyczności bezpośrednio w terminalu. Kluczową nowością jest pełna konfigurowalność skrótów klawiaturowych. Programiści mogą teraz definiować własne mapowania klawiszy, a także korzystać z wiązań dosłownych znaków. To ogromny krok w personalizacji, pozwalający dostosować interakcję z AI do indywidualnego, często bardzo ugruntowanego, workflow.

    Pod maską działa też usprawniony mechanizm kontekstowy. W dużym skrócie, narzędzia systemu plików ładują kontekst „w ostatniej chwili”. Dzięki temu model otrzymuje najbardziej aktualne i istotne informacje, bez konieczności natychmiastowego przesyłania wszystkich danych. Przekłada się to na lepszą wydajność i celność odpowiedzi.

    Ulepszenia dla użytkowników Vima

    Jedna z bolączek wcześniejszych wersji – ograniczony tryb Vima – doczekała się poprawek. W Gemini CLI dostępny jest vim mode, który można przełączać i który oferuje podstawową nawigację w trybach NORMAL i INSERT. Pozwala to na bardziej naturalną edycję osobom przyzwyczajonym do skrótów Vima.

    Dokumentacja wskazuje na ciągły rozwój tej funkcji, a społeczność zgłasza zapotrzebowanie na dodatkowe, zaawansowane mapowania klawiszy, takie jak operacje na znakach czy pełne wsparcie dla rejestrów. Obecna implementacja stanowi krok w kierunku lepszej integracji z workflow opartym na Vimie.

    Tryb Plan: architektoniczny asystent

    Do projektu trafił nowy tryb pracy o nazwie Plan Mode. To interesujące podejście do współpracy z AI. Tryb ten, dostępny w ustawieniach jako tryb zatwierdzania (plan approval mode), został zaprojektowany do analizy kodu i planowania zmian.

    Jak to działa w praktyce? Po aktywacji Gemini CLI może przeglądać kod, analizować zależności i planować skomplikowane zmiany, które wymagają recenzji i zatwierdzenia przez użytkownika przed wykonaniem. To jak sesja strategiczna, w której AI przedstawia plan działania, a programista decyduje, co i jak chce wdrożyć. Funkcja ta jest niezwykle przydatna do eksploracji nieznanego codebase'u lub planowania refaktoryzacji z zachowaniem pełnej kontroli.

    Kanał nightly: gdzie rodzi się przyszłość

    Kanał nightly: gdzie rodzi się przyszłość

    Podczas gdy gałąź stabilna oferuje dopracowane funkcje, prawdziwe laboratorium innowacji znajduje się w nightly builds. To tam testowane są najbardziej eksperymentalne pomysły, które często trafiają później do wersji preview, a ostatecznie do stabilnej. Obecny cykl rozwojowy jest wyjątkowo intensywny.

    Rozwijane są nowe funkcje, a system telemetrii jest stale ulepszany. Obsługa modeli jest poszerzana, oferując użytkownikom coraz więcej opcji w portfolio.

    Usprawnienia dla developerów

    Dla developerów pracujących ze skryptami przydatne mogą być różne flagi wyjścia, które pozwalają na bardziej strukturyzowaną interakcję z narzędziem. Praktyczne jest też bezpośrednie osadzanie kontekstu z plików w poleceniach, co eliminuje potrzebę ręcznego kopiowania kodu.

    Drobna, ale miła dla oka zmiana: wskaźniki trybów pomagają w orientacji, w jakim stanie znajduje się obecnie interfejs.

    Podsumowanie: konsekwentna droga do dojrzałości

    Gemini CLI rozwija się w sposób systematyczny. Projekt jasno rozdziela ścieżki: stable dla codziennej, niezawodnej pracy, preview do testowania nowości tuż przed premierą oraz nightly dla śmiałych eksperymentów. Najnowsze zmiany, takie jak konfigurowalne skróty i ulepszenia trybu Vima, to bezpośrednia odpowiedź na potrzeby społeczności.

    Jednocześnie prace nad nowymi trybami, takimi jak Plan, pokazują, że twórcy myślą o nowych paradygmatach współpracy z AI. Nie jest to już zwykły wrapper na API, a coraz bogatsze, samodzielne środowisko deweloperskie. Jeśli tempo i kierunek rozwoju się utrzymają, Gemini CLI może stać się nieodzownym narzędziem w terminalu każdego programisty, który chce mieć możliwości Geminiego zawsze pod ręką, bez odrywania się od klawiatury.

  • Premiera Lyria 3 Pro: Google wydłuża AI do generowania muzyki do 3 minut

    Premiera Lyria 3 Pro: Google wydłuża AI do generowania muzyki do 3 minut

    25 lutego 2026 roku Google zaprezentował znaczącą aktualizację swoich narzędzi AI do tworzenia muzyki. Model Lyria 3 Pro to bezpośredni następca Lyrii 3, która zadebiutowała zaledwie miesiąc wcześniej. Podczas gdy pierwsza wersja pozwalała generować jedynie 30-sekundowe utwory, nowy wariant „Pro” radykalnie wydłuża ten limit. Nie chodzi tylko o czas trwania – wraz z długością pojawia się możliwość tworzenia złożonych struktur muzycznych.

    Co potrafi Lyria 3 Pro? Kluczowe możliwości

    Główną nowością jest oczywiście wydłużenie generowanych treści. Dłuższe utwory pozwalają na stworzenie pełnoprawnej piosenki z intro, zwrotkami, refrenem i bridge’em. Model akceptuje zarówno prompty tekstowe, jak i obrazkowe, co otwiera nowe możliwości przed twórcami. Można opisać nastrojową scenę w lesie deszczowym i uzyskać dopasowaną ścieżkę dźwiękową lub przesłać abstrakcyjne zdjęcie i pozwolić AI na jego dźwiękową interpretację.

    Jakość wyjściowa to high-fidelity stereo w formacie 48 kHz. Lyria 3 Pro generuje nie tylko instrumentalne podkłady, ale też linie wokalne wraz z tekstem. Dzięki temu model jest przydatny nie tylko dla amatorów, ale i dla profesjonalistów potrzebujących szybkich demówek, producentów podcastów, vlogerów szukających unikalnego tła dźwiękowego czy deweloperów gier, którzy chcą tworzyć dynamiczne ścieżki dźwiękowe.

    Tryby generowania i kontrola nad utworem

    Google wprowadził różne tryby działania modelu, aby dopasować go do konkretnych potrzeb i budżetów. Do szybkich eksperymentów służy tryb „Fast”, który w ciągu kilkunastu sekund generuje 30-sekundowy fragment. To wersja darmowa, dostępna w aplikacji Gemini. Przed użytkownikami subskrybującymi płatne plany Gemini (Plus, Pro, Ultra) otwierają się jednak pełne możliwości narzędzia.

    Dostępne są tryby „Thinking” i „Pro”, które wykorzystują większą moc obliczeniową do tworzenia dłuższych, bardziej złożonych kompozycji. Co istotne, twórca ma teraz znacznie bardziej szczegółową kontrolę nad finalnym utworem. Można określić nie tylko gatunek muzyczny czy tempo, ale też dokładnie zaplanować strukturę: wskazać, gdzie ma się zaczynać intro, po ilu sekundach ma wejść wokal, a w którym momencie powinien pojawić się dynamiczny bridge.

    Znaczenie znaków wodnych i weryfikacja pochodzenia

    Wraz z rozwojem możliwości generatywnej AI narasta problem weryfikacji pochodzenia treści. Google, odpowiadając na tę potrzebę, implementuje w swoich modelach systemy cyfrowych znaków wodnych (watermarks). Są one niesłyszalne dla ludzkiego ucha, ale mogą zostać odczytane przez dedykowane narzędzia.

    Ich obecność pozwoli w przyszłości potwierdzić, że dany utwór został wygenerowany przez AI. Jest to kluczowe w kontekście platform streamingowych, takich jak Spotify czy Deezer, które już wprowadzają mechanizmy oznaczania treści AI, a także dla ochrony praw autorskich i zapewnienia przejrzystości dla słuchaczy. Dla profesjonalnych twórców korzystających z outputu Lyrii takie oznaczenia mogą służyć jako swego rodzaju certyfikat pochodzenia.

    Dostępność: od aplikacji Gemini po Vertex AI dla deweloperów

    Google udostępnił Lyria 3 Pro w kluczowych punktach swojego ekosystemu. Podstawowym miejscem dostępu dla użytkowników indywidualnych jest aplikacja Gemini z płatną subskrypcją. Model jest również dostępny na platformach dla twórców, takich jak YouTube Dream Track.

    Dla deweloperów i firm najważniejsze są jednak integracje z API. Gemini API oraz Vertex AI pozwalają na włączenie generowania muzyki do własnych aplikacji i usług. Otwiera to ogromne możliwości dla branży web developmentu, szczególnie w niszach związanych z „vibe coding”, interaktywnymi doświadczeniami online czy platformami oferującymi dynamiczne soundtracki. Deweloper może teraz za pomocą kilku linijek kodu dodać do swojej aplikacji funkcję generowania unikalnej muzyki na żądanie, reagującej na działania użytkownika.

    Podsumowanie: AI wkracza w nową fazę produkcji muzycznej

    Premiera Lyria 3 Pro nie jest jedynie drobną poprawką techniczną. To sygnał, że generatywna sztuczna inteligencja w dziedzinie audio weszła w kolejny etap. Wydłużenie czasu generowania i oddanie kontroli nad pełną strukturą utworu zmienia ją z ciekawostki w praktyczne narzędzie produkcyjne.

    Dla twórców oznacza to nowy, potężny instrument, który może służyć do szukania inspiracji, prototypowania, a nawet finalnej produkcji mniej wymagających projektów dźwiękowych. Dla branży tech, zwłaszcza związanej z web devem i AI, stwarza nowy, gotowy do implementacji moduł, który może zdefiniować przyszłość interaktywnych mediów. Wdrażanie znaków wodnych pokazuje również, że Google świadomie buduje ten ekosystem z myślą o odpowiedzialnym rozwoju i weryfikowalności treści.

  • Kontrowersje wokół Cursor Composer 2: Oskarżenia o przebranie modelu Kimi K2.5 i naruszenie licencji

    Kontrowersje wokół Cursor Composer 2: Oskarżenia o przebranie modelu Kimi K2.5 i naruszenie licencji

    W świecie AI, gdzie każdy ogłasza przełom, czasem najgłośniejszym echem odbija się nie sam model, ale to, co ukryto drobnym drukiem. Tak właśnie stało się z Cursor Composer 2, narzędziem do kodowania, które zamiast aplauzu zebrało burzę krytyki. Chodzi o brak transparentności co do jego prawdziwego pochodzenia. Okazało się, że rozwiązanie chwalone jako własna, zaawansowana technologia Cursor, jest w istocie fine-tune'em chińskiego, open-source'owego modelu Kimi K2.5 od Moonshot AI.

    Sprawa wyszła na jaw błyskawicznie, bo już w ciągu doby od premiery w marcu 2026 roku. To klasyczny przykład tego, jak społeczność deweloperów potrafi prześwietlić każdy szczegół, a firmy muszą liczyć się z konsekwencjami pominięcia kluczowej informacji.

    Od głośnej premiery do szybkiego rozczarowania

    Cursor, popularne środowisko programistyczne, ogłosiło Composer 2 z wielkim rozmachem. W komunikacie prasowym chwalono się, że ich nowy, własny model do kodowania przebija wydajnością samego Claude'a Opus 4.6 od Anthropic w kluczowych benchmarkach, oferując przy tym niższy koszt. To była historia, w którą łatwo było uwierzyć: mała, zwinnie rozwijająca się firma pokonuje giganta.

    Entuzjazm nie trwał jednak długo. Deweloper o pseudonimie Finn odkrył w API Cursor ukryty identyfikator modelu, który jednoznacznie wskazywał na Kimi K2.5. Swoje odkrycie opublikował na platformie X, a dyskusja momentalnie przeniosła się na Hacker News. To nie były już tylko domysły – użytkownicy zaczęli analizować tokenizer i inne techniczne szczegóły, szukając podobieństw.

    Potwierdzenie przyszło z najbardziej wiarygodnego źródła – od samych twórców bazy. Pracownicy Moonshot AI, chińskiej firmy stojącej za modelem Kimi, przeanalizowali dane z API Cursor i publicznie stwierdzili, że Composer 2 używa identycznego tokenizera i należy do rodziny modeli Kimi. Określili go nawet mianem „dalszo wytrenowanej” wersji ich open-source'owego dzieła.

    Problem nie w użyciu, lecz w milczeniu

    Tutaj zaczyna się sedno całego zamieszania. Kimi K2.5 jest dostępny na otwartej licencji, która wyraźnie wymaga jednoznacznego przypisania autorstwa (attribution). Licencja obliguje użytkownika do stwierdzenia wprost: „to jest Kimi K2.5”. W pierwotnym wpisie na blogu Cursor, ogłaszającym premierę Composer 2, nie padło ani słowo o Moonshot AI, Kimi czy jakiejkolwiek bazowej technologii. Model przedstawiono jako całkowicie własny wysiłek inżynieryjny.

    Początkowo pojawiły się nawet oskarżenia, że Cursor nie tylko nie podał źródła, ale mógł też naruszyć warunki licencji lub nie uiścić należnych opłat. Sytuacja wyjaśniła się częściowo, gdy Moonshot AI wydało późniejsze oświadczenie. Firma potwierdziła, że Cursor uzyskał dostęp do modelu poprzez autoryzowaną, komercyjną umowę z platformą Fireworks AI. Nie było więc mowy o nielegalnym użyciu czy kradzieży własności intelektualnej.

    Problem pozostał jednak ten sam: fundamentalny brak przejrzystości. Cursor zbudował narrację o własnym, przełomowym modelu, kompletnie pomijając fakt, że stoi na barkach olbrzyma – i to olbrzyma, który wyraźnie żądał uznania autorstwa.

    Reakcja Cursor: Przyznanie się do błędu z opóźnieniem

    Reakcja Cursor: Przyznanie się do błędu z opóźnieniem

    Odpowiedź ze strony Cursor nadeszła po tym, jak dowody techniczne obiegły sieć. Współzałożyciel firmy (w doniesieniach prasowych wymieniany jako Michael Torell, Sualeh Asif lub po prostu „Robinson”) zabrał głos na platformie X. Jego oświadczenie było wyważone, ale jednoznacznie przyznawało się do winy.

    „Jestem wielkim zwolennikiem open source… To był błąd, że nie wspomnieliśmy o bazie Kimi w naszym wpisie na blogu od samego początku. Naprawimy to przy kolejnym modelu” – napisał. To kluczowe zdanie przeniosło dyskusję z płaszczyzny prawnej na etyczną. Cursor nie zaprzeczał faktom technicznym, ale przyznał, że zawiódł w kwestii transparentności, która jest fundamentem w świecie open source.

    Na forach dyskusyjnych Cursor społeczność programistów była podzielona. Wielu uznało, że sam fakt budowania zaawansowanego produktu na otwartej technologii jest słuszny i pragmatyczny. Jeden z użytkowników trafnie podsumował nastroje: „To, że Composer 2 to Kimi K2.5++, jest w porządku. Brak przejrzystości – już nie”.

    Co tak naprawdę kryje się pod nazwą Composer 2?

    Co tak naprawdę kryje się pod nazwą Composer 2?

    Warto wyjaśnić techniczną naturę tego, co zrobił Cursor. Composer 2 nie jest zwykłym „reskinem” – czyli przepakowaniem tego samego produktu w nową oprawę. To raczej zaawansowany fine-tune, a możliwe, że także proces treningu z wykorzystaniem uczenia ze wzmocnieniem (RL), przeprowadzony na solidnej, otwartej bazie, jaką jest Kimi K2.5.

    Taki proces pozwala znacznie poprawić zdolności modelu w wąskiej dziedzinie, jaką jest generowanie kodu. Efekt końcowy może być rzeczywiście lepszy od oryginału w specyficznych zadaniach, co potwierdzają benchmarki zaprezentowane przez Cursor. Firma nie skłamała co do wydajności. Jednak cała architektura bazowa, włączając w to tokenizer, pozostała niezmieniona i charakterystyczna dla rodziny modeli Kimi, co właśnie pozwoliło na tak szybką identyfikację.

    Szersze konsekwencje: Lekcja dla całej branży AI

    Ta z pozoru lokalna afera ma daleko idące implikacje dla sposobu, w jaki firmy technologiczne prezentują swoje osiągnięcia w erze AI.

    • Przejrzystość jako standard etyczny. Incydent potwierdził jasną tezę: korzystanie z open source to nie tylko prawo, ale i obowiązek informacyjny. Pominięcie przypisania autorstwa podważa zaufanie, które jest kluczowe w ekosystemie współpracy. To przestroga dla każdej firmy, która chce balansować między chronieniem własnego know-how a szanowaniem licencji, na których zbudowała swój produkt.

    • Rola społeczności w weryfikacji. Sytuacja pokazała też siłę oddolnego audytu. Dziś użytkownicy, deweloperzy i badacze mają narzędzia, by w ciągu kilku godzin zweryfikować marketingowe deklaracje poprzez analizę API, benchmarki czy tokenizery. Ogłoszenie premiery modelu to dopiero początek prawdziwego testu wiarygodności.

    • Geopolityczny wymiar open source. Sprawa nieoczekiwanie uwypukliła także trend geopolityczny. Chińskie firmy, takie jak Moonshot AI, stały się potężnymi graczami w dystrybucji zaawansowanych modeli AI. To komplikuje narrację o technologicznej supremacji Zachodu i rodzi pytania o długoterminowe konsekwencje takiej „dyplomacji open-source”.

    • Wpływ na praktyki rynkowe. Finalnie incydent może wymusić zmianę praktyk przy wprowadzaniu nowych modeli na rynek. Presja będzie rosła, by obok spektakularnych wykresów wydajności w komunikacie znalazło się również jasne określenie pochodzenia technologii. Wydajność przestanie być jedynym wyznacznikiem sukcesu; uczciwość i zgodność z duchem współpracy staną się równie istotne.

    Podsumowanie: Wartość prawdy w erze marketingu

    Sprawa Cursor Composer 2 to coś więcej niż chwilowa burza w mediach społecznościowych. To studium przypadku na temat tego, co naprawdę cenią deweloperzy i zaawansowani użytkownicy. Oczekują przełomów, ale wymagają szacunku dla otwartej współpracy, na której zbudowano współczesny ekosystem oprogramowania.

    Cursor popełnił błąd, pomijając kluczową informację, ale jego późniejsza reakcja pokazuje, że lekcja została odrobiona. Dla reszty branży powinien to być wyraźny sygnał: budowanie na open source to mocna strona, a nie wstydliwy sekret. Szczerość co do pochodzenia technologii nie umniejsza wartości dopracowanego fine-tune'u czy wygodnego interfejsu – wręcz przeciwnie, buduje zaufanie i wiarygodność, które są o wiele trudniejsze do zdobycia niż kilka punktów procentowych w benchmarku. W dłuższej perspektywie to właśnie to zaufanie decyduje o sukcesie lub porażce.

  • Google Antigravity 1.20.6: Naprawiono kluczową blokadę w tworzeniu reguł i workflow

    Google Antigravity 1.20.6: Naprawiono kluczową blokadę w tworzeniu reguł i workflow

    Google Antigravity, agentowe IDE, które na starcie mocno poruszyło społeczność programistów, otrzymało nową, pozornie drobną aktualizację. Wersja 1.20.6, która trafiła do użytkowników w połowie marca 2026 roku, skupia się na jednym, lecz absolutnie kluczowym problemie. Chodzi o naprawę błędu uniemożliwiającego tworzenie własnych reguł i workflow – fundamentu personalizacji w tym środowisku.

    Choć w oficjalnym changelogu widnieje tylko jedna pozycja: „Fix for customizations creation”, dla wielu deweloperów ta poprawka oznacza powrót do pełni funkcjonalności. Bez możliwości definiowania własnych reguł cała koncepcja „vibe coding” i zarządzania pracą autonomicznych agentów stawała pod znakiem zapytania.

    Co konkretnie naprawiono w aktualizacji 1.20.6?

    Zgodnie z release notes, głównym i jedynym celem wersji 1.20.6 było usunięcie błędu, który blokował użytkownikom tworzenie nowych dostosowań (customizations). W praktyce chodziło o niemożność definiowania własnych reguł (rules) i przepływów pracy (workflows) wewnątrz platformy.

    To nie jest drobna uciążliwość, a poważna blokada. Reguły w Google Antigravity to mechanizm, za pomocą którego deweloperzy „uczą” swoje agenty specyficznych standardów kodowania, formatowania commitów, preferencji architektonicznych czy zasad code review. Agent, działający w oparciu o modele Gemini, ma te reguły automatycznie uwzględniać, co jest esencją spersonalizowanej, wydajnej współpracy między człowiekiem a AI.

    Wiele wskazuje na to, że błąd mógł być skutkiem ubocznym wcześniejszych aktualizacji. Niektórzy użytkownicy na forach wspominali o problemach z rozpoznawaniem workspace’ów po upgrade’ach, co skutkowało utratą dostępu do zdefiniowanych wcześniej reguł. Aktualizacja 1.20.6 ma być odpowiedzią na te problemy, przywracając podstawową funkcję tworzenia i zarządzania customizacjami.

    Stopniowy rollout i kontekst poprzednich wersji

    Jak to często bywa w przypadku narzędzi Google, nowa wersja Antigravity jest wdrażana stopniowo. Proces rolloutu może trwać kilka dni, zanim aktualizacja dotrze do wszystkich użytkowników systemów Windows, macOS i Linux. Co istotne, platforma oferuje też tryb ręcznej aktualizacji w ustawieniach, pozwalając bardziej ostrożnym użytkownikom pozostać przy starszej, stabilnej wersji, jeśli nowa wprowadza niepożądane zmiany.

    Aby zrozumieć znaczenie tej małej poprawki, warto rzucić okiem na kontekst poprzednich wydań. Bezpośrednio przed 1.20.6 ukazała się wersja 1.20.5 (9 marca 2026), która niosła zestaw ogólnych ulepszeń stabilności i interfejsu użytkownika (3 improvements, 3 fixes, 1 patch). Wcześniej, pod koniec lutego, w wersji 1.20.3 wprowadzono m.in. formalną ścieżkę remediacji dla kont zawieszonych z powodu naruszenia regulaminu.

    To pokazuje, że zespół rozwija platformę wielotorowo: z jednej strony pracuje nad nowymi funkcjami i bezpieczeństwem, a z drugiej musi szybko reagować na krytyczne błędy funkcjonalne, takie jak ten związany z tworzeniem reguł. W świecie developmentu, gdzie automatyzacja przez agenty jest kluczowa, utrata możliwości ich precyzyjnego konfigurowania paraliżuje pracę.

    Dlaczego możliwość tworzenia własnych reguł jest tak ważna?

    Dlaczego możliwość tworzenia własnych reguł jest tak ważna?

    Google Antigravity od początku promowane było nie jako kolejny edytor kodu, ale jako „agent-first IDE”. Jego siłą nie jest sam edytor (choć oferuje znany z VS Code panel boczny dla agenta), lecz możliwość równoległego zarządzania wieloma autonomicznymi agentami w widoku Manager. Agenci potrafią tworzyć „Artefakty” – listy zadań, plany, zrzuty ekranu – i mają dostęp do edytora, terminala oraz przeglądarki.

    Jednak bez możliwości nadania im klarownych, spersonalizowanych instrukcji, ich autonomia może prowadzić do chaosu. Tu właśnie wkracza mechanizm reguł. W materiałach promocyjnych z marca 2026 wspominano o wsparciu dla plików agents.mmd, w których deweloperzy mogą definiować swoje standardy kodowania, format commitów czy preferencje. Agenci mają te zasady odczytywać i automatycznie się do nich stosować.

    Wyobraźmy sobie zespół, który ma ściśle określone konwencje nazewnictwa zmiennych, strukturę katalogów czy wymagania dotyczące testów. Wprowadzenie tych zasad jako reguł do Antigravity sprawia, że każdy agent działający na rzecz projektu będzie je respektował. To ogromna oszczędność czasu na mikrozarządzaniu i korektach. Blokada w tworzeniu takich reguł oznaczałaby więc powrót do ręcznego, żmudnego poprawiania sugestii AI.

    Nierozwiązane problemy i perspektywy użytkowników

    Nierozwiązane problemy i perspektywy użytkowników

    Choć aktualizacja 1.20.6 rozwiązuje palący problem, społeczność zwraca uwagę na inne, wciąż istniejące błędy. Jeden z użytkowników zgłasza na forum uporczywy problem specyficzny dla macOS na architekturze Apple Silicon: żądania agentów kończą się błędem HTTP 400 „Invalid project resource name projects/”. Problem ten, związany z serializacją, podobno przetrwał nawet aktualizację do 1.20.6 i wymaga lokalnych obejść (workarounds).

    Pojawiają się też głosy o innych kwestiach, jak różnice w limitach odświeżania między planami subskrypcyjnymi (8-dniowe blokady na planach płatnych vs 7-dniowe na darmowym), które mogą wpływać na płynność pracy. To przypomina, że rozwój tak złożonej, wieloplatformowej i opartej na chmurze AI aplikacji to ciągłe żonglowanie priorytetami.

    Mimo że jedna poprawka może wyglądać jak „literal nothingburger”, jak napisał jeden z użytkowników, to w rzeczywistości odblokowuje ona kluczowy element filozofii Antigravity. Platforma ma sens tylko wtedy, gdy deweloper może ją dostosować do swojego unikalnego flow i swojego „vibe’u”. Bez tej personalizacji jest po prostu kolejnym edytorem z chatbotem.

    Podsumowanie: Mała poprawka, duże znaczenie dla workflow

    Wydanie Google Antigravity 1.20.6 to klasyczny przykład „critical fix”. Z punktu widzenia liczby pozycji w changelogu aktualizacja jest minimalna. Z punktu widzenia użytkownika, który polega na autonomii agentów i ich precyzyjnym dostrojeniu, jest to aktualizacja niezbędna.

    Przywrócenie możliwości tworzenia i zarządzania customizacjami, regułami i workflow oznacza przywrócenie kontroli nad procesem developmentu. Pozwala deweloperom w pełni wykorzystać potencjał „vibe coding”, gdzie agenci nie tylko wykonują zadania, ale robią to zgodnie z ustalonymi, wewnętrznymi standardami.

    Dla społeczności skupionej wokół web developmentu, AI i DevOps, gdzie automatyzacja i spójność są na wagę złota, ta naprawa jest kluczowa. Pokazuje też, że zespół Google Antigravity aktywnie słucha feedbacku i reaguje na blokujące problemy, nawet jeśli ich rozwiązanie nie jest opatrzone fanfarami nowych funkcji. W końcu najważniejsza innowacja to ta, która po prostu działa.

  • Claude Code 2.1.77: Znaczący wzrost limitów tokenów i poprawa wydajności

    Claude Code 2.1.77: Znaczący wzrost limitów tokenów i poprawa wydajności

    Nowa wersja asystenta programistycznego Claude Code przynosi jedną z najbardziej wyczekiwanych przez społeczność developerów zmian – znaczne zwiększenie limitów tokenów dla najwydajniejszych modeli. To nie wszystko, ponieważ aktualizacja skupia się także na stabilności, szybkości działania i naprawie wielu drobnych, ale uciążliwych błędów. Dla osób wykorzystujących AI do pisania kodu, audytów czy refaktoryzacji, jest to istotne usprawnienie codziennego workflow.

    Główne zmiany: więcej miejsca na kod i dłuższe odpowiedzi

    Bez wątpienia flagową nowością jest podniesienie domyślnego maksymalnego rozmiaru odpowiedzi. Dla modeli Claude standardowy limit kontekstu wynosi 200 tysięcy tokenów, z możliwością rozszerzenia do 1 miliona tokenów w przypadku modelu Opus. To ogromna przestrzeń, pozwalająca na wygenerowanie lub przeanalizowanie dużych fragmentów kodu w jednym podejściu. Jest to często kluczowa kwestia przy pracy nad złożonymi modułami czy architekturą.

    Tak wysoki limit otwiera drzwi do zaawansowanych scenariuszy, choć prawdopodobnie będzie wymagał odpowiednich zasobów i konfiguracji. Dla porównania, wcześniejsze wersje systemu operowały na niższych wartościach, a obecne zwiększenie limitu to bezpośrednia odpowiedź na potrzeby programistów pracujących z dużymi bazami kodu.

    Pod maską: szybszy start i lepsza obsługa sesji

    Wydajność to drugi filar tej aktualizacji. Zespół odpowiedzialny za Claude Code położył duży nacisk na optymalizację, szczególnie odczuwalną na komputerach Mac. Dzięki wprowadzonym usprawnieniom czas startu aplikacji na macOS uległ skróceniu. Brzmi to jak drobiazg, ale przy wielokrotnym uruchamianiu narzędzia w ciągu dnia te ulepszenia sumują się, poprawiając płynność pracy.

    Duże ulepszenia dotyczą też mechanizmu wznawiania zapisanych sesji. W przypadku bardzo rozbudowanych konwersacji z wieloma wątkami czas ładowania uległ skróceniu, a zużycie pamięci operacyjnej w trakcie tego procesu spadło. Jest to istotne, ponieważ długie sesje analityczne są jedną z mocnych stron Claude Code, a zarządzanie nimi staje się teraz szybsze i mniej obciążające dla systemu.

    Ważne poprawki błędów i dopracowanie szczegółów

    Ważne poprawki błędów i dopracowanie szczegółów

    Lista poprawek jest długa i dotyczy wielu aspektów, od uprawnień po integracje z innymi narzędziami. Kilka kluczowych naprawionych problemów:

    • Uprawnienia dla złożonych komend bash: Poprawiono błąd, w którym opcja „Zawsze zezwalaj” dla poleceń tworzyła nieprawidłową regułę, co skutkowało ciągłym ponawianiem pytań o uprawnienia. Teraz funkcja ta działa prawidłowo.
    • Bezpieczeństwo hooków: Wprowadzono poprawki dotyczące hooków, takich jak PreToolUse, zwiększające kontrolę nad działaniem modeli w środowiskach produkcyjnych i enterprise.
    • Stabilność pracy w tmux i VS Code: Wprowadzono szereg poprawek zwiększających stabilność podczas pracy w terminalu tmux oraz lepszą integrację z VS Code, szczególnie gdy Claude Code jest uruchamiany wewnątrz tych środowisk.
    • Tryb vim i kopiowanie: Załatano drobne, ale irytujące błędy, takie jak problemy z obsługą hiperłączy.
    • Zarządzanie pamięcią (memory growth): Wprowadzono optymalizacje zarządzania pamięcią w długo działających sesjach, aby aplikacja pozostawała responsywna nawet po wielu godzinach ciągłej pracy.

    Nowe opcje i ulepszenia dla developerów

    Oprócz poprawek pojawiły się także nowe możliwości konfiguracji. W ustawieniach sandboxa dodano opcje oferujące bardziej elastyczną, precyzyjną kontrolę dostępu do systemu plików. Jest to szczególnie przydatne w skomplikowanych środowiskach deweloperskich.

    Ulepszono również polecenia związane z zarządzaniem historią rozmowy – to proste zmiany, które realnie pomagają przy pracy z wieloma odpowiedziami.

    Kontekst rozwoju i znaczenie aktualizacji

    Ta wersja wpisuje się w szerszą serię aktualizacji skupiających się na fundamentach: pojemności modeli, szybkości i niezawodności. Wcześniejsze wydania wprowadzały już znaczące optymalizacje, takie jak redukcja ponownego renderowania promptów czy mniejsze zużycie pamięci przy starcie. Obecna wersja kontynuuje ten trend.

    To kolejny krok w ewolucji zarządzania kontekstem. Wcześniejsze wersje redukowały rozmiar promptu systemowego, aby „zaoszczędzone” miejsce oddać użytkownikowi. Teraz programiści otrzymują jeszcze większą przestrzeń roboczą.

    Dla kogo jest ta aktualizacja?

    Ta wersja to must-have przede wszystkim dla:

    1. Programistów pracujących nad dużymi plikami lub architekturą, którzy regularnie napotykali ograniczenia długości odpowiedzi.
    2. Użytkowników macOS, którzy odczują usprawnione uruchamianie aplikacji.
    3. Osób prowadzących długie, złożone sesje analityczne, które są teraz sprawniej obsługiwane.
    4. Zespołów enterprise, dla których kluczowe są poprawki w zakresie bezpieczeństwa hooków i kontroli dostępu.
    5. Miłośników pracy w terminalu z tmux i vimem, którzy otrzymali bardziej stabilne środowisko.

    Podsumowanie

    Najnowsza aktualizacja Claude Code nie wprowadza rewolucyjnych funkcji wizualnych, ale dostarcza namacalnych ulepszeń w obszarach najważniejszych dla programistów. Zwiększenie limitu tokenów to bezpośrednia odpowiedź na potrzebę generowania bardziej złożonych fragmentów kodu. Optymalizacje startu i wznawiania sesji czynią codzienną pracę płynniejszą, a długa lista poprawek sprawia, że narzędzie działa w sposób bardziej przewidywalny i niezawodny. To aktualizacja, która solidnie buduje fundamenty pod dalszy rozwój i bardziej wymagające zastosowania AI w inżynierii oprogramowania.

  • Codex 0.115.0: pełna inspekcja obrazów, transkrypcje na żywo i zaawansowane API

    Codex 0.115.0: pełna inspekcja obrazów, transkrypcje na żywo i zaawansowane API

    Najnowsze aktualizacje Codex, autonomicznego agenta AI do kodowania i automatyzacji od OpenAI, wprowadzają szereg znaczących ulepszeń, które mogą zmienić sposób pracy deweloperów. Najważniejsze nowości skupiają się na integracjach, narzędziach CLI/SDK oraz stabilności codziennych workflowów. To nie tylko rozwój funkcjonalności, ale też solidna porcja usprawnień technicznych.

    Integracje z narzędziami designerskimi i komunikacyjnymi

    Jednym z kluczowych obszarów rozwoju są integracje z popularnymi platformami, takimi jak Figma. Pozwala to deweloperom i designerom na płynną współpracę, w której Codex może asystować przy analizie interfejsów użytkownika (UI) i flow projektowych bezpośrednio w znanych narzędziach. Podobne integracje z platformami komunikacyjnymi, takimi jak Slack, umożliwiają włączanie automatyzacji do codziennej komunikacji zespołowej.

    Te połączenia wskazują na ewolucję Codex z narzędzia stricte programistycznego w stronę platformy automatyzacji procesów deweloperskich i projektowych, działającej w kontekście istniejących aplikacji.

    Rozwój CLI, SDK i środowiska deweloperskiego

    Codex oferuje rozbudowane narzędzia wiersza poleceń (CLI) oraz SDK (głównie w TypeScript), które stanowią podstawę interakcji z agentem. Środowisko to jest stale rozwijane, aby zapewnić programistom potężne i elastyczne możliwości automatyzacji.

    Funkcjonalności obejmują zaawansowane zarządzanie wykonywaniem poleceń ze wsparciem dla streamingu stdin/stdout/stderr oraz TTY/PTY. Dla deweloperów pracujących z terminalami i kontenerami to istotne usprawnienie, które pozwala na lepszą integrację z istniejącym ekosystemem. SDK pozwala programistom łatwo integrować operacje Codexa z ich własnym kodem, zapewniając kontrolowany dostęp do automatyzacji.

    Stabilność i bezpieczeństwo automatyzacji

    Każda duża aktualizacja przynosi też poprawki stabilności i bezpieczeństwa, kluczowe dla zautomatyzowanych workflowów.

    Ulepszenia dotyczą bezpieczeństwa i izolacji podczas uruchamiania zautomatyzowanych agentów i subagentów, co stanowi fundament zaufania do platformy. Poprawki w obszarze routingu i normalizacji wewnętrznych procesów zmniejszają ryzyko błędów przy złożonych automatyzacjach.

    Warto też zauważyć zwiększoną transparentność działań agenta – użytkownik ma lepszy wgląd w to, jakie operacje i z jakimi parametrami zostaną wykonane, zanim wyrazi na nie zgodę.

    Ekosystem rozszerzeń i workflow deweloperów

    Rozwój nie ominął też ekosystemu rozszerzeń. Wprowadzane są lepsze integracje aplikacji oraz ulepszone workflowy dla pluginów.

    Dla deweloperów oznacza to łatwiejsze znajdowanie i włączanie potrzebnych funkcjonalności do projektów, choć obecnie odbywa się to raczej przez bezpośrednie integracje niż scentralizowany marketplace. Dbałość o odpowiednie uprawnienia i weryfikację źródeł pluginów podczas instalacji redukuje ryzyko naruszenia bezpieczeństwa i ułatwia zarządzanie zależnościami.

    Wnioski

    Najnowsze aktualizacje Codex idą w dwóch kierunkach: poszerzają konkretne możliwości integracyjne z kluczowymi narzędziami deweloperskimi oraz solidnie wzmacniają istniejącą bazę, zwiększając stabilność, bezpieczeństwo i ergonomię pracy.

    Dla deweloperów codziennie korzystających z automatyzacji poprawki w wykonywaniu poleceń i bezpieczeństwie będą najbardziej odczuwalne w bieżącej pracy. Dla osób budujących bardziej złożone systemy rozwinięte SDK i integracje otwierają nowe możliwości włączania AI do szerszych procesów.

    OpenAI rozwija Codex nie tylko jako asystenta kodowania, ale jako platformę do zaawansowanej automatyzacji developer workflow. Rozwój skupia się zarówno na głębi (zaawansowane SDK, integracje), jak i na szerokości (poprawki stabilności, ulepszenia UX). To dobry kierunek dla wszystkich, którzy oczekują spójnego i bezpiecznego środowiska do automatyzacji całych procesów wytwarzania oprogramowania.

  • Kimi Code CLI 1.22.0: wygodniejsze wpisywanie i nowe menu poleceń

    Kimi Code CLI 1.22.0: wygodniejsze wpisywanie i nowe menu poleceń

    Rozwijający się ekosystem AI dla deweloperów nieustannie dostarcza nowych narzędzi, które integrują sztuczną inteligencję z codziennymi workflowami. Kimi Code CLI, terminalowy agent programistyczny z rodziny MoonshotAI, doczekał się wersji 1.21.0. To nie kolejny zwykły punkt w changelogu, ale zestaw konkretnych usprawnień, które znacząco poprawiają komfort pracy z długimi fragmentami tekstu, obrazami i nawigacją po poleceniach.

    Refaktoring zarządzania promptem: porządek w chaosie

    Najbardziej zauważalną zmianą dla użytkownika jest gruntowna przebudowa sposobu obsługi wprowadzanego tekstu. Głównym problemem w pracy z AI w terminalu był bałagan powstający po wklejeniu długiego kodu, konfiguracji czy logów. Prompt stawał się nieczytelny, przesuwany w nieskończoność, a kontekst rozmowy z agentem – rozmyty.

    Wersja 1.21.0 wprowadza mechanizm compact placeholders. Teraz, gdy wklejony tekst przekracza 300 znaków lub zawiera więcej niż 3 linie, Kimi Code CLI automatycznie zastępuje go w buforze wpisu krótkim tokenem: [Pasted text #n]. Pełna treść jest jednak w całości wysyłana do modelu AI, więc agent ma pełny kontekst do pracy. To rozwiązanie zachowuje klarowność promptu dla użytkownika, nie ograniczając możliwości analizy przez AI.

    Co ciekawe, ten placeholder nie jest tylko statycznym skrótem. Użytkownik może otworzyć go w zewnętrznym edytorze (np. za pomocą Ctrl-O), rozwinąć pełną treść, edytować ją i zapisać – a system ponownie zwinie ją do poręcznego tokena. To eleganckie połączenie czytelności i funkcjonalności.

    Drugą, równie istotną częścią refaktoringu jest obsługa obrazów ze schowka. Wklejanie screenshotów, diagramów czy grafik do promptu było możliwe, ale skutkowało wstawianiem długich, nieczytelnych ciągów danych. Teraz obrazy są automatycznie cache'owane na dysku, a w buforze promptu pojawia się jasny token [image:…]. Agent AI otrzymuje pełną grafikę jako kontekst, ale deweloper widzi tylko zwięzłą reprezentację. To rozwiązanie szczególnie przydatne w workflowach związanych z debugowaniem UI, analizą layoutu czy pracą z dokumentacją zawierającą zrzuty ekranu.

    Warto też wspomnieć o poprawce związanej z UTF-16 surrogate characters. To techniczny, ale ważny szczegół: dane kopiowane z niektórych aplikacji na Windowsie mogły zawierać specjalne znaki (lone surrogates), które powodowały błędy serializacji (UnicodeEncodeError) przy zapisie historii czy generowaniu JSON. Kimi Code CLI 1.21.0 sanitizuje te znaki przed przetworzeniem, eliminując źródło potencjalnych crashy i zwiększając stabilność pracy z różnymi źródłami tekstu.

    Nowe menu slash commands: pełna szerokość i opisy

    Interakcja z Kimi Code CLI w trybie shellowym często opiera się na poleceniach typu slash, takich jak /help, /setup, /plan czy /compact. Dotychczasowe menu wyboru było standardowym, ograniczonym popupem, który często nie wyświetlał pełnych opisów i wymagał pamiętania, co robi każda komenda.

    W tej wersji autouzupełnianie i menu zostały przeprojektowane na pełnowymiarowy, niestandardowy interfejs. Nowe menu zajmuje całą szerokość terminala, prezentując nie tylko nazwy poleceń, ale również ich wieloliniowe opisy. Dzięki temu deweloper może szybko przejrzeć wszystkie dostępne opcje wraz z ich funkcjonalnością bez konieczności zaglądania do dokumentacji. Menu obsługuje też podświetlanie i przewijanie, co przy długiej liście poleceń jest kluczowe dla ergonomii.

    Poprawka dotyczy też skutecznego kończenia procesów przy anulowaniu poleceń shellowych. Gdy w trakcie wykonywania polecenia (np. długiego builda czy testów) użytkownik je anuluje, Kimi Code CLI teraz jawnie zabija podproces, aby uniknąć pozostawiania procesów osieroconych (orphaned processes) w systemie. To ważne dla zarządzania zasobami i czystości środowiska, szczególnie przy intensywnej, wielozadaniowej pracy z agentem.

    Testy end-to-end: większa stabilność w shellowym PTY

    Część zmian w 1.21.0 jest niewidoczna dla użytkownika końcowego, ale fundamentalna dla długoterminowej stabilności produktu. Chodzi o dodanie kompleksowych testów end-to-end dla shellowego PTY (pseudo-terminal) i zarządzania sesjami.

    PTY jest kluczowym komponentem pozwalającym Kimi Code CLI na interakcję z systemową powłoką (bash, zsh) w sposób, który umożliwia AI wykonywanie poleceń, czytanie outputu i reagowanie na nie. Testy end-to-end symulują pełne scenariusze użycia, weryfikując, czy integracja z shellem, przekazywanie danych, zarządzanie sesjami i przywracanie sprawności po błędach działają zgodnie z oczekiwaniami. Wprowadzenie takich testów znacząco zwiększa pewność, że kolejne aktualizacje nie spowodują regresji w tych kluczowych obszarach, a operacje shellowe z asystą AI będą niezawodne.

    Kimi Code CLI w kontekście web dev, AI i DevOps

    Kimi Code CLI w kontekście web dev, AI i DevOps

    Kimi Code CLI nie jest tylko ciekawostką, ale praktycznym narzędziem w arsenale deweloperów, szczególnie tych pracujących w obszarach web developmentu, sztucznej inteligencji i DevOps. Instaluje się go standardowymi metodami dla Pythona, a jego główna wartość leży w integracji AI z natywnym terminalem.

    W trybie shellowym pozwala na wykonywanie poleceń z asystą AI, integrację jako plugin Zsh, obsługę Agent Client Protocol (ACP) dla IDE takich jak Zed oraz konfigurację narzędzi MCP dla usług zewnętrznych. Może analizować logi, sugerować poprawki w kodzie, pomagać w debugowaniu, a nawet – dzięki wprowadzonemu wcześniej Plan Mode – tworzyć strukturalne plany działania przed wdrożeniem zmian.

    Użycie jest intuicyjne: wchodzimy do katalogu projektu, uruchamiamy kimi, wykonujemy /setup i /help, a potem prowadzimy konwersację z agentem, który może edytować pliki, wykonywać polecenia i odpowiadać na pytania kontekstowe. Aktualizację do najnowszej wersji wykonujemy standardowymi metodami aktualizacji pakietów Python.

    Wydanie 1.21.0 jest częścią szybkiego cyklu rozwojowego MoonshotAI. Ekosystem jest powiązany z modelami Kimi, takimi jak seria K2, co zapewnia spójność w wykorzystaniu AI.

    Dlaczego te zmiany są ważne?

    Na pierwszy rzut oka poprawki w zarządzaniu promptem i menu mogą wydawać się kosmetyczne. W praktyce jednak rozwiązują realne problemy, które utrudniają flow deweloperów pracujących z AI w terminalu. Bałagan w prompcie rozprasza i utrudnia skupienie na zadaniu. Ograniczone menu poleceń wymaga ciągłego przypominania sobie funkcjonalności. Problemy z zabijaniem procesów prowadzą do niepotrzebnego zużycia zasobów.

    Wersja 1.21.0 eliminuje te punkty tarcia, czyniąc Kimi Code CLI bardziej przewidywalnym i ergonomicznym. Refaktoring obsługi promptów to nie tylko „lepsze wklejanie”, ale fundamentalne podejście do zarządzania kontekstem: oddzielenie reprezentacji dla człowieka od danych dla AI. Nowe menu slash commands to krok w stronę interfejsu samodokumentującego się, gdzie narzędzie uczy użytkownika swoich możliwości w trakcie pracy. Testy end-to-end są cichą gwarancją, że ta ergonomia nie rozsypie się przy kolejnych, bardziej złożonych funkcjach.

    Co to oznacza dla przyszłości?

    Wydanie 1.21.0 pokazuje wyraźny trend w rozwoju Kimi Code CLI: skupienie na stabilności i użyteczności, a nie tylko na dodawaniu kolejnych, ekspansywnych funkcji.

    To ważny sygnał dla całej kategorii agentów AI do kodowania. Sztuczna inteligencja w terminalu musi być nie tylko potężna, ale również wygodna i przewidywalna. Chaos w interfejsie odciąga uwagę od rozwiązywania problemów, a niestabilność podważa zaufanie. Kimi Code CLI 1.21.0 konsekwentnie usuwa źródła chaosu i niestabilności, umacniając swoją pozycję jako narzędzie, które nie tylko „może”, ale również „jest przyjemne w użyciu”.

    Dla deweloperów oznacza to, że integracja AI z codziennym workflowem w shellu staje się coraz płynniejsza. Możemy wklejać długie logi bez zapychania promptu, przeglądać polecenia bez zaglądania do dokumentacji i mieć pewność, że anulowanie zadania nie stworzy bałaganu w systemie. To właśnie takie, inkrementalne poprawki budują długoterminową adopcję i realną produktywność.

  • Ogromne okno kontekstu 1 miliona tokenów w Claude jest już ogólnodostępne – co to zmienia dla programistów?

    Ogromne okno kontekstu 1 miliona tokenów w Claude jest już ogólnodostępne – co to zmienia dla programistów?

    Anthropic właśnie zrobiło poważny krok w rozwoju swojej platformy Claude Developer Platform. Okno kontekstowe o rozmiarze 1 miliona tokenów, które do tej pory znajdowało się w fazie beta, stało się ogólnodostępne dla modeli Claude 3.5 Sonnet. Co to oznacza dla programistów, projektantów AI i firm? Więcej, niż mogłoby się wydawać.

    Co właściwie zmieniło się w Claude Developer Platform?

    Anthropic ogłosiło 12 sierpnia, że gigantyczne okno kontekstowe jest już dostępne dla wszystkich na standardowych warunkach cenowych. Oznacza to koniec wymogu stosowania nagłówków beta – po prostu wysyłasz zapytanie z dłuższym kontekstem, a system działa.

    Kluczowe zmiany:

    • Modele Claude 3.5 Sonnet z natywnym wsparciem dla dużego kontekstu.
    • Zwiększona pojemność mediów przy użyciu pełnego okna kontekstowego.

    To znacząca zmiana w sposobie naliczania kosztów. Wcześniej, po przekroczeniu 200 tysięcy tokenów w kontekście, cena gwałtownie rosła – np. do 10 USD za milion tokenów wejściowych i 37,50 USD za milion tokenów wyjściowych dla modelu Opus. Teraz obowiązuje standardowa stawka w całym zakresie, na przykład 3 USD za milion tokenów wejściowych i 15 USD za wyjściowe dla modelu Sonnet 3.5.

    Dlaczego 1 milion tokenów to nie tylko większa liczba?

    W świecie AI okno kontekstowe to rodzaj pamięci roboczej modelu. Wszystko, co przesyłasz – dokumenty, kod, historia czatu, instrukcje – musi się tam zmieścić, aby model mógł to „widzieć” podczas generowania odpowiedzi.

    Do tej pory, nawet przy oknie rzędu 200 tysięcy tokenów, efektywna przestrzeń była mniejsza. Testy pokazywały, że modele zaczynały halucynować po osiągnięciu 65–70% pojemności okna. W praktyce oznaczało to, że przy prompcie systemowym zajmującym 20–25 tysięcy tokenów, faktycznie użyteczny kontekst wynosił około 100–110 tysięcy tokenów.

    Nowa implementacja okna 1M podobno radzi sobie lepiej z utrzymaniem jakości na całej długości. To ważna różnica – otrzymujesz nie tylko więcej przestrzeni, ale przestrzeń, na której możesz polegać.

    Co to zmienia w praktyce?

    Jeśli pracujesz z kodem, dokumentacją czy długimi procesami, ta zmiana otwiera możliwości, które wcześniej były ograniczone.

    • Cały codebase w jednej sesji – możesz załadować architekturę, konfiguracje, logi i historię debugowania, a potem poprosić o analizę. To tak, jakby mieć eksperta, który widzi cały system naraz, a nie tylko jego fragmenty.

    • Długie zadania agentowe – agenci AI, którzy muszą pamiętać wiele kroków, kontekstów i decyzji, wreszcie mają na to miejsce. Możesz tworzyć złożone workflowy bez ciągłego resetowania kontekstu.

    • Analiza dokumentów bez dzielenia na fragmenty (chunkowania) – zamiast dzielić raporty, badania czy zestawienia na części i próbować je później składać, możesz przesłać wszystko naraz. Jest to szczególnie przydatne w analizach prawnych, badaniach rynku czy syntezie publikacji naukowych, gdzie powiązania między dokumentami są kluczowe.

    • Więcej mediów – zwiększona pojemność na obrazy lub pliki PDF to duża zaleta. Możesz przetwarzać całe raporty z wykresami, dokumentację techniczną z diagramami czy prezentacje bez obaw o limity.

    Nie ma róży bez kolców – na co uważać?

    Większe okno kontekstowe to nie tylko korzyści. Istnieją kompromisy (trade-offs), o których warto wiedzieć.

    • Spadek prędkości odpowiedzi – przetwarzanie miliona tokenów wymaga ogromnej mocy obliczeniowej. W pracy interaktywnej będzie to wyczuwalne, zwłaszcza przy dłuższych odpowiedziach. W zadaniach działających w tle może to mieć mniejsze znaczenie.

    • Szybszy wzrost kosztów – to efekt kuli śnieżnej. W długiej sesji każda kolejna odpowiedź dodaje tokeny do kontekstu, który z każdym zapytaniem staje się większy. Jeśli nie monitorujesz zużycia, rachunek może Cię nieprzyjemnie zaskoczyć.

    • Uwaga modelu nie rozkłada się równomiernie – nawet przy dużym oknie model nie „widzi” każdego tokenu z taką samą dokładnością. Kluczowe informacje nadal warto umieszczać bliżej końca promptu.

    Jak korzystać z tego mądrze?

    Pokusa, by nigdy nie czyścić kontekstu, jest silna, ale warto się jej oprzeć.

    Jeśli zadanie nie wymaga dużej ilości danych, trzymaj się czystych sesji. Regularne używanie komendy /clear zapewnia lepszą jakość i niższe koszty. Duże okno to narzędzie do specyficznych sytuacji: długich sesji badawczych, złożonych zadań agentowych czy procesów, w których ciągłość ma kluczowe znaczenie.

    Można o tym myśleć jak o pamięci RAM. Więcej pamięci jest lepsze, gdy jej potrzebujesz, ale trzymanie w niej wszystkiego bez potrzeby to marnowanie zasobów.

    Zarządzanie kontekstem i jego kompaktowanie

    Ciekawym dodatkiem jest API do kompaktowania, które nadal znajduje się w fazie beta. To mechanizm automatycznego podsumowywania starszej części kontekstu, gdy zbliżasz się do limitu tokenów.

    Wcześniejsze testy pokazywały jednak, że automatyczne kompaktowanie bywało problematyczne – obniżało jakość odpowiedzi w nieprzewidywalny sposób. W praktyce wielu użytkowników po prostu czyściło kontekst i zaczynało od nowa, co mijało się z celem posiadania dużego okna. Nowa implementacja ma radzić sobie z tym lepiej, ale warto to przetestować na własnych przypadkach użycia.

    Jak to wygląda na tle konkurencji?

    Jak to wygląda na tle konkurencji?

    Anthropic postawiło na ciekawą strategię cenową. Podczas gdy konkurenci często podwajają ceny po przekroczeniu pewnego progu tokenów, Claude utrzymuje standardową stawkę w całym zakresie do 1 miliona. Jest to istotne, ponieważ duże okno kontekstowe jest użyteczne tylko wtedy, gdy model potrafi z niego skutecznie korzystać.

    Dla kogo ta zmiana jest najbardziej znacząca?

    • Programiści pracujący z dużymi repozytoriami kodu – możliwość analizy całego systemu naraz zmienia podejście do refaktoryzacji, debugowania i planowania zmian.

    • Twórcy zaawansowanych agentów AI – długie, wieloetapowe procesy z zachowaniem stanu między krokami stają się wreszcie praktycznie możliwe.

    • Zespoły analityczne i badawcze – synteza dużych zbiorów dokumentów, raportów czy transkrypcji bez utraty powiązań między nimi.

    • Firmy prawnicze i działy compliance – przegląd pełnych pakietów dokumentów, umów czy regulacji w jednym przebiegu.

    Podsumowanie

    Ogólnodostępne okno kontekstowe o rozmiarze 1 miliona tokenów w Claude to nie tylko kolejna liczba w specyfikacji. To zmiana w sposobie projektowania aplikacji AI, tworzenia agentów i pracy z dużymi zbiorami informacji.

    Jednak jak każda potężna funkcja, wymaga ona rozważnego stosowania. Wrzucanie wszystkiego do kontekstu „bo się mieści” to przepis na wysokie rachunki i spowolnienie pracy. Kluczem jest zrozumienie, kiedy duży kontekst jest niezbędny, a kiedy lepiej sprawdzają się tradycyjne metody chunkingu i zarządzania pamięcią.

    Dla ekosystemu web developmentu i AI to kolejny krok w stronę płynniejszej integracji sztucznej inteligencji z codzienną pracą. Możliwość trzymania całego projektu w „pamięci” modelu przez dłuższy czas otwiera nowe drzwi, ale stawia też przed programistami wyzwania w zakresie architektury aplikacji i optymalizacji kosztów.