Kategoria: Oprogramowanie

  • Claude Platform otrzymuje ważne aktualizacje: większa kontrola nad streamingiem i nowe pola w API

    Claude Platform otrzymuje ważne aktualizacje: większa kontrola nad streamingiem i nowe pola w API

    Platforma Claude od Anthropic właśnie zyskała dwie istotne, choć na pierwszy rzut oka dyskretne, nowości dla deweloperów. Chodzi o możliwość programistycznego sprawdzania możliwości modeli oraz większą kontrolę nad strumieniowaniem odpowiedzi w trybie rozszerzonego myślenia (extended thinking). To drobne, ale ważne zmiany, które ułatwiają budowanie bardziej przewidywalnych i wydajnych aplikacji.

    Zasadniczo, korzystając z API Claude, trzeba wiedzieć, z czym dokładnie ma się do czynienia – jakie limity tokenów obowiązują i które funkcje są wspierane. Do tej pory informacje te trzeba było sprawdzać w dokumentacji. Teraz można to zrobić bezpośrednio w kodzie.

    Nowe pola w Models API: max_input_tokens, max_tokens i capabilities

    Od 18 marca 2026 roku endpointy GET /v1/models oraz GET /v1/models/{model_id} zwracają trzy nowe pola. Są to max_input_tokens, max_tokens oraz obiekt capabilities. Co one oznaczają?

    max_input_tokens określa maksymalną liczbę tokenów, jaką model może przyjąć na wejściu w pojedynczym żądaniu. max_tokens to z kolei limit tokenów, które model może wygenerować w odpowiedzi. Najciekawszy jest jednak obiekt capabilities. Choć szczegóły nie zostały jeszcze szeroko opisane, można się spodziewać, że będzie on przechowywał informacje o tym, czy dany model obsługuje np. extended thinking, wizję czy konkretne narzędzia (tool use).

    To zmiana jakościowa dla deweloperów integrujących Claude'a. Zamiast ręcznie aktualizować konfigurację w kodzie przy każdym wydaniu nowego modelu, można napisać logikę, która dynamicznie odczyta jego możliwości bezpośrednio z API. W praktyce ułatwia to zarządzanie wersjami modeli i tworzenie bardziej odpornych na zmiany integracji.

    Kontrola nad streamingiem odpowiedzi z „myśleniem”: pole display

    Druga aktualizacja, z 16 marca, dotyczy trybu extended thinking. To funkcja, w której Claude, zamiast od razu podawać finalną odpowiedź, najpierw prezentuje swój tok rozumowania prowadzący do rozwiązania. Jest to niezwykle przydatne do debugowania i zrozumienia procesu, ale w niektórych aplikacjach produkcyjnych te dodatkowe dane mogą nie być potrzebne użytkownikowi końcowemu, a ich przesyłanie wydłuża czas uzyskania ostatecznej odpowiedzi.

    Teraz deweloperzy zyskują nad tym kontrolę. W żądaniu można ustawić parametr thinking.display: "omitted". W efekcie w strumieniowanej odpowiedzi bloki thinking będą przychodziły z pustą zawartością, ale ich sygnatura (struktura) zostanie zachowana. Dlaczego to ważne?

    Zachowanie struktury jest kluczowe dla ciągłości w rozmowach wieloturowych. Systemy, które analizują i przetwarzają odpowiedzi modelu w czasie rzeczywistym, często polegają na tej strukturze, aby odróżnić proces myślenia od finalnej odpowiedzi. Gdyby struktura uległa zmianie, mogłoby to zaburzyć logikę aplikacji. Teraz aplikacja może bezpiecznie pomijać treść myślenia przed użytkownikiem, zachowując jednocześnie pełną informację dla własnej logiki przetwarzania. Co istotne, sposób rozliczania za użycie modelu pozostaje bez zmian – płaci się zarówno za tokeny zużyte na myślenie, jak i na odpowiedź.

    Kontekst: potężne modele 4.6 i milion tokenów kontekstu

    Kontekst: potężne modele 4.6 i milion tokenów kontekstu

    Te techniczne aktualizacje API wpisują się w szerszy trend rozwoju Claude'a, który w 2026 roku przyspieszył. Flagowe modele, Claude Opus 4.6 i Claude Sonnet 4.6, oferują już kontekst miliona tokenów (1M) w wersji ogólnodostępnej (generally available). Oznacza to, że modele mogą analizować ogromne zbiory danych – na przykład całe bazy kodu liczące miliony linii, długie transkrypcje sądowe lub kompleksowe raporty due diligence.

    Wcześniej korzystanie z okna 1M tokenów wymagało specjalnego nagłówka beta. Od 13 marca dla Opus 4.6 i Sonnet 4.6 to ograniczenie zniesiono. Jeśli żądanie przekracza 200 tysięcy tokenów, system automatycznie użyje pełnego, milionowego kontekstu. Jednocześnie usunięto specjalne limity rate limits dla 1M tokenów, co oznacza, że obowiązują teraz standardowe limity konta.

    Co to oznacza dla deweloperów webowych i AI?

    Dla osób budujących aplikacje z użyciem AI, zwłaszcza w obszarach web developmentu, programowania czy DevOps, te zmiany mają konkretne przełożenie.

    Po pierwsze: większa przejrzystość i automatyzacja. Dynamiczne odczytywanie możliwości modeli pozwala na tworzenie systemów, które same dostosowują się do dostępnych funkcji. Można sobie wyobrazić aplikację, która sprawdza, czy wybrany model obsługuje wizję, i dopiero wtedy umożliwia przesyłanie obrazów. Albo system monitorujący, który wysyła alert, gdy prompt zbliża się do limitu max_tokens dla danego modelu.

    Po drugie: lepsze doświadczenie użytkownika w aplikacjach strumieniujących. Tryb thinking.display: "omitted" pozwala na szybsze dostarczenie użytkownikowi końcowemu finalnej, „czystej” odpowiedzi, szczególnie w chatbotach wsparcia czy interfejsach konwersacyjnych. W tle aplikacja nadal otrzymuje pełną strukturę, więc może logować proces myślenia do celów analitycznych lub używać go w kolejnych turach rozmowy, ale użytkownik nie musi na to czekać.

    Po trzecie: łatwiejsze zarządzanie kosztami i wydajnością. Wiedza o dokładnych limitach tokenów (max_input_tokens, max_tokens) pomaga precyzyjniej projektować prompty i przewidywać zużycie. Łącząc to z innymi nowościami, jak automatyczne buforowanie promptów (automatic caching), deweloperzy mogą budować wydajniejsze i tańsze w utrzymaniu aplikacje.

    Podsumowanie: ewolucja w kierunku platformy dla deweloperów

    Aktualizacje z marca 2026 roku, choć techniczne, pokazują wyraźny kierunek rozwoju platformy Claude. Anthropic nie tylko wypuszcza coraz potężniejsze modele, jak Opus 4.6 czy Sonnet 4.6, ale też konsekwentnie dopracowuje warstwę programistyczną – API, SDK i narzędzia deweloperskie.

    Dodanie pól capabilities i kontroli nad display w streamingu to kroki w stronę większej programowalności i kontroli. Platforma staje się nie tylko źródłem zaawansowanej sztucznej inteligencji, ale też przewidywalnym i dobrze udokumentowanym środowiskiem do budowania aplikacji. Dla deweloperów pracujących nad złożonymi agentami AI, systemami przetwarzania dokumentów czy narzędziami do modernizacji kodu, takie usprawnienia na poziomie API są bezcenne. Pozwalają skupić się na logice biznesowej, zamiast na ręcznym dostosowywaniu się do zmian w modelach.

  • Google Antigravity 1.20.6: Naprawiono kluczową blokadę w tworzeniu reguł i workflow

    Google Antigravity 1.20.6: Naprawiono kluczową blokadę w tworzeniu reguł i workflow

    Google Antigravity, agentowe IDE, które na starcie mocno poruszyło społeczność programistów, otrzymało nową, pozornie drobną aktualizację. Wersja 1.20.6, która trafiła do użytkowników w połowie marca 2026 roku, skupia się na jednym, lecz absolutnie kluczowym problemie. Chodzi o naprawę błędu uniemożliwiającego tworzenie własnych reguł i workflow – fundamentu personalizacji w tym środowisku.

    Choć w oficjalnym changelogu widnieje tylko jedna pozycja: „Fix for customizations creation”, dla wielu deweloperów ta poprawka oznacza powrót do pełni funkcjonalności. Bez możliwości definiowania własnych reguł cała koncepcja „vibe coding” i zarządzania pracą autonomicznych agentów stawała pod znakiem zapytania.

    Co konkretnie naprawiono w aktualizacji 1.20.6?

    Zgodnie z release notes, głównym i jedynym celem wersji 1.20.6 było usunięcie błędu, który blokował użytkownikom tworzenie nowych dostosowań (customizations). W praktyce chodziło o niemożność definiowania własnych reguł (rules) i przepływów pracy (workflows) wewnątrz platformy.

    To nie jest drobna uciążliwość, a poważna blokada. Reguły w Google Antigravity to mechanizm, za pomocą którego deweloperzy „uczą” swoje agenty specyficznych standardów kodowania, formatowania commitów, preferencji architektonicznych czy zasad code review. Agent, działający w oparciu o modele Gemini, ma te reguły automatycznie uwzględniać, co jest esencją spersonalizowanej, wydajnej współpracy między człowiekiem a AI.

    Wiele wskazuje na to, że błąd mógł być skutkiem ubocznym wcześniejszych aktualizacji. Niektórzy użytkownicy na forach wspominali o problemach z rozpoznawaniem workspace’ów po upgrade’ach, co skutkowało utratą dostępu do zdefiniowanych wcześniej reguł. Aktualizacja 1.20.6 ma być odpowiedzią na te problemy, przywracając podstawową funkcję tworzenia i zarządzania customizacjami.

    Stopniowy rollout i kontekst poprzednich wersji

    Jak to często bywa w przypadku narzędzi Google, nowa wersja Antigravity jest wdrażana stopniowo. Proces rolloutu może trwać kilka dni, zanim aktualizacja dotrze do wszystkich użytkowników systemów Windows, macOS i Linux. Co istotne, platforma oferuje też tryb ręcznej aktualizacji w ustawieniach, pozwalając bardziej ostrożnym użytkownikom pozostać przy starszej, stabilnej wersji, jeśli nowa wprowadza niepożądane zmiany.

    Aby zrozumieć znaczenie tej małej poprawki, warto rzucić okiem na kontekst poprzednich wydań. Bezpośrednio przed 1.20.6 ukazała się wersja 1.20.5 (9 marca 2026), która niosła zestaw ogólnych ulepszeń stabilności i interfejsu użytkownika (3 improvements, 3 fixes, 1 patch). Wcześniej, pod koniec lutego, w wersji 1.20.3 wprowadzono m.in. formalną ścieżkę remediacji dla kont zawieszonych z powodu naruszenia regulaminu.

    To pokazuje, że zespół rozwija platformę wielotorowo: z jednej strony pracuje nad nowymi funkcjami i bezpieczeństwem, a z drugiej musi szybko reagować na krytyczne błędy funkcjonalne, takie jak ten związany z tworzeniem reguł. W świecie developmentu, gdzie automatyzacja przez agenty jest kluczowa, utrata możliwości ich precyzyjnego konfigurowania paraliżuje pracę.

    Dlaczego możliwość tworzenia własnych reguł jest tak ważna?

    Dlaczego możliwość tworzenia własnych reguł jest tak ważna?

    Google Antigravity od początku promowane było nie jako kolejny edytor kodu, ale jako „agent-first IDE”. Jego siłą nie jest sam edytor (choć oferuje znany z VS Code panel boczny dla agenta), lecz możliwość równoległego zarządzania wieloma autonomicznymi agentami w widoku Manager. Agenci potrafią tworzyć „Artefakty” – listy zadań, plany, zrzuty ekranu – i mają dostęp do edytora, terminala oraz przeglądarki.

    Jednak bez możliwości nadania im klarownych, spersonalizowanych instrukcji, ich autonomia może prowadzić do chaosu. Tu właśnie wkracza mechanizm reguł. W materiałach promocyjnych z marca 2026 wspominano o wsparciu dla plików agents.mmd, w których deweloperzy mogą definiować swoje standardy kodowania, format commitów czy preferencje. Agenci mają te zasady odczytywać i automatycznie się do nich stosować.

    Wyobraźmy sobie zespół, który ma ściśle określone konwencje nazewnictwa zmiennych, strukturę katalogów czy wymagania dotyczące testów. Wprowadzenie tych zasad jako reguł do Antigravity sprawia, że każdy agent działający na rzecz projektu będzie je respektował. To ogromna oszczędność czasu na mikrozarządzaniu i korektach. Blokada w tworzeniu takich reguł oznaczałaby więc powrót do ręcznego, żmudnego poprawiania sugestii AI.

    Nierozwiązane problemy i perspektywy użytkowników

    Nierozwiązane problemy i perspektywy użytkowników

    Choć aktualizacja 1.20.6 rozwiązuje palący problem, społeczność zwraca uwagę na inne, wciąż istniejące błędy. Jeden z użytkowników zgłasza na forum uporczywy problem specyficzny dla macOS na architekturze Apple Silicon: żądania agentów kończą się błędem HTTP 400 „Invalid project resource name projects/”. Problem ten, związany z serializacją, podobno przetrwał nawet aktualizację do 1.20.6 i wymaga lokalnych obejść (workarounds).

    Pojawiają się też głosy o innych kwestiach, jak różnice w limitach odświeżania między planami subskrypcyjnymi (8-dniowe blokady na planach płatnych vs 7-dniowe na darmowym), które mogą wpływać na płynność pracy. To przypomina, że rozwój tak złożonej, wieloplatformowej i opartej na chmurze AI aplikacji to ciągłe żonglowanie priorytetami.

    Mimo że jedna poprawka może wyglądać jak „literal nothingburger”, jak napisał jeden z użytkowników, to w rzeczywistości odblokowuje ona kluczowy element filozofii Antigravity. Platforma ma sens tylko wtedy, gdy deweloper może ją dostosować do swojego unikalnego flow i swojego „vibe’u”. Bez tej personalizacji jest po prostu kolejnym edytorem z chatbotem.

    Podsumowanie: Mała poprawka, duże znaczenie dla workflow

    Wydanie Google Antigravity 1.20.6 to klasyczny przykład „critical fix”. Z punktu widzenia liczby pozycji w changelogu aktualizacja jest minimalna. Z punktu widzenia użytkownika, który polega na autonomii agentów i ich precyzyjnym dostrojeniu, jest to aktualizacja niezbędna.

    Przywrócenie możliwości tworzenia i zarządzania customizacjami, regułami i workflow oznacza przywrócenie kontroli nad procesem developmentu. Pozwala deweloperom w pełni wykorzystać potencjał „vibe coding”, gdzie agenci nie tylko wykonują zadania, ale robią to zgodnie z ustalonymi, wewnętrznymi standardami.

    Dla społeczności skupionej wokół web developmentu, AI i DevOps, gdzie automatyzacja i spójność są na wagę złota, ta naprawa jest kluczowa. Pokazuje też, że zespół Google Antigravity aktywnie słucha feedbacku i reaguje na blokujące problemy, nawet jeśli ich rozwiązanie nie jest opatrzone fanfarami nowych funkcji. W końcu najważniejsza innowacja to ta, która po prostu działa.

  • Cursor Composer 2: Genialny model do kodowania, który tak naprawdę jest fine-tune’em chińskiego Kimi K2.5

    Cursor Composer 2: Genialny model do kodowania, który tak naprawdę jest fine-tune’em chińskiego Kimi K2.5

    Nowy model kodujący Cursor Composer 2 z miejsca wskoczył na wysokie pozycje w benchmarkach, bijąc nawet Claude Opus przy znacznie niższych kosztach. Szybko okazało się jednak, że za tym „własnym, najwyższej klasy modelem AI” firmy Cursor stoi inna, potężna technologia. Wszystko przez ujawniony w API identyfikator: kimi-k2p5-rl-0317. To bezpośrednie odniesienie do Kimi K2.5, flagowego modelu chińskiej firmy Moonshot AI.

    Sprawa wywołała gorącą dyskusję w środowisku deweloperów. Z jednej strony mamy świetne narzędzie, które faktycznie działa. Z drugiej – pytania o przejrzystość i uznanie dla prawdziwego źródła innowacji. Szczerze mówiąc, to jeden z ciekawszych technologicznych zwrotów akcji ostatnich miesięcy.

    Od premiery do kontrowersji: jak odkryto prawdziwe źródło

    Cursor ogłosił Composer 2 w marcu 2026 roku. Marketingowo przedstawiano go jako własny model klasy „frontier”, stworzony specjalnie do złożonych, wieloetapowych zadań programistycznych. Model miał być dostępny w edytorze Cursor oraz w wersji alfa nowego interfejsu o nazwie „Glass”.

    Już w ciągu 24 godzin od premiery deweloperzy przyglądający się odpowiedziom API odkryli prawdę. W logach i odpowiedziach systemu pojawiał się wewnętrzny identyfikator modelu, taki jak kimi-k2p5-rl-0317-s515-fast. To był jasny sygnał, że podstawą jest Kimi K2.5 od Moonshot AI. Plotki o braku przypisania autorstwa chińskiemu źródłu zaczęły krążyć natychmiast.

    Firma Cursor początkowo nie komentowała sprawy bezpośrednio w komunikacji marketingowej. Potwierdzenie przyszło później, między innymi poprzez wypowiedzi pracowników. Lee Robinson z Cursor wspomniał, że tylko około jednej czwartej mocy obliczeniowej wydanej na finalny model pochodziło z bazowego modelu Kimi, a reszta została poświęcona na własne procesy treningowe Cursor.

    Ostatecznie Moonshot AI publicznie potwierdził, że Kimi K2.5 stanowi fundament pod Composer 2, a wszystko odbywa się w ramach autoryzowanej współpracy komercyjnej poprzez platformę Fireworks. Kluczowy okazał się też zapis z licencji Kimi K2.5, który wymaga wyraźnego oznaczenia „Kimi K2.5” w interfejsie użytkownika produktów komercyjnych, jeśli przekraczają one próg 100 milionów aktywnych użytkowników miesięcznie lub 20 milionów dolarów miesięcznego przychodu.

    Composer 2 vs. konkurencja: liczby nie kłamią

    Niezależnie od źródła, wyniki modelu są imponujące. Benchmarki kodowania wyraźnie pokazują jego siłę. W CursorBench osiąga 61,3 punktu, w Terminal-Bench 2.0 – 61,7, a w SWE-bench Multilingual aż 73,7. To pozycjonuje go przed takimi gigantami jak Claude Opus.

    Co ważne, ten wynik osiągany jest przy znacznie niższym koszcie. Cursor celowo trenował model wyłącznie na danych kodowych, aby wyspecjalizować go w rozwiązywaniu złożonych, wieloetapowych problemów programistycznych. Model wspiera kontekst o długości 256 tysięcy tokenów.

    Jak stwierdził współzałożyciel Cursor, Aman Sanger, model ma bardzo konkretne zastosowanie: „Nie pomoże ci rozliczyć podatków. Nie będzie potrafił pisać wierszy”. To narzędzie dla deweloperów, a nie uniwersalny asystent.

    Prawdziwym przełomem jest cena. Spójrzmy na porównanie kosztów za milion tokenów:

    • Composer 2 (standardowy): 0,50 $ za wejście / 2,50 $ za wyjście.
    • Composer 2 Fast: 1,50 $ / 7,50 $ (ta sama inteligencja, szybsze odpowiedzi).
    • Claude Opus: 5,00 $ / 25,00 $.
    • GPT-4o: od 2,50 $ / 15,00 $ do 5,00 $ / 22,50 $, w zależności od długości kontekstu.

    Różnica jest kolosalna, zwłaszcza dla firm intensywnie korzystających z AI. Composer 2 oferuje podobną lub lepszą wydajność w zadaniach kodowych za ułamek ceny najdroższej konkurencji.

    Kim jest Kimi K2.5, czyli potęga chińskiego AI w tle

    Kim jest Kimi K2.5, czyli potęga chińskiego AI w tle

    Aby zrozumieć, z czym tak naprawdę mamy do czynienia, trzeba poznać model bazowy. Kimi K2.5 to chiński model open-weights Moonshot AI, jednej z czołowych chińskich firm zajmujących się sztuczną inteligencją.

    To potężna jednostka o architekturze Mixture of Experts (MoE) z 1 bilionem parametrów całkowitych i 32 miliardami parametrów aktywnych. Jego działanie ma być nawet do ośmiu razy tańsze niż Claude Opus. Co ciekawe, oferuje kompatybilność z OpenAI API, co znacząco ułatwia integrację. Model jest multimodalny – obsługuje tekst, obraz, audio i wideo, oferuje tzw. „długie myślenie” (long-thinking) oraz możliwość wywoływania funkcji (tool calling).

    Deweloperzy mogą uzyskać do niego dostęp bezpośrednio, bez pośrednictwa Cursor. Wystarczy klucz API z platformy Moonshot (platform.moonshot.cn), użycie bazowego URL https://api.moonshot.cn/v1 i wskazanie nazwy modelu jako kimi-k2.5. To pokazuje, że Cursor nie jest jedyną drogą do tej technologii, ale z pewnością dostarcza ją w formie zoptymalizowanej pod kodowanie.

    Burza w społeczności: marketing a rzeczywistość

    Burza w społeczności: marketing a rzeczywistość

    Odkrycie prawdziwej natury Composer 2 wywołało żywiołową reakcję społeczności deweloperskiej. Komentarze krążyły wokół tematu przejrzystości. „Cursor Composer 2 to po prostu Kimi K2.5 z RL” – pisali jedni. Inni dodawali: „Bycie KimiK2.5++ jest w porządku, brak transparentności już nie”.

    Warto przypomnieć, że to nie pierwszy raz, gdy Cursor buduje na cudzej technologii. Dyskusja toczyła się też wokół szerszych tematów: rosnącej roli otwartych i półotwartych modeli, ewentualnej reakcji firmy Anthropic (twórcy Claude) na tak bezpośrednie porównania, oraz wartości, jaką takie narzędzie wnosi do własnych, zamkniętych baz kodu w porównaniu do bardziej „agentowych” edytorów.

    Wiele osób podkreślało, że finalny produkt jest doskonały i działa znakomicie. Kontrowersje dotyczyły głównie warstwy komunikacyjnej i marketingowego nazywania modelu „własnym”. W świecie open source i współpracy korporacyjnej jasne przypisanie autorstwa jest często kluczowe dla zaufania.

    Wnioski: nowa era współpracy i specjalizacji

    Sprawa Cursor Composer 2 jest doskonałym studium przypadku dla współczesnego ekosystemu AI. Pokazuje wyraźnie kilka trendów. Po pierwsze, era monolitycznych, samodzielnie budowanych od zera modeli przez każdą firmę może się kończyć. Przyszłość leży w specjalizacji i fine-tuningu potężnych, ogólnych modeli bazowych, często pochodzących od wąskiej grupy liderów.

    Po drugie, granice geograficzne w technologii AI są coraz bardziej przepuszczalne. Zachodni produkt, który staje się hitem wśród deweloperów, może mieć serce zaprojektowane i wytrenowane w Chinach. To dowód na globalizację zaawansowanych badań.

    Po trzecie, społeczność techniczna jest niezwykle czujna. Marketingowe narracje są weryfikowane w ciągu godzin poprzez analizę logów, odpowiedzi API i porównania benchmarków. Przejrzystość staje się walutą, za którą płaci się zaufaniem użytkowników.

    Cursor Composer 2, będący w istocie fine-tune'em Kimi K2.5, pozostaje niezwykle atrakcyjnym narzędziem. Oferuje najwyższą klasę możliwości w zadaniach kodowych za bezprecedensowo niską cenę. Dla deweloperów i firm ta efektywność kosztowa i wydajność mogą być ważniejsze niż korporacyjne pochodzenie modelu. Ostatecznie w kodzie liczy się wynik. A ten, jak na razie, jest znakomity. Cała sytuacja służy jednak jako przypomnienie, że w erze współzależnych modeli AI uczciwość wobec użytkownika co do źródeł technologii jest równie ważna, co same osiągi.

  • Qwen-Code v0.12.4: Podwójny limit tokenów, lepsza recenzja kodu i stabilizacja dla Windows

    Qwen-Code v0.12.4: Podwójny limit tokenów, lepsza recenzja kodu i stabilizacja dla Windows

    Najnowsze wydanie open-source'owego asystenta kodowania, Qwen-Code w wersji 0.12.4, może nie nosi etykiety "major", ale wprowadza zmiany, które bezpośrednio przekładają się na komfort pracy programistów. To właśnie takie aktualizacje – skupione na stabilności, wydajności i naprawie irytujących błędów – często robią największą różnicę w codziennym flow. Tym razem twórcy postawili na solidne fundamenty: podwojenie domyślnego limitu długości odpowiedzi, ulepszenia kluczowych narzędzi, takich jak shell, oraz przygotowanie gruntu pod przyszłe poprawki stabilności.

    Dla środowisk web developmentu, AI i DevOps, gdzie automatyzacja i precyzja są kluczowe, te pozornie techniczne poprawki oznaczają mniej frustracji i więcej czasu na kreatywną pracę. Qwen-Code, zoptymalizowany pod modele z serii Qwen, ugruntowuje swoją pozycję jako poważne narzędzie do "vibe coding" – czyli płynnego, wspomaganego przez AI procesu tworzenia i refaktoryzacji kodu.

    Podwojony limit tokenów: przestrzeń na dłuższe, bardziej złożone odpowiedzi

    Najbardziej wyczekiwaną zmianą w v0.12.4 jest zwiększenie stałej DEFAULT_OUTPUT_TOKEN_LIMIT z 8 tysięcy do 16 tysięcy tokenów. To decyzja, która wychodzi naprzeciw potrzebom pracy z dużymi fragmentami kodu, złożonymi instrukcjami lub generowaniem obszerniejszej dokumentacji.

    W praktyce oznacza to, że model ma teraz dużo więcej "przestrzeni oddechowej" na generowanie odpowiedzi. Może to przełożyć się na bardziej wyczerpujące analizy kodu, dłuższe bloki funkcjonalności czy też kompleksowe listy zmian w trybie recenzji. Dla deweloperów pracujących nad rozbudowanymi funkcjami czy architekturą mikroserwisów ten dodatkowy bufor może znacząco ograniczyć konieczność dzielenia zadania na mniejsze, sztuczne części. Zmianę wprowadził współpracownik o pseudonimie @Mingholy, a jej wdrożenie pokazuje, że zespół słucha opinii społeczności dotyczących ograniczeń długości outputu.

    Nowa umiejętność /review i audyt dokumentacji

    Wersja 0.12.4 wprowadza nową, wbudowaną umiejętność (skill) – /review, dodaną przez współpracownika @wenshao. Jej zadaniem jest usprawnienie procesu analizy kodu. Dzięki niej Qwen-Code może automatycznie przeglądać zmiany, sugerować poprawki, wskazywać potencjalne błędy czy problemy z konwencjami kodowania.

    To narzędzie idealnie wpisuje się w potrzeby DevOps i zespołów stosujących ciągłą integrację. Pozwala szybko rzucić okiem na proponowany patch lub poprosić AI o recenzję kodu przed wysłaniem pull requesta. Dodatkowo w wydaniu wspomniano o pomocnych narzędziach do audytu dokumentacji, które pojawiły się w wersji preview. W świecie, gdzie dokumentacja bywa zaniedbywana, automatyzacja jej sprawdzania pod kątem kompletności czy spójności to cenna funkcjonalność.

    Przygotowanie pod przyszłe poprawki stabilności

    Wersja 0.12.4 kładzie podwaliny pod poprawki stabilności, które w pełni ujrzą światło dzienne w kolejnych wydaniach. Problemy z instalacją i wykonywaniem komend shell to klasyczne bolączki wielu narzędzi cross-platformowych. Wersja 0.12.5, następująca bezpośrednio po omawianej, zawiera już kluczowe poprawki dla systemu Windows, takie jak rozwiązanie problemów z kodowaniem wyjścia zawierającego znaki nie-ASCII, co często prowadziło do nieczytelnych znaków w terminalu. Te zmiany, choć rzadko trafiają na nagłówki, są nieocenione dla zapewnienia bezproblemowego doświadczenia deweloperskiego.

    Ulepszenia rdzenia, kompatybilności i interfejsu użytkownika

    Pod maską Qwen-Code v0.12.4 kryje się szereg innych, ważnych poprawek:

    • Lepsza kompatybilność modeli: Dodano wzorzec tokenów dla modelu deepseek-r1, a także wprowadzono automatyczne wykrywanie parametru max_tokens z modelu, gdy nie jest on jawnie ustawiony. Uproszczono w ten sposób konfigurację i zmniejszono ryzyko błędów.
    • Stabilizacja konwersji odpowiedzi: Dodano zabezpieczenia przed próbą konwersji pustych odpowiedzi między formatami OpenAI a Gemini, co zapobiega awariom w niektórych scenariuszach.
    • Naprawa race condition w rozszerzeniu VS Code: Poprawiono błędy związane z anulowaniem promptów i streamowaniem, które mogły powodować niestabilność wtyczki. Bezpośrednio wpływa to na płynność pracy w edytorze.
    • Internacjonalizacja: Zlokalizowano opisy komend ukośnikowych (slash commands), co poprawia doświadczenie użytkowników nieanglojęzycznych.
    • Dokumentacja: Rozszerzono dokumentację o integrację z MCP Registry dla edytorów Zed i JetBrains, ułatwiając rozszerzanie funkcjonalności.

    Dlaczego to ma znaczenie dla web dev, AI i DevOps?

    Qwen-Code nie jest kolejnym prostym chatbotem. To agent zaprojektowany do automatyzacji zadań programistycznych. W kontekście web developmentu może pomóc w generowaniu komponentów React, konfigurowaniu serwerów Express, pisaniu migracji baz danych czy implementacji mechanizmów takich jak rate limiting.

    Dla osób zajmujących się sztuczną inteligencją Qwen-Code oferuje bezpośrednią optymalizację pod potężne, open-source'owe modele Qwen, jak Qwen2.5-Coder. Benchmarki (np. Terminal-Bench) pokazują, że ta kombinacja osiąga znaczącą skuteczność (np. 37.5% dla modelu 480A35) w zadaniach terminalowych.

    W obszarze DevOps narzędzie świetnie nadaje się do automatyzacji skryptów, generowania konfiguracji CI/CD czy – właśnie dzięki nowej funkcji /review – wspomagania procesu code review. Możliwość uruchomienia w trybie "headless" (bez interfejsu) za pomocą flagi -p czyni je idealnym kandydatem do integracji ze zautomatyzowanymi pipeline'ami.

    Podsumowanie: Solidny krok w ewolucji asystenta kodowania AI

    Qwen-Code v0.12.4 to wydanie, które stawia na niezawodność i ergonomię. Podwojenie limitu tokenów otwiera nowe możliwości w pracy z kompleksowymi zadaniami. Nowa umiejętność /review bezpośrednio odpowiada na potrzeby związane z zarządzaniem kodem. Ulepszenia rdzenia systemu oraz przygotowanie pod przyszłe poprawki stabilności pokazują dojrzałość projektu.

    Wydanie to, napędzane pracą współpracowników takich jak @tanzhenxin, @Mingholy, @netbrah, @wenshao i wielu innych, nie rzuca się w oczy spektakularnymi nowościami, ale konsekwentnie poprawia to, co najważniejsze: codzienne doświadczenie programisty. W świecie szybko rozwijających się narzędzi AI takie skupienie na fundamentach jest często kluczowe dla długoterminowego sukcesu i adopcji. Dla deweloperów szukających stabilnego i coraz potężniejszego asystenta do automatyzacji zadań, Qwen-Code po tej aktualizacji staje się jeszcze bardziej przekonującą opcją.

  • Codex CLI 0.116.0: Nowe funkcje dla przedsiębiorstw, integracja ChatGPT i ulepszone sesje realtime

    Codex CLI 0.116.0: Nowe funkcje dla przedsiębiorstw, integracja ChatGPT i ulepszone sesje realtime

    Najnowsza wersja potężnego asystenta terminalowego AI, Codex CLI, przynosi istotne ulepszenia. Wydanie 0.116.0-alpha.11, opublikowane w marcu 2026 roku, to solidny krok w stronę środowisk korporacyjnych. OpenAI wyraźnie wysyła sygnał: Codex CLI dorasta i jest gotowy na wdrożenie w zespołach inżynierskich dużych firm. Nowe funkcje związane z bezpieczeństwem, ujednolicenie dostępu z kontem ChatGPT oraz dalsze usprawnienia to najważniejsze punkty tej aktualizacji.

    Jeśli używasz Codex CLI do codziennego kodowania, web developmentu czy automatyzacji zadań DevOps, ta wersja znacząco poszerza Twoje możliwości – szczególnie jeśli pracujesz za firmowym firewallem.

    Zabezpieczenia dla przedsiębiorstw: sandbox i polityki dostępu

    To najważniejszy kierunek rozwoju w najnowszej wersji. OpenAI dodaje funkcje kluczowe dla adopcji narzędzia w dużych organizacjach, gdzie bezpieczeństwo i kontrola są priorytetem.

    Kolejna warstwa to zaostrzone polityki sandbox. Administratorzy zyskują większą kontrolę nad tym, co Codex CLI może wykonać. Mowa tu o trybach zatwierdzania (approval modes), takich jak read-only, auto czy full access dla narzędzi powłoki i plików. Otwiera to drogę do bezpiecznego uruchamiania Codex CLI w zdalnych workflow testowych, gdzie izolacja jest kluczowa.

    Dla deweloperów narzędzi wewnętrznych prawdziwą perełką jest nowy tryb app-server. Pozwala on na integrację Codex CLI z własnymi skryptami, narzędziami czy pipeline'ami. App-server współpracuje z menedżerem wątków i interfejsem TUI, umożliwiając realizację bardziej zaawansowanych scenariuszy automatyzacji. Brzmi to technicznie, ale w praktyce oznacza, że możesz wbudować AI bezpośrednio w swoje wewnętrzne automaty.

    Ujednolicone logowanie przez konto ChatGPT

    To zmiana, która uprości życie wielu użytkownikom. Do tej pory korzystanie z Codex CLI wiązało się głównie z użyciem klucza API. Teraz dostęp jest ujednolicony z kontem ChatGPT.

    Proces jest prosty: używasz swojego istniejącego abonamentu ChatGPT. Niezależnie od tego, czy posiadasz plan ChatGPT Plus, Pro, Business, Edu czy Enterprise – Twój dostęp i limity są przypisane do konta. Nie musisz martwić się o oddzielny klucz API i jego limity, chyba że wolisz tę ścieżkę, która nadal pozostaje dostępna.

    Integracja idzie o krok dalej. Konfiguracja pluginów stała się znacznie płynniejsza. CLI sugeruje teraz instalację brakujących wtyczek czy konektorów (szanując przy tym listy dozwolonych sugestii), synchronizuje ich instalację i deinstalację między urządzeniami, a nawet sprawdza autoryzację podczas instalacji. To drobne usprawnienia, które znacząco poprawiają komfort pracy.

    Ulepszenia stabilności i interfejsu

    Najnowsze wersje alpha skupiają się na dopracowaniu i stabilizacji, szczególnie w kluczowym obszarze współpracy w czasie rzeczywistym (realtime collaboration) i interfejsu terminalowego (TUI).

    Sam interfejs app-servera został dopracowany. TUI potrafi teraz czytać zawartość terminala, a aplikacja Codex sprawdza działające serwery lub wyniki kompilacji, oferując jeszcze lepszy wgląd w stan systemu.

    Warto również wspomnieć, że w kontekście bezpieczeństwa znana jest luka w Codex CLI umożliwiająca przejęcie kontroli przez odpowiednio sformatowany plik, co podkreśla potrzebę ostrożności i regularnego instalowania najnowszych aktualizacji.

    Dlaczego to ważne dla deweloperów?

    Te aktualizacje mogą wydawać się typowo korporacyjne, ale ich zalety odczuje każdy profesjonalny programista, szczególnie zajmujący się web developmentem, AI, DevOps czy „vibe codingiem”.

    Przede wszystkim workflow w terminalu staje się priorytetowy. Pełnoekranowy interfejs TUI z edytorem promptów, podglądem plików i zrzutów ekranu, panelem odpowiedzi ze strumieniowaniem i diffami oraz paskiem statusu z informacjami o modelu, tokenach i stanie Gita – to kompletne środowisko pracy bez konieczności otwierania przeglądarki czy IDE.

    Zyskuje także produktywność. Funkcje takie jak Smart Approvals, które kierują zadania do "subagenta-strażnika", czy lokalny przegląd kodu za pomocą komendy /review (dla diffów, branchy i commitów) to realna pomoc. Możliwość pracy w trybach Auto lub Read-only daje pełną kontrolę nad tym, jak głęboko AI ingeruje w kod.

    Wreszcie warto podkreślić wieloplatformowość i otwartość. Codex CLI działa na macOS (ARM i x86) oraz Linuxie (x86/ARM, także z biblioteką musl). Narzędzie jest budowane w open-source'owym języku Rust, co gwarantuje szybkość i przejrzystość. Można je osadzać w pipeline'ach CI, łączyć przez protokół MCP z serwisami takimi jak GitHub czy Sentry, a także ładować gotowe "Skills" do wielokrotnego użytku w workflow AI.

    Podsumowanie

    Najnowsze aktualizacje Codex CLI to ewolucja w stronę dojrzałości i gotowości na wdrożenia produkcyjne. Nie znajdziemy tu rewolucyjnych modeli AI, ale za to szereg praktycznych, przemyślanych ulepszeń, które eliminują bariery w codziennej pracy.

    Dla programisty indywidualnego największą różnicą będzie wygoda ujednoliconego dostępu przez konto ChatGPT i jeszcze płynniejsza praca. Dla zespołów i firm to otwarcie nowych możliwości: zaawansowana kontrola przez sandbox oraz API do integracji z wewnętrznymi narzędziami.

    OpenAI pokazuje, że Codex CLI nie jest już tylko eksperymentalnym gadżetem, ale poważnym narzędziem pracy, które może stać się integralną częścią procesu developmentu – od małych projektów po korporacyjne centra danych. Najnowsze wersje solidnie budują fundamenty pod tę przyszłość.

  • Claude Code 2.1.77: Znaczący wzrost limitów tokenów i poprawa wydajności

    Claude Code 2.1.77: Znaczący wzrost limitów tokenów i poprawa wydajności

    Nowa wersja asystenta programistycznego Claude Code przynosi jedną z najbardziej wyczekiwanych przez społeczność developerów zmian – znaczne zwiększenie limitów tokenów dla najwydajniejszych modeli. To nie wszystko, ponieważ aktualizacja skupia się także na stabilności, szybkości działania i naprawie wielu drobnych, ale uciążliwych błędów. Dla osób wykorzystujących AI do pisania kodu, audytów czy refaktoryzacji, jest to istotne usprawnienie codziennego workflow.

    Główne zmiany: więcej miejsca na kod i dłuższe odpowiedzi

    Bez wątpienia flagową nowością jest podniesienie domyślnego maksymalnego rozmiaru odpowiedzi. Dla modeli Claude standardowy limit kontekstu wynosi 200 tysięcy tokenów, z możliwością rozszerzenia do 1 miliona tokenów w przypadku modelu Opus. To ogromna przestrzeń, pozwalająca na wygenerowanie lub przeanalizowanie dużych fragmentów kodu w jednym podejściu. Jest to często kluczowa kwestia przy pracy nad złożonymi modułami czy architekturą.

    Tak wysoki limit otwiera drzwi do zaawansowanych scenariuszy, choć prawdopodobnie będzie wymagał odpowiednich zasobów i konfiguracji. Dla porównania, wcześniejsze wersje systemu operowały na niższych wartościach, a obecne zwiększenie limitu to bezpośrednia odpowiedź na potrzeby programistów pracujących z dużymi bazami kodu.

    Pod maską: szybszy start i lepsza obsługa sesji

    Wydajność to drugi filar tej aktualizacji. Zespół odpowiedzialny za Claude Code położył duży nacisk na optymalizację, szczególnie odczuwalną na komputerach Mac. Dzięki wprowadzonym usprawnieniom czas startu aplikacji na macOS uległ skróceniu. Brzmi to jak drobiazg, ale przy wielokrotnym uruchamianiu narzędzia w ciągu dnia te ulepszenia sumują się, poprawiając płynność pracy.

    Duże ulepszenia dotyczą też mechanizmu wznawiania zapisanych sesji. W przypadku bardzo rozbudowanych konwersacji z wieloma wątkami czas ładowania uległ skróceniu, a zużycie pamięci operacyjnej w trakcie tego procesu spadło. Jest to istotne, ponieważ długie sesje analityczne są jedną z mocnych stron Claude Code, a zarządzanie nimi staje się teraz szybsze i mniej obciążające dla systemu.

    Ważne poprawki błędów i dopracowanie szczegółów

    Ważne poprawki błędów i dopracowanie szczegółów

    Lista poprawek jest długa i dotyczy wielu aspektów, od uprawnień po integracje z innymi narzędziami. Kilka kluczowych naprawionych problemów:

    • Uprawnienia dla złożonych komend bash: Poprawiono błąd, w którym opcja „Zawsze zezwalaj” dla poleceń tworzyła nieprawidłową regułę, co skutkowało ciągłym ponawianiem pytań o uprawnienia. Teraz funkcja ta działa prawidłowo.
    • Bezpieczeństwo hooków: Wprowadzono poprawki dotyczące hooków, takich jak PreToolUse, zwiększające kontrolę nad działaniem modeli w środowiskach produkcyjnych i enterprise.
    • Stabilność pracy w tmux i VS Code: Wprowadzono szereg poprawek zwiększających stabilność podczas pracy w terminalu tmux oraz lepszą integrację z VS Code, szczególnie gdy Claude Code jest uruchamiany wewnątrz tych środowisk.
    • Tryb vim i kopiowanie: Załatano drobne, ale irytujące błędy, takie jak problemy z obsługą hiperłączy.
    • Zarządzanie pamięcią (memory growth): Wprowadzono optymalizacje zarządzania pamięcią w długo działających sesjach, aby aplikacja pozostawała responsywna nawet po wielu godzinach ciągłej pracy.

    Nowe opcje i ulepszenia dla developerów

    Oprócz poprawek pojawiły się także nowe możliwości konfiguracji. W ustawieniach sandboxa dodano opcje oferujące bardziej elastyczną, precyzyjną kontrolę dostępu do systemu plików. Jest to szczególnie przydatne w skomplikowanych środowiskach deweloperskich.

    Ulepszono również polecenia związane z zarządzaniem historią rozmowy – to proste zmiany, które realnie pomagają przy pracy z wieloma odpowiedziami.

    Kontekst rozwoju i znaczenie aktualizacji

    Ta wersja wpisuje się w szerszą serię aktualizacji skupiających się na fundamentach: pojemności modeli, szybkości i niezawodności. Wcześniejsze wydania wprowadzały już znaczące optymalizacje, takie jak redukcja ponownego renderowania promptów czy mniejsze zużycie pamięci przy starcie. Obecna wersja kontynuuje ten trend.

    To kolejny krok w ewolucji zarządzania kontekstem. Wcześniejsze wersje redukowały rozmiar promptu systemowego, aby „zaoszczędzone” miejsce oddać użytkownikowi. Teraz programiści otrzymują jeszcze większą przestrzeń roboczą.

    Dla kogo jest ta aktualizacja?

    Ta wersja to must-have przede wszystkim dla:

    1. Programistów pracujących nad dużymi plikami lub architekturą, którzy regularnie napotykali ograniczenia długości odpowiedzi.
    2. Użytkowników macOS, którzy odczują usprawnione uruchamianie aplikacji.
    3. Osób prowadzących długie, złożone sesje analityczne, które są teraz sprawniej obsługiwane.
    4. Zespołów enterprise, dla których kluczowe są poprawki w zakresie bezpieczeństwa hooków i kontroli dostępu.
    5. Miłośników pracy w terminalu z tmux i vimem, którzy otrzymali bardziej stabilne środowisko.

    Podsumowanie

    Najnowsza aktualizacja Claude Code nie wprowadza rewolucyjnych funkcji wizualnych, ale dostarcza namacalnych ulepszeń w obszarach najważniejszych dla programistów. Zwiększenie limitu tokenów to bezpośrednia odpowiedź na potrzebę generowania bardziej złożonych fragmentów kodu. Optymalizacje startu i wznawiania sesji czynią codzienną pracę płynniejszą, a długa lista poprawek sprawia, że narzędzie działa w sposób bardziej przewidywalny i niezawodny. To aktualizacja, która solidnie buduje fundamenty pod dalszy rozwój i bardziej wymagające zastosowania AI w inżynierii oprogramowania.

  • Codex 0.115.0: pełna inspekcja obrazów, transkrypcje na żywo i zaawansowane API

    Codex 0.115.0: pełna inspekcja obrazów, transkrypcje na żywo i zaawansowane API

    Najnowsze aktualizacje Codex, autonomicznego agenta AI do kodowania i automatyzacji od OpenAI, wprowadzają szereg znaczących ulepszeń, które mogą zmienić sposób pracy deweloperów. Najważniejsze nowości skupiają się na integracjach, narzędziach CLI/SDK oraz stabilności codziennych workflowów. To nie tylko rozwój funkcjonalności, ale też solidna porcja usprawnień technicznych.

    Integracje z narzędziami designerskimi i komunikacyjnymi

    Jednym z kluczowych obszarów rozwoju są integracje z popularnymi platformami, takimi jak Figma. Pozwala to deweloperom i designerom na płynną współpracę, w której Codex może asystować przy analizie interfejsów użytkownika (UI) i flow projektowych bezpośrednio w znanych narzędziach. Podobne integracje z platformami komunikacyjnymi, takimi jak Slack, umożliwiają włączanie automatyzacji do codziennej komunikacji zespołowej.

    Te połączenia wskazują na ewolucję Codex z narzędzia stricte programistycznego w stronę platformy automatyzacji procesów deweloperskich i projektowych, działającej w kontekście istniejących aplikacji.

    Rozwój CLI, SDK i środowiska deweloperskiego

    Codex oferuje rozbudowane narzędzia wiersza poleceń (CLI) oraz SDK (głównie w TypeScript), które stanowią podstawę interakcji z agentem. Środowisko to jest stale rozwijane, aby zapewnić programistom potężne i elastyczne możliwości automatyzacji.

    Funkcjonalności obejmują zaawansowane zarządzanie wykonywaniem poleceń ze wsparciem dla streamingu stdin/stdout/stderr oraz TTY/PTY. Dla deweloperów pracujących z terminalami i kontenerami to istotne usprawnienie, które pozwala na lepszą integrację z istniejącym ekosystemem. SDK pozwala programistom łatwo integrować operacje Codexa z ich własnym kodem, zapewniając kontrolowany dostęp do automatyzacji.

    Stabilność i bezpieczeństwo automatyzacji

    Każda duża aktualizacja przynosi też poprawki stabilności i bezpieczeństwa, kluczowe dla zautomatyzowanych workflowów.

    Ulepszenia dotyczą bezpieczeństwa i izolacji podczas uruchamiania zautomatyzowanych agentów i subagentów, co stanowi fundament zaufania do platformy. Poprawki w obszarze routingu i normalizacji wewnętrznych procesów zmniejszają ryzyko błędów przy złożonych automatyzacjach.

    Warto też zauważyć zwiększoną transparentność działań agenta – użytkownik ma lepszy wgląd w to, jakie operacje i z jakimi parametrami zostaną wykonane, zanim wyrazi na nie zgodę.

    Ekosystem rozszerzeń i workflow deweloperów

    Rozwój nie ominął też ekosystemu rozszerzeń. Wprowadzane są lepsze integracje aplikacji oraz ulepszone workflowy dla pluginów.

    Dla deweloperów oznacza to łatwiejsze znajdowanie i włączanie potrzebnych funkcjonalności do projektów, choć obecnie odbywa się to raczej przez bezpośrednie integracje niż scentralizowany marketplace. Dbałość o odpowiednie uprawnienia i weryfikację źródeł pluginów podczas instalacji redukuje ryzyko naruszenia bezpieczeństwa i ułatwia zarządzanie zależnościami.

    Wnioski

    Najnowsze aktualizacje Codex idą w dwóch kierunkach: poszerzają konkretne możliwości integracyjne z kluczowymi narzędziami deweloperskimi oraz solidnie wzmacniają istniejącą bazę, zwiększając stabilność, bezpieczeństwo i ergonomię pracy.

    Dla deweloperów codziennie korzystających z automatyzacji poprawki w wykonywaniu poleceń i bezpieczeństwie będą najbardziej odczuwalne w bieżącej pracy. Dla osób budujących bardziej złożone systemy rozwinięte SDK i integracje otwierają nowe możliwości włączania AI do szerszych procesów.

    OpenAI rozwija Codex nie tylko jako asystenta kodowania, ale jako platformę do zaawansowanej automatyzacji developer workflow. Rozwój skupia się zarówno na głębi (zaawansowane SDK, integracje), jak i na szerokości (poprawki stabilności, ulepszenia UX). To dobry kierunek dla wszystkich, którzy oczekują spójnego i bezpiecznego środowiska do automatyzacji całych procesów wytwarzania oprogramowania.

  • Nowy model Cursor, Composer 2, łączy wysoką inteligencję kodowania z niższym kosztem

    Nowy model Cursor, Composer 2, łączy wysoką inteligencję kodowania z niższym kosztem

    Anysphere, firma stojąca za popularnym środowiskiem programistycznym Cursor, ogłosiła wydanie nowej, autorskiej wersji modelu AI do kodowania – Composer 2. To znacząca aktualizacja modelu Composer, która w ciągu zaledwie pięciu miesięcy przynosi duży skok jakościowy. Najważniejsze przesłanie? Frontierowa inteligencja w zakresie kodowania, ale w znacznie niższej cenie niż u konkurencji.

    Composer 2 jest już dostępny bezpośrednio w środowisku Cursor, co oznacza, że użytkownicy mogą z niego korzystać w ramach codziennej pracy z kodem. Firma mocno stawia na integrację modelu z własnym ekosystemem, podkreślając, że jest on specjalnie dostrojony do agentowego workflow, użycia narzędzi, edycji plików i operacji terminalowych oferowanych przez Cursor.

    Znacząca poprawa wyników benchmarków

    Cursor opublikował zestawienie wyników, które pokazuje wyraźny postęp w stosunku do poprzednich modeli z rodziny Composer. Nowa wersja osiąga lepsze wyniki w wewnętrznym CursorBench, Terminal-Bench 2.0 oraz SWE-bench Multilingual.

    Dla porównania, oryginalny model Composer osiągał znacznie słabsze rezultaty. To pokazuje solidny skok jakościowy w każdym z mierzonych obszarów. Szczególnie istotny jest przyrost w Terminal-Bench 2.0, który mierzy, jak dobrze agent AI radzi sobie z zadaniami w terminalu, czyli kluczowym elementem pracy programisty.

    Co ciekawe, firma nie twierdzi, że jej model jest bezkonkurencyjny. W Terminal-Bench 2.0 prowadzą modele konkurencji, jednak Composer 2 plasuje się przed innymi rozwiązaniami i własnym poprzednikiem. Taka szczerość buduje wiarygodność – Cursor nie obiecuje cudów, lecz konkretny, wymierny postęp.

    Przełom w ekonomii użytkowania: znacznie taniej

    Jeśli wyniki benchmarków mogą być postrzegane jako względne, to obniżka cen jest już absolutnie namacalna. To prawdopodobnie najsilniejszy atut marketingowy tego wydania. Composer 2 Standard kosztuje 0,50 USD za milion tokenów wejściowych i 2,50 USD za milion tokenów wyjściowych.

    To ogromna zmiana w porównaniu do poprzednich stawek. Firma wprowadza też wariant szybszy, Composer 2 Fast, który oferuje identyczny poziom inteligencji, ale wyższą przepustowość. Kosztuje on 1,50 USD za wejście i 7,50 USD za wyjście, co i tak stanowi znaczną obniżkę względem poprzedniej generacji.

    Cursor idzie o krok dalej i czyni szybszy wariant domyślnym dla użytkowników. To odważny ruch, który sugeruje, że priorytetem jest płynność pracy, a firma może zapewnić ją w konkurencyjnej cenie. Dla użytkowników planów indywidualnych zużycie Composer jest częścią osobnej puli z ogólnym limitem, co ułatwia kontrolę kosztów.

    Skupienie na zadaniach długofalowych

    Cursor nie oferuje po prostu lepszego autouzupełniania kodu. Kluczowym przesłaniem technicznym jest to, że Composer 2 został wytrenowany specjalnie pod kątem długofalowego kodowania agentowego.

    W praktyce chodzi o to, by model nie tylko napisał pojedynczą funkcję, ale potrafił prowadzić złożony, wieloetapowy proces: analizę repozytorium, podejmowanie decyzji o koniecznych zmianach, edycję wielu plików, uruchamianie poleceń, interpretację błędów i kontynuowanie pracy aż do osiągnięcia celu. To właśnie te "setki akcji", o których wspomina firma.

    Postęp w tej dziedzinie jest kluczowy, ponieważ wiele modeli świetnie radzi sobie z izolowanymi zadaniami, ale "gubi wątek" w dłuższych, sekwencyjnych procesach programistycznych.

    Kompresja w pętli uczenia: techniczny sekret modelu

    Aby rozwiązać problem długiego horyzontu planowania, zespół Cursor zastosował innowacyjną technikę treningu zwaną compaction-in-the-loop reinforcement learning. W dużym uproszczeniu: zamiast traktować podsumowanie kontekstu (gdy okno kontekstowe się kończy) jako zewnętrzny, odrębny krok, wbudowano tę funkcję bezpośrednio w proces uczenia się modelu.

    Jak to działa? Podczas treningu model jest celowo wypychany do limitu swojego okna kontekstowego. Następnie, za pomocą uczenia ze wzmocnieniem (RL), jest nagradzany za wygenerowanie "skompresowanej" wersji własnej historii, która pozwala mu pomyślnie dokończyć zadanie.

    Jeśli model przygotuje złe podsumowanie – na przykład pominie kluczową nazwę zmiennej czy informację o poprzednio naprawionym błędzie – zawiedzie w zadaniu i otrzyma ujemną nagrodę. Dzięki temu uczy się, które elementy historii są naprawdę istotne dla kontynuowania pracy.

    Według danych Cursor, to podejście znacząco redukuje błędy związane z kompresją kontekstu w porównaniu do wcześniejszych metod. Generowane podsumowania są też dużo wydajniejsze pod względem zużycia tokenów niż standardowe streszczenia tworzone na podstawie promptów. Pozwala to agentowi na pracę nad refaktoryzacją całego projektu bez utraty głównego celu.

    Cursor: mały gigant na rynku AI dla deweloperów

    Kontekst tego wydania jest nie mniej ciekawy niż sam model. Anysphere rozwija się dynamicznie. Firma zatrudnia około 400 osób, co w porównaniu do gigantów takich jak OpenAI, Anthropic czy Google, czyni ją stosunkowo małym graczem. Mimo to udaje jej się nie tylko rozwijać zaawansowane środowisko programistyczne, ale także tworzyć i szybko iterować własne, konkurencyjne modele. Wydanie Composer 2 w tak krótkim czasie pokazuje niezwykłe tempo innowacji.

    Podsumowanie: praktyczny krok naprzód

    Wydanie Composer 2 nie jest ogłoszeniem "zabójcy" modeli konkurencji. To pragmatyczna i prawdopodobnie bardziej użyteczna dla programistów propozycja. Cursor mówi: nasz model wszedł do wyższej ligi jakościowej, oferuje atrakcyjną ekonomię i jest głęboko zintegrowany z narzędziem, z którego i tak korzystasz.

    Dla deweloperów już pracujących w Cursorze aktualizacja do Composer 2 wydaje się oczywistym wyborem – oferuje lepszą wydajność za ułamek wcześniejszych kosztów. Dla osób rozważających zmianę środowiska to kolejny mocny argument. Firma pokazuje, że potrafi szybko dostarczać realną wartość, łącząc badania nad AI z praktycznymi potrzebami programistów. W świecie AI, gdzie wielkie, ogólne modele często kradną uwagę, Cursor konsekwentnie udowadnia, że głęboka specjalizacja i dopasowanie do konkretnego workflow użytkownika to potężna strategia.

  • Pushuj zdarzenia do działającej sesji za pomocą kanałów

    Pushuj zdarzenia do działającej sesji za pomocą kanałów

    To kluczowy mechanizm komunikacji w czasie rzeczywistym. W świecie programowania, szczególnie gdy pracujemy z asystentami AI takimi jak Claude Code, często pojawia się potrzeba reakcji na zdarzenia zewnętrzne – wiadomość od zespołu, wynik pipeline'u CI czy alert z systemu monitorowania. To właśnie tutaj pojawiają się kanały (channels) – technologia pozwalająca na przekazywanie komunikatów, alertów i webhooków bezpośrednio do Twojej działającej sesji Claude Code.

    Czym właściwie są kanały?

    Kanały to w istocie specjalne serwery MCP (Model Context Protocol), które pełnią rolę mostu komunikacyjnego. Pozwalają one na wypychanie (push) zdarzeń z platform zewnętrznych – takich jak Discord, Telegram czy systemy CI/CD – prosto do otwartego okna terminala, w którym pracujesz z Claude. To fundamentalna różnica w porównaniu z innymi metodami integracji, które często wymagają uruchomienia nowej sesji w chmurze lub biernego czekania na zapytanie.

    Działa to tak: gdy sesja Claude Code jest aktywna, kanał pozostaje w trybie nasłuchiwania. Kiedy na połączonej platformie pojawi się nowe zdarzenie (np. wiadomość na czacie), kanał natychmiast je pakuje i przesyła do Twojej sesji. Claude odbiera tę wiadomość, analizuje kontekst i może na nią zareagować – wykonując polecenie, analizując logi czy odpowiadając przez ten sam kanał. Cała komunikacja jest dwukierunkowa.

    Jak to działa w praktyce? Przykład Telegrama

    Załóżmy, że chcesz połączyć Claude Code z Telegramem. Proces jest prosty, choć wymaga kilku kroków konfiguracyjnych. Najpierw musisz stworzyć bota w Telegramie za pomocą BotFather – to standardowy mechanizm tej platformy. BotFather poda Ci token, który jest kluczem do autoryzacji.

    Następnie, w samej sesji Claude Code, instalujesz oficjalny plugin kanału Telegram komendą /plugin install telegram@claude-plugins-official. Po instalacji konfigurujesz go, podając wcześniej uzyskany token. Potem wystarczy zrestartować Claude Code z flagą --channels, wskazując na zainstalowany plugin. To uruchamia serwer kanału, który zaczyna nasłuchiwać wiadomości przychodzących do Twojego bota.

    Ostatni krok to sparowanie konta. Wysyłasz dowolną wiadomość do swojego bota na Telegramie, a ten odpowiada kodem parowania. Ten kod wprowadzasz w sesji Claude Code, łącząc w ten sposób tożsamość użytkownika. Od tej chwili, gdy napiszesz do bota na Telegramie, wiadomość pojawi się w terminalu, a Claude będzie mógł na nią odpowiedzieć – i ta odpowiedź wróci do Ciebie na Telegram.

    Dlaczego to użyteczne? Dwa główne przypadki

    Dlaczego to użyteczne? Dwa główne przypadki

    Wartość kanałów najlepiej widać w dwóch konkretnych scenariuszach użycia. Pierwszy to mosty czatowe. Wyobraź sobie, że jesteś poza biurem, ale masz dostęp do telefonu z Telegramem czy Discordem. Możesz wysłać do Claude pytanie: „Hej, jakie zmiany są obecnie w staged na branchu feature/auth?”. Wiadomość trafia przez kanał do działającej sesji na Twoim komputerze. Claude odczytuje ją, wykonuje komendę git status w odpowiednim katalogu roboczym i wynik wysyła z powrotem na Twój telefon. Pracujesz na rzeczywistym stanie swoich plików, bez potrzeby korzystania ze zdalnego pulpitu.

    Drugi scenariusz to odbiorniki webhooków. Tutaj kanał może nasłuchiwać na endpointach, na które dane wysyłają systemy zewnętrzne. Gdy pipeline CI zakończy build – sukcesem lub porażką – webhook z tą informacją trafia do kanału, a ten natychmiast przekazuje ją do Claude. Claude, mając otwarty dany projekt, może od razu przeanalizować logi błędów, zasugerować poprawki lub po prostu Cię poinformować. To automatyzacja reakcji na zdarzenia w czasie rzeczywistym.

    Bezpieczeństwo i kontrola dostępu

    Mechanizm kanałów został zaprojektowany z myślą o bezpieczeństwie. Podstawową ochroną jest lista dozwolonych nadawców (allowlist). Po sparowaniu konta Twój identyfikator z danej platformy (np. ID użytkownika Telegrama) trafia na tę listę. Tylko wiadomości od zatwierdzonych nadawców są przekazywane do sesji. Komunikaty od wszystkich innych osób są po cichu odrzucane.

    Dodatkową warstwą kontroli jest flaga --channels przy uruchamianiu Claude Code. Nawet jeśli plugin jest zainstalowany, musi zostać jawnie włączony dla danej sesji. Daje to pełną świadomość, które kanały są w danym momencie aktywne.

    W organizacjach (plany Team i Enterprise) administrator ma nadrzędną kontrolę poprzez ustawienie channelsEnabled w panelu zarządzania. Domyślnie w tych planach kanały są wyłączone i muszą zostać odblokowane przez administratora, zanim użytkownicy będą mogli z nich skorzystać.

    Różnica w stosunku do innych funkcji Claude Code

    Różnica w stosunku do innych funkcji Claude Code

    Claude Code oferuje kilka sposobów na interakcję z systemami zewnętrznymi, ale kanały zajmują wśród nich unikalne miejsce. Claude Code w przeglądarce uruchamia zadania w nowej, odizolowanej sesji w chmurze. To dobre rozwiązanie dla zadań, które można wykonać osobno. Claude w Slacku również tworzy nową sesję webową, ale inicjuje ją z poziomu wiadomości.

    • Standardowy serwer MCP działa na żądanie – Claude wysyła do niego zapytanie, gdy potrzebuje danych podczas wykonywania zadania. Nic nie jest „wypychane”. Zdalne sterowanie (Remote Control) pozwala kierować lokalną sesją z poziomu przeglądarki lub aplikacji mobilnej Claude.

    Kanały wypełniają lukę między tymi opcjami. Nie tworzą nowej sesji, lecz dostarczają zdarzenia do sesji, która już działa. To czyni je idealnymi do ciągłej, reaktywnej współpracy z istniejącym kontekstem i otwartymi plikami.

    Demo fakechat i co dalej?

    Dla osób, które chcą przetestować ten koncept bez konfigurowania zewnętrznych kont, dostępny jest oficjalny kanał demonstracyjny fakechat. Po instalacji pluginu i restarcie Claude z flagą --channels, w przeglądarce otwiera się prosty interfejs czatu pod adresem localhost:8787. Wszystko dzieje się lokalnie, bez potrzeby używania tokenów. To doskonały poligon do pierwszych eksperymentów.

    Jeśli chodzi o przyszłość, kanały są obecnie w fazie research preview. Oznacza to, że ich implementacja może ewoluować w oparciu o feedback społeczności. Aktualnie flaga --channels akceptuje tylko pluginy z oficjalnej, zatwierdzonej listy Anthropic. Dla deweloperów chcących budować własne kanały dla innych systemów dostępna jest opcja --dangerously-load-development-channels, przeznaczona właśnie do testów.

    Podsumowanie

    Kanały w Claude Code to potężne narzędzie, które zmienia sposób myślenia o interakcji z asystentem programistycznym. Przestaje on być zamknięty w oknie terminala, a staje się aktywnym uczestnikiem przepływu informacji w całym Twoim ekosystemie. Może odpowiadać na pytania zadane z telefonu, monitorować status wdrożeń i reagować na alerty – wszystko w kontekście pracy, którą aktualnie wykonujesz. To krok w stronę bardziej płynnej i zintegrowanej automatyzacji codziennych zadań deweloperskich.

  • OpenCode 1.2.27: wsparcie dla wielu okien i znaczny wzrost wydajności

    OpenCode 1.2.27: wsparcie dla wielu okien i znaczny wzrost wydajności

    Wydanie OpenCode w wersji 1.2.27, które zadebiutowało 16 marca 2026 roku, przynosi szereg poprawek i optymalizacji stabilizujących działanie narzędzia. To nie są jedynie kosmetyczne zmiany, lecz solidna aktualizacja, która wzmacnia fundamenty tego otwartoźródłowego asystenta kodowania AI.

    Popularność narzędzi do vibe coding, czyli programowania sterowanego promptami, rośnie lawinowo. Deweloperzy szukają rozwiązań, które nie tylko zrozumieją ich intencje, ale też pozwolą płynnie zarządzać złożonymi projektami. OpenCode odpowiada na te potrzeby, łącząc potężne zdolności agentowe z praktycznym interfejsem. Wersja 1.2.27 udowadnia, że twórcy projektu słuchają swojej społeczności.

    Stabilizacja i poprawki błędów

    Kluczową poprawką, która powstała dzięki zgłoszeniu społeczności, jest usunięcie błędu zaraportowanego przez użytkownika @luisfelipesena (#16814). Problem dotyczył utraty sesji po inicjalizacji repozytorium Git w istniejącym projekcie (git init). Wyobraźcie sobie sytuację: zaczynacie pracę z OpenCode w folderze, który nie jest jeszcze pod kontrolą wersji. Agent pomaga w pisaniu kodu, a potem decydujecie się dodać Gita. I nagle… cała sesja znika. Wersja 1.2.27 definitywnie rozwiązuje ten problem, co dla wielu procesów wytwórczych opartych na VCS jest nie do przecenienia.

    Kolejna istotna zmiana dotyczy rdzenia aplikacji. Przeprowadzono refaktoryzację ProviderAuthService oraz AuthService z użyciem wzorca Effect, co przekłada się na większą niezawodność i łatwiejsze utrzymanie kodu.

    Desktop nabiera blasku i szybkości

    Desktop nabiera blasku i szybkości

    Aktualizacja interfejsu użytkownika w aplikacji desktopowej to zestaw usprawnień, które zapewniają płynniejszą pracę.

    • Wybór modelu AI jest teraz trwale przypisany do sesji*. Jeśli w danej sesji pracujecie z konkretnym modelem, to przy kolejnym powrocie do niej ten wybór zostanie zachowany. To drobiazg, który eliminuje irytujące powtarzanie tej samej czynności.

    Dostrojono również kontrolki kompozytora promptów, czyli miejsca, w którym wpisujecie instrukcje dla AI. Działają one teraz bardziej responsywnie, co niweluje poczucie opóźnienia (latency). Naprawiono też uciążliwy błąd, przez który przewijanie tekstu „uciekało” poza pole wprowadzania promptu.

    Wizualnie otwieranie i zamykanie paska bocznego wzbogacono o subtelne animacje, które obejmują nawet elementy paska tytułowego. Poprawiono odstępy, kolory wskaźników ładowania oraz tła elementów listy. To właśnie te detale sprawiają, że aplikacja sprawia wrażenie dopracowanej.

    Stabilność i wsparcie dla ekosystemu

    Stabilność i wsparcie dla ekosystemu

    Wydanie zawiera również poprawki stabilizujące pracę w różnych środowiskach. Tryb fail-fast podczas instalacji zależności konfiguracyjnych w testach end-to-end pozwala szybciej wykryć problemy z budowaniem projektu (buildem). Dla użytkowników AWS poprawiono filtrowanie pustych bloków treści dla dostawcy Bedrock (poprawka @elithrar, #14586).

    Interfejs wiersza poleceń (CLI) został wzbogacony o nowe funkcje zarządzania, co ułatwia codzienną pracę. Z kolei w trybie tekstowym (TUI) uporządkowano listę dostawców przy logowaniu i usunięto zbędne ostrzeżenie dotyczące OpenRouter.

    Co ciekawe, w przygotowaniu tej aktualizacji brało udział kilku aktywnych współtwórców spoza głównego zespołu, takich jak @luisfelipesena, @elithrar i @ryanskidmore. Pokazuje to, jak kluczowy jest wkład społeczności – to właśnie ich zgłoszenia i poprawki doprowadziły do wyeliminowania najbardziej uciążliwych błędów.

    Co to oznacza dla Twojego workflow?

    Jeśli jesteś web deweloperem, te zmiany bezpośrednio wpłyną na Twoją codzienną pracę. Stabilniejsze działanie oznacza, że OpenCode będzie lepiej radzić sobie z dużymi projektami, zawierającymi tysiące plików i zależności.

    Dla entuzjastów sztucznej inteligencji i vibe coding refaktoryzacja usług autoryzacji to inwestycja w przyszłość. Czystsza architektura ułatwi dodawanie nowych modeli i dostawców, a także zapewni większą stabilność podczas długich, złożonych sesji z agentem.

    Z perspektywy DevOps naprawa problemów z Gitem, lepsze zarządzanie sesjami i ogólna stabilizacja sprawiają, że OpenCode staje się bardziej godnym zaufania narzędziem, które można włączyć w zautomatyzowany pipeline lub wykorzystać do utrzymania skomplikowanej infrastruktury.

    Podsumowanie

    Wydanie OpenCode 1.2.27 nie kusi krzykliwymi nowościami. Zamiast tego skupia się na fundamentalnych usprawnieniach: stabilności i ergonomii. Głębokie optymalizacje silnika i interfejsu przygotowują grunt pod dalszy rozwój.

    To aktualizacja, która świadczy o dojrzałości projektu. Zamiast gonić za kolejnymi, niedopracowanymi funkcjami, twórcy dopracowali podstawy. Efekt? Narzędzie, które nie tylko potrafi więcej dzięki AI, ale po prostu zapewnia lepszy komfort pracy. To prawdopodobnie najlepsza wiadomość dla wszystkich, którzy już używają OpenCode lub planują go wypróbować.