Kategoria: Oprogramowanie

  • Codex 0.128.0: Przepis na długoterminowe Zadania AI i Lepsze Sterowanie Agentem

    Codex 0.128.0: Przepis na długoterminowe Zadania AI i Lepsze Sterowanie Agentem

    OpenAI nieustannie rozwija możliwości swojego terminalowego agenta kodującego, a najnowsza wersja Codex 0.128.0 to doskonały przykład tych postępów. To wydanie nie jest jedynie zbiorem poprawek, ale istotnym krokiem w kierunku przekształcenia Codexa z prostego narzędzia w proaktywny, autonomiczny silnik stanów. Kluczowym elementem aktualizacji jest wprowadzenie trwałych przepływów pracy /goal, które zmieniają sposób, w jaki programiści mogą delegować złożone, wieloetapowe zadania. Codex staje się teraz asystentem zdolnym do prowadzenia długoterminowej narracji projektu, zamiast odpowiadać na pojedyncze, izolowane komendy.

    Kluczowe fakty o wydaniu Codex 0.128.0

    • Trwałe cele /goal pozwalają na definiowanie zadania, które agent realizuje przez wiele cykli kontynuacji, aż do jego ukończenia lub wyczerpania budżetu tokenów.
    • Zarządzanie stanem celów, takich jak realizacja, wstrzymanie, osiągnięcie czy ograniczenie budżetowe, umożliwia zaawansowane sterowanie zadaniem z poziomu TUI.
    • Ulepszona konfiguracja MultiAgentV2 usprawnia współpracę agentów w złożonych projektach.
    • Rozszerzone profile uprawnień i usprawnione zarządzanie wtyczkami zwiększają bezpieczeństwo i elastyczność środowiska pracy.

    Serce nowej funkcjonalności: trwałe cele /goal

    Do tej pory praca z Codexem przypominała rozmowę z niecierpliwym geniuszem – wydawane polecenia były realizowane, ale kontekst często się rozmywał. Mechanizm /goal odpowiada na potrzebę ciągłości w złożonych projektach deweloperskich. Nie jest to jedynie alias dla promptu, ale trwały obiekt przechowujący cel dla długotrwałego zadania. Użytkownik może teraz zdefiniować cel, który będzie aktywnie realizowany przez wiele tur, nawet w przypadku przerw. To sprawia, że Codex nadaje się do zadań takich jak wieloplikowe refaktoryzacje, sesje debugowania czy implementacje wymagające okresowych punktów kontrolnych.

    W praktyce, po wpisaniu /goal "Przeprowadź migrację bazy danych z PostgreSQL do MySQL", Codex nie tylko rozpoczyna pracę, ale także utrzymuje ten cel jako swój nadrzędny stan. System automatycznie wstrzykuje w trakcie działania specjalne prompty kontynuacji (goals/continuation.md), które przypominają agentowi o jego misji na koniec każdej tury, oraz prompty budżetowe (goals/budget_limit.md), które pilnują, by zadanie nie przekroczyło wyznaczonego limitu tokenów. Architektura opiera się na trwałości na poziomie wątku, co oznacza, że cel przetrwa wiele wymian i sprawdzeń kontynuacji, zachowując pełną świadomość celu.

    Sterowanie cyklem życia celu: od pauzy do wznowienia

    Kluczowym aspektem praktycznego zastosowania /goal jest możliwość zarządzania jego stanem. Codex 0.128.0 wprowadza intuicyjne komendy dostępne z poziomu interfejsu terminalowego (TUI), które dają programiście pełną kontrolę nad zadaniami długoterminowymi. Użytkownik może w każdej chwili wstrzymać agenta (pauza), aby na przykład przeanalizować dotychczasowe zmiany, a następnie wznowić jego pracę bez utraty kontekstu. Stan celu może odzwierciedlać, czy zadanie jest aktualnie realizowane, wstrzymane, osiągnięte, czy też przekroczyło limit budżetu.

    Rozróżnienie między pause (pauza) a clear (wyczyść) jest istotne i wynika z analiz społeczności. Wybranie opcji clear bezpowrotnie odrzuca cały stan celu, co jest równoznaczne z anulowaniem misji. Z kolei pause konserwuje stan, pozwalając na kontynuację w dowolnym momencie. Ta funkcjonalność eliminuje frustrację związaną z ponownym opisywaniem kontekstu po każdej przerwie, zmieniając Codex w niezawodnego współpracownika, który pamięta, nad czym pracował nawet po kilku godzinach.

    Ulepszenia kontroli agenta i niezawodności

    Poza nową funkcją celów, wydanie 0.128.0 przynosi szereg innych istotnych usprawnień, które wzmacniają fundamenty całego narzędzia. W odpowiedzi na potrzeby zaawansowanych użytkowników, konfiguracja MultiAgentV2 została ulepszona, co usprawnia współpracę wielu instancji Codexa i zwiększa przewidywalność ich działań w skomplikowanych środowiskach.

    Równolegle, profile uprawnień zostały rozszerzone, dając administratorom i użytkownikom drobnoziarnistą kontrolę nad tym, do jakich zasobów i operacji agent ma dostęp. To kluczowe dla bezpieczeństwa w środowiskach korporacyjnych. Usprawniono także zarządzanie wtyczkami, co upraszcza ich instalację i konfigurację, a tym samym rozszerza ekosystem narzędzi dostępnych dla Codexa. Całość dopełniają krytyczne poprawki błędów, które zwiększają ogólną niezawodność i stabilność narzędzia, czyniąc Codex 0.128.0 nie tylko nową funkcjonalnością, ale także dojrzewaniem platformy do roli nieodzownego partnera w codziennej pracy dewelopera.


    Źródła

  • OpenCode z lepszą obsługą powłoki i stabilnością przestrzeni roboczych

    OpenCode z lepszą obsługą powłoki i stabilnością przestrzeni roboczych

    OpenCode, otwartoźródłowy agent kodowania AI dostępny jako aplikacja terminalowa, desktopowa i rozszerzenie do IDE, otrzymał nową aktualizację. Wersja OpenCode z lepszą obsługą powłoki i stabilnością przestrzeni roboczych koncentruje się na dwóch problemach, które dotychczas były uciążliwe dla programistów — responsywności w trybie powłoki i stabilności sesji roboczych. Dodatkowo wprowadzono kilka poprawek dla użytkowników AWS Bedrock oraz ulepszono generację schematów OpenAPI.

    • Shell mode zyskał poprawki eliminujące opóźnienia kursora i klawiszy edycyjnych, a narzędzie powłoki informuje teraz model o skonfigurowanym limicie czasu.
    • AWS Bedrock doczekał się poprawki wiszących sesji — modele nie blokują się już przed rozpoczęciem odpowiedzi.
    • Edycja kodu stała się bezpieczniejsza dzięki odrzucaniu luźnych dopasowań, które mogły nadpisać niewłaściwy kod.
    • Przestrzenie robocze zyskały poprawki w adapterach HTTP API i procesie tworzenia nowych workspace'ów.
    • TUI i desktop otrzymały ulepszenia interfejsu, w tym poprawione przełączanie kart i responsywność paska tytułowego.

    Shell mode w końcu bez irytujących lagów

    Każdy, kto spędził trochę czasu w terminalowych agentach AI, zna ten moment — wklejasz polecenie, próbujesz poprawić literówkę, a kursor zachowuje się jak na zepsutej maszynie do pisania. OpenCode z lepszą obsługą powłoki i stabilnością przestrzeni roboczych rozwiązuje ten problem na kilka sposobów.

    Po pierwsze, narzędzie powłoki teraz informuje model o skonfigurowanym limicie czasu. W praktyce oznacza to, że AI wie, ile ma czasu na wykonanie operacji i może lepiej zarządzać zadaniami. Naprawiono również problemy związane z anulowaniem poleceń — wcześniej przerwana operacja mogła pozostawiać procesy w zawieszeniu. Teraz anulowanie skutecznie zamyka to, co powinno.

    Ruchy kursora i klawisze edycyjne działają teraz płynnie. Dla programistów spędzających godziny w terminalu to różnica między frustracją a produktywnym działaniem. Nie trzeba już się denerwować, gdy chcesz cofnąć się o kilka znaków i poprawić ścieżkę.

    Stabilność workspace'ów ratuje długie sesje

    Druga istotna zmiana dotyczy przestrzeni roboczych. Poprzednie wersje miały problemy z adapterami HTTP API i procesem tworzenia workspace'ów — szczególnie gdy pracowałeś na wielu repozytoriach jednocześnie lub przełączałeś się między projektami w trakcie długiej sesji.

    Aktualizacja wprowadza również poprawki dla konfiguracji desktopowych z wieloma serwerami. Każdy serwer teraz ma własny stan domowy i dedykowane karty sesji. Jeśli pracujesz z OpenCode na kilku maszynach albo łączysz się zdalnie, kontekst nie będzie się już gubił między restartami.

    Sesje teraz zapamiętują aktualizacje kontekstu systemowego nawet podczas długotrwałych konwersacji. Oznacza to, że agent nie zapomni nagle o twoich preferencjach czy ustawieniach projektu po dłuższym czasie pracy. Odpowiedzi na pytania o uprawnienia trafiają do właściwego katalogu sesji, co eliminuje błędy trasowania, które mogły wywołać chaos w złożonych procesach.

    Bezpieczniejsza edycja i lepsze wsparcie providerów

    Warto zwrócić uwagę na zmiany w mechanizmie edycji kodu. Operacje edycyjne odrzucają teraz luźne dopasowania — to zabezpieczenie przed przypadkowym nadpisaniem niewłaściwego pliku. Jeśli agent nie ma pewności, że trafił we właściwy fragment kodu, nie wykona zmiany.

    Jeśli chodzi o dostawców modeli, poza poprawką dla Bedrocka, OpenCode zyskał wsparcie dla Snowflake Cortex. To rozszerza gamę backendów dostępnych w korporacyjnych środowiskach. Ulepszono również generację schematów OpenAPI, co ułatwia integrację agenta z zewnętrznymi narzędziami przez API.

    Podsumowanie

    Wersja OpenCode z lepszą obsługą powłoki i stabilnością przestrzeni roboczych to zestaw precyzyjnych poprawek w miejscach, które były problematyczne. Responsywność powłoki, stabilność sesji i bezpieczeństwo edycji to kluczowe elementy codziennej pracy z agentem AI. Jeśli dotychczas irytowało cię zacinanie się terminala lub gubienie kontekstu w trakcie dłuższej sesji, ta aktualizacja powinna rozwiązać większość tych problemów.


    Źródła

  • Zed 1.0.1: łatka dla agenta AI usuwa błąd blokujący nanoszenie zmian w kodzie

    Zed 1.0.1: łatka dla agenta AI usuwa błąd blokujący nanoszenie zmian w kodzie

    Zespół Zed opublikował wersję 1.0.1, która usuwa błąd, przez który wbudowany agent AI czasami nie wprowadzał sugerowanych edycji. To pierwsza aktualizacja stabilizacyjna po debiucie wersji 1.0. Zmiana, choć niewielka, jest istotna dla użytkowników korzystających z asystentów kodowania w tym edytorze.

    Najważniejsze informacje

    • Zed 1.0.1 to stabilne wydanie skoncentrowane na niezawodności, bez nowych funkcji.
    • Główna poprawka dotyczy błędu, w którym agent AI nie nanosił edycji w niektórych scenariuszach (issue #55500).
    • Łatka eliminuje źródło frustracji przy vibe codingu i refaktoryzacji wspomaganej przez wbudowane modele.
    • Aktualizacja jest częścią szerszego cyklu poprawek agenta, obejmującego m.in. problemy ze strumieniowanymi edycjami, wysokim zużyciem CPU oraz problemami z systemem plików.

    Drobny patch, duży komfort pracy

    Poprawka 1.0.1 nie wprowadza nowych opcji ani zmian w interfejsie – to celowy krok po tym, jak Zed 1.0.1 został określony jako ważne wydanie, łączące bogactwo możliwości z dbałością o wydajność. Wydanie główne wprowadziło m.in. wątki w terminalu, historię gałęzi w panelu Gita oraz obsługę diagramów Mermaid w agencie, ale szybko okazało się, że najważniejsza jest niezawodność w codziennym użytkowaniu.

    Deweloperzy zgłaszali sytuacje, w których agent nie wprowadzał wygenerowanego fragmentu kodu. W pracy nad nowym kodem lub przy szybkim testowaniu pomysłów, takie sytuacje mogą być irytujące. Dlatego zespół skupił się na zgłoszeniu #55500 i wypuścił stabilną łatkę, która zapewnia, że edycje są wprowadzane do edytora.

    „Fixed an issue where the agent failed to apply edits in some cases” – krótki wpis w changelogu wskazuje na zakres zmian. Choć modyfikacja jest niewielka, dla programisty korzystającego z asystenta AI oznacza to brak wątpliwości, czy agent zadziała, czy trzeba będzie powtarzać polecenie.

    Stabilność nie kończy się na jednym ficie

    Stabilność nie kończy się na jednym ficie

    Wersja 1.0.1 nie jest jedynym przypadkiem – w kolejnych stabilnych wydaniach Zed regularnie naprawia podobne problemy z agentem. W notkach do nowszych wersji znajdują się poprawki dotyczące streamowania edycji zawierających znaki wielobajtowe, wysokiego użycia procesora przy wtyczce Zeta oraz awarii podczas pobierania agentów z rejestru ACP. To dowód na to, że po premierze 1.0.1 twórcy intensywnie monitorują działanie asystenta i eliminują wąskie gardła, które wpływają na płynność współpracy z AI.

    Dla użytkowników, którzy już zaktualizowali do 1.0.1, proces aktualizacji jest prosty. Wystarczy standardowa procedura pobrania najnowszej wersji na macOS, Windows lub Linux – nie są wymagane dodatkowe konfiguracje. Edytor utrzymuje dotychczasowy poziom wydajności, a łatka dotyka tylko krytycznej ścieżki odpowiedzialnej za nanoszenie zmian przez agenta.

    Znaczenie dla programistów i zespołów

    W pracy opartej na szybkich iteracjach – szczególnie przy prototypowaniu czy refaktoryzacji – każda przerwa w działaniu asystenta może rozpraszać i wydłużać czas realizacji zadania. Zed 1.0.1 sprawia, że agent AI staje się bardziej przewidywalny, a polecenia takie jak „dopisz obsługę błędu” czy „zamień pętlę na strumień” kończą się rzeczywistą modyfikacją kodu, a nie komunikatem o błędzie.

    Choć łatka dotyczy jednego konkretnego problemu, wysyła jasny sygnał: Zed nie zamierza spoczywać na laurach po wydaniu 1.0.1. Stabilność agenta to priorytet, zwłaszcza że edytor jest narzędziem dla tych, którzy chcą łączyć ręczne rzemiosło z automatyzacją. Wersja 1.0.1 pokazuje, że za ważnym wydaniem idzie równie istotne doskonalenie szczegółów.


    Źródła

  • Zarządzanie wtyczkami bez repozytorium – Cursor stawia na wewnętrzne marketplace’y dla zespołów

    Zarządzanie wtyczkami bez repozytorium – Cursor stawia na wewnętrzne marketplace’y dla zespołów

    Cursor wprowadził nowy mechanizm wewnętrznych marketplace’ów, który umożliwia administratorom tworzenie i dystrybucję firmowych wtyczek bez potrzeby korzystania z repozytorium kodu. Zespoły programistyczne mogą teraz centralizować dystrybucję narzędzi, reguł i umiejętności agentów AI, z elastycznymi zasadami instalacji – od domyślnego włączenia po obowiązkowe wdrożenie.

    Kluczowe informacje

    • Administratorzy mogą zarządzać marketplace’ami wtyczek wewnętrznie, z opcją działania poza repozytorium.
    • Wtyczki można instalować w trybie domyślnie włączonym, wyłączonym lub jako obowiązkowe dla całego zespołu.
    • Pakiet wtyczek zawiera serwery MCP, umiejętności, subagentów, reguły i hooki – nie tylko rozszerzenia interfejsu.
    • Aktualizacje są rozsyłane automatycznie.

    Bez repozytorium i na własnych zasadach

    W przeszłości każdy programista musiał osobno konfigurować swoje środowisko lub polegać na chaotycznym dzieleniu się plikami. Teraz administrator ma możliwość zdefiniowania marketplace w panelu Cursor, spakowania wtyczki i podjęcia decyzji o instalacji w całym zespole, bez ograniczeń związanych z repozytorium kodu. To znaczące ułatwienie, zwłaszcza dla firm, które wcześniej przechowywały wewnętrzne narzędzia w prywatnych forkach i zmagały się z ręczną konfiguracją.

    Administratorzy mogą oznaczyć wtyczkę jako „wymaganą” lub „opcjonalną”, a także ustalić, czy nowa wtyczka ma być domyślnie włączona, wyłączona, czy obowiązkowa. Dzięki temu szef działu DevOps może wdrożyć reguły przeglądu commitów, a kierownik web devu – umiejętności do automatycznego generowania komponentów Reacta.

    Co tak naprawdę zawiera wtyczka?

    Wtyczki w team marketplace to nie tylko dodatki do UI. Każda z nich to pakiet narzędzi agentowych: serwery MCP (Model Context Protocol), umiejętności, subagenci, reguły i hooki. Oznacza to, że jedna wtyczka może zmieniać sposób, w jaki asystent AI działa w codziennej pracy – od wywoływania endpointów API, przez formatowanie pull requestów, aż po automatyczne testy.

    Na przykład zespół webowy może stworzyć wtyczkę z szablonem subagenta do analizy zgłoszeń błędów, a zespół DevOps pakuje umiejętności do inspekcji konfiguracji Dockera i publikuje je w marketplace. Po jednym kliknięciu każdy programista w organizacji zyskuje ten sam zestaw narzędzi, eliminując potrzebę wielu niezależnych konfiguracji.

    Jak to wygląda w praktyce – domyślnie włączone, wyłączone albo obowiązkowe

    Jak to wygląda w praktyce – domyślnie włączone, wyłączone albo obowiązkowe

    Domyślne zachowanie można ustawiać w locie. Jeśli wtyczka dostarcza podstawowe lintery i reguły formatowania, administrator ustawia ją jako domyślnie włączoną – każdy nowy członek zespołu korzysta z niej od razu. W przypadku wtyczki służącej do eksperymentalnej analizy danych, jest ona domyślnie wyłączona – chętni mogą ją włączyć samodzielnie. Obowiązkowe wdrożenie dotyczy polityk bezpieczeństwa lub krytycznych zasad przeglądu kodu.

    Dzięki temu Cursor ułatwia skalowanie praktyk zespołowych. Nie ma potrzeby krążenia z prezentacjami i proszenia: „zainstalujcie tę nową regułę”. Nowa wersja wtyczki trafia do marketplace’u, a agent AI wszystkich członków zespołu zaczyna działać według zaktualizowanych zasad.

    AI w zespole bez indywidualnej konfiguracji

    AI w zespole bez indywidualnej konfiguracji

    W kontekście web developmentu, rosnącej liczby autonomicznych agentów AI, Cursor staje się środowiskiem, w którym agent samodzielnie pisze, testuje i modyfikuje kod. Dzięki wewnętrznym marketplace’om organizacja może szybko wprowadzać agentowe zachowania – od automatycznego wdrażania gałęzi testowych, przez podpowiadanie architektury, aż po generowanie raportów błędów.

    Znikają tarcia między indywidualną kreatywnością a zespołowym standardem. Każdy programista ma swoje skróty i preferencje, ale wspólna warstwa narzędzi jest identyczna. Jeśli szefostwo uzna, że nowy hook do audytu jest obowiązkowy, aktualizuje marketplace, a następnego dnia wszyscy go mają – bez potrzeby grzebania w plikach konfiguracyjnych.

    Limity i drobne zgrzyty

    Nie wszystko działa idealnie. Dostępność konkretnych limitów i zakresów wsparcia może różnić się w zależności od wybranego planu. Szczegóły dotyczące integracji z zewnętrznymi platformami nie zostały jeszcze w pełni opisane przez producenta – w oficjalnych materiałach nie potwierdzono ograniczenia wyłącznie do GitHuba. Mimo to zmiana jest zauważalna. Dla zespołów regularnie pracujących z agentami AI, nowy marketplace w Cursor to szansa na uporządkowanie narzędzi i przyspieszenie onboardingu. Zamiast rozproszonych skryptów, organizacja zyskuje jeden centralny hub, który integruje środowisko pracy.


    Źródła

  • Factory 0.115.0 wprowadza natywną obsługę PDF i ulepszenia CLI dla programistów

    Factory 0.115.0 wprowadza natywną obsługę PDF i ulepszenia CLI dla programistów

    Factory wydało wersję 0.115.0 swojej platformy deweloperskiej, a kluczową nowością jest natywna obsługa plików PDF przez model Gemini 3.1 Pro. Aktualizacja, dostępna od 5 czerwca 2026 roku, wprowadza także wsparcie dla zaawansowanego wnioskowania w GLM-5.1 oraz szereg poprawek stabilności, które będą przydatne dla osób pracujących z długimi sesjami agentowymi.

    Co nowego w Factory 0.115.0

    • Natywna obsługa PDF w Gemini 3.1 Pro — model może teraz bezpośrednio analizować dokumenty, specyfikacje i raporty bez wcześniejszego przetwarzania.
    • Wsparcie dla wnioskowania w GLM-5.1 otwiera nowe możliwości w złożonych zadaniach analitycznych.
    • Masowe przeciąganie obrazów w CLI przyspiesza pracę z multimodalami — szczególnie przydatne przy debugowaniu UI i analizie zrzutów ekranu.
    • Bezpośrednie przesyłanie PDF w aplikacji eliminuje tarcie między dokumentacją a workflow.
    • Ulepszona synchronizacja w chmurze i odporność sesji na przerwania sprawiają, że długie zadania agentowe nie gubią stanu.

    Gemini 3.1 Pro z natywnym PDF

    Google określa Gemini 3.1 Pro jako swój najbardziej zaawansowany model wnioskujący, zdolny do pracy z tekstem, dźwiękiem, obrazami, wideo i PDF-ami. Model oferuje okno kontekstowe o wielkości miliona tokenów na wejściu i 64 tysiące na wyjściu, co pozwala na przetwarzanie bardzo obszernych dokumentów technicznych w całości.

    Dla zespołów programistycznych oznacza to koniec z koniecznością konwersji dokumentów. Dokumentacja projektowa, logi serwerowe, specyfikacje API czy raporty z testów mogą trafiać prosto do modelu, bez potrzeby ręcznego wycinania fragmentów. Factory integruje tę funkcję na dwa sposoby: przez przeciągnięcie pliku w interfejsie aplikacji oraz przez bezpośrednie odwołanie w CLI.

    Gemini 3.1 Pro osiągnął wynik 77,1% w teście ARC-AGI-2, co Google opisuje jako ponad dwukrotnie lepszy rezultat od poprzednika. W praktyce przekłada się to na skuteczniejsze rozumienie złożonych instrukcji i lepsze radzenie sobie z wieloetapowymi zadaniami.

    GLM-5.1 i wnioskowanie krok po kroku

    Oprócz Gemini, Factory dodało także wsparcie dla modelu GLM-5.1 z funkcją rozumowania. Choć GLM nie jest tak szeroko omawiany jak modele Google'a, jego obecność w ekosystemie Factory pokazuje, że platforma stawia na różnorodność silników AI.

    Wnioskowanie krok po kroku przydaje się szczególnie przy analizie błędów, refaktoryzacji czy zadaniach wymagających logicznego wyprowadzenia rozwiązania. Model potrafi przeprowadzić użytkownika przez swój proces myślowy, co ułatwia weryfikację poprawności odpowiedzi.

    CLI i stabilność

    Factory nie zapomniało o jakości życia programistów. Masowe przeciąganie obrazów w CLI to drobiazg, ale przy pracy ze zrzutami ekranu czy mockupami interfejsów oszczędza czas. Wystarczy zaznaczyć kilka plików w eksploratorze i puścić je w terminal — resztę ogarnia Droid.

    Wprowadzono także poprawki renderowania terminala i niezawodności uwierzytelniania. Ulepszona synchronizacja w chmurze i możliwość wznowienia pracy od miejsca przerwania są istotne dla programistów, którzy doświadczyli utraty sesji w trakcie debugowania.

    Co to oznacza dla zespołów deweloperskich

    Natywna obsługa PDF-ów zmienia sposób, w jaki można integrować dokumentację z procesem developmentu. Zamiast trzymać specyfikacje w osobnym oknie i ręcznie przepisywać wymagania, wystarczy wrzucić plik do Factory i pozwolić modelowi działać. Dla zespołów pracujących w metodykach zwinnych, gdzie dokumentacja szybko się zmienia, to oszczędność czasu i mniejsze ryzyko przeoczeń.

    Wersja 0.115.0 to solidny krok naprzód w użyteczności. Factory łączy moc nowych modeli AI z przemyślanymi usprawnieniami workflow, co sprawia, że platforma pozostaje konkurencyjna na rynku narzędzi do AI-assisted development.


    Źródła

  • Codex 0.128.0: Praca nad kodem nie kończy się po zamknięciu terminala

    Codex 0.128.0: Praca nad kodem nie kończy się po zamknięciu terminala

    Wydanie OpenAI Codex 0.128.0 przesuwa fokus z krótkich interakcji na długotrwałe, autonomiczne zadania programistyczne. Nowe mechanizmy zarządzania celami, rozszerzona kontrola uprawnień oraz usprawniony system wtyczek sprawiają, że asystent staje się środowiskiem pracy, które może kontynuować implementację nawet w nieobecności programisty. To nie tylko kosmetyczna zmiana, ale istotny krok w kierunku traktowania Codexa jako agenta zdolnego do długich sesji, a nie tylko interaktywnego edytora.

    Kluczowe fakty o wydaniu

    • Trwałe cele /goal – cel zdefiniowany przez użytkownika jest przechowywany między sesjami; Codex potrafi wznowić pracę i raportować postępy samodzielnie.
    • Rozszerzone profile uprawnień – precyzyjniejsza kontrola nad tym, co agent może robić bez pytania, co jest kluczowe w środowiskach produkcyjnych i DevOps.
    • Usprawniony ekosystem wtyczek – instalacja z marketplace oraz zdalne cache'owanie paczek przyspieszają konfigurację i ponowne użycie narzędzi.
    • Jawna konfiguracja MultiAgentV2 – lepsze sterowanie podziałem zadań między agentami i ich współpracą w długich przepływach pracy.
    • Poprawki stabilności – rozwiązano błędy w terminalu (TUI), zachowaniu sieci i Windows Sandbox, co docenią zespoły pracujące zdalnie i w kontenerach.

    Cele, które nie znikają po zamknięciu terminala

    Nowością w tej wersji jest mechanizm trwałego celu. Wcześniej komendy w Codexie działały jak pojedyncze polecenia: wydawałeś komendę, otrzymywałeś wynik, a kontekst znikał. W wersji 0.128.0 komenda /goal jest podłączona do API serwera aplikacji, narzędzi modelowych i kontrolek TUI. Cel zostaje zapisany, a agent może do niego wracać, kontynuować pracę i raportować postępy nawet po przerwach – bez potrzeby ponownego tłumaczenia całego zadania.

    Oznacza to, że programista może zlecić złożone zadanie (np. „zrefaktoryzuj moduł płatności i dodaj testy integracyjne”), zamknąć terminal i wrócić po pewnym czasie. Codex nie zacznie od nowa – zapamięta, na czym stanął, i będzie w stanie kontynuować pracę. To znaczący krok w kierunku agent workspace, gdzie narzędzie nie tylko edytuje pliki, ale także zarządza długofalowymi zadaniami inżynieryjnymi. Dla praktyków vibe codingu i szybkiego prototypowania ciągłość myśli nie zależy już od obecności człowieka przed ekranem.

    Bezpieczeństwo i kontrola: profile uprawnień wchodzą na wyższy poziom

    Bezpieczeństwo i kontrola: profile uprawnień wchodzą na wyższy poziom

    Wraz z autonomią rośnie znaczenie bezpieczeństwa. Codex 0.128.0 wprowadza rozbudowane profile uprawnień, które pozwalają precyzyjnie określić, które akcje agent może wykonywać bez pytania o zgodę – od operacji na plikach po wywołania sieciowe. Ma to szczególne znaczenie w środowiskach CI/CD, gdzie agent może automatycznie budować i testować kod, ale nie powinien bez nadzoru modyfikować krytycznych plików konfiguracyjnych lub zmiennych środowiskowych. Profile można dostosować do konkretnego repozytorium, a ich działanie obejmuje także kontekst sesji długotrwałych, co minimalizuje ryzyko nieautoryzowanego uruchomienia złośliwego kodu w tle.

    Wtyczki, które instalujesz raz i używasz wszędzie

    Kolejnym istotnym usprawnieniem jest nowy przepływ pracy z wtyczkami. Codex 0.128.0


    Źródła

  • Codex 0.128.0 wprowadza trwałe workflow i daje agentom pamięć, której do tej pory brakowało

    Codex 0.128.0 wprowadza trwałe workflow i daje agentom pamięć, której do tej pory brakowało

    OpenAI wprowadziło aktualizację Codex 0.128.0, która wprowadza istotne zmiany w sposobie, w jaki agenci radzą sobie z długotrwałymi zadaniami. Najważniejszą nowością jest trwałe zarządzanie kontekstem, które umożliwia agentowi tworzenie, wstrzymywanie i wznawianie zadań. Dodatkowo, aktualizacja oferuje szersze możliwości kontroli dostępu, usprawnione zarządzanie wtyczkami oraz lepszą orkiestrację wielu agentów. Wprowadzone zmiany obejmują również nowe kontrolki w interfejsie terminalowym oraz poprawki stabilności.

    Co nowego w aktualizacji Codex 0.128.0 — najważniejsze fakty

    • Trwałe stany zadań — agent może wracać do wcześniej zdefiniowanych celów i kontynuować pracę po przerwie, korzystając z zapamiętanego kontekstu.
    • Większe możliwości kontroli uprawnień — więcej opcji określania, do czego agent ma dostęp w środowisku deweloperskim.
    • Usprawnione wtyczki — lepsza jakość integracji i obsługi wtyczek.
    • Udoskonalona praca z wieloma agentami — płynniejsza współpraca i konfiguracja agentów w złożonych workflow.
    • Poprawki stabilności Windows — zwiększona niezawodność sandboksa i przewidywalność działania.

    Zarządzanie kontekstem — agent pamięta, nad czym pracuje

    Dotychczas praca z agentem przypominała rozmowę z kimś, kto po każdym „dziękuję” zapomina, o czym była mowa. Aktualizacja wprowadza mechanizmy trwałego kontekstu, dzięki którym agent zachowuje świadomość celu między sesjami. Można przerwać pracę, sprawdzić status i wrócić do zadania bez potrzeby tłumaczenia wszystkiego od nowa.

    Technicznie chodzi o ponowne wykorzystywanie wątków, kompresję konwersacji i planowanie długich zadań. Kontekst nie jest już tylko jednorazowym promptem — agent może odtwarzać stan i kontynuować złożone zadania. Dla osób pracujących nad wieloetapowym refaktoringiem lub projektem UI rozłożonym na kilka sesji, to znacząca zmiana.

    Co ważne, kontekst potrafi przetrwać przełączanie między wątkami. Agent nie gubi wątku, gdy przechodzimy z jednego obszaru pracy do drugiego. To krok w stronę modelu, w którym agent działa jako operator stanowy, a nie bezmyślny wykonawca jednorazowych poleceń.

    Więcej kontroli, mniej niespodzianek — uprawnienia i wtyczki

    Rozszerzone możliwości kontroli uprawnień odpowiadają na realny problem: jak dać agentowi swobodę działania, nie otwierając wszystkich drzwi. Aktualizacja pozwala lepiej określić, do czego agent ma dostęp, co jest istotne dla zespołów DevOps i hostingowych, które chcą bezpieczniej korzystać z Codex 0.128.0 w środowiskach produkcyjnych.

    Zarządzanie wtyczkami również zostało poprawione. Lepsza obsługa wtyczek oznacza mniej błędów przy instalacji i stabilniejsze działanie rozszerzeń. Dla web developerów korzystających z Codex 0.128.0 jako asystenta przy kodzie frontendu czy backendu to oznacza mniej frustracji przy konfiguracji środowiska.

    Orkiestracja wielu agentów i TUI — wszystko pod kontrolą

    Współpraca agentów w jednym workflow doczekała się usprawnień, które ułatwiają zarządzanie ich rolami. Chodzi o to, aby agenty nie wchodziły sobie w drogę, a konfiguracja była bardziej przewidywalna. Dla osób eksperymentujących z vibe codingiem i uruchamiających kilka agentów równolegle, to różnica między chaosem a sensowną orkiestracją.

    Interfejs terminalowy także został ulepszony. Nowe kontrolki TUI ułatwiają zarządzanie długotrwałymi zadaniami — łatwiej sprawdzić status, wznowić przerwane zadanie czy wyczyścić niepotrzebny stan.

    Windows i stabilność — mniej awarii, więcej przewidywalności

    Aktualizacja eliminuje kilka irytujących błędów. Na Windowsie zwiększono stabilność sandboksa i poprawiono niezawodność dostawców modeli, co przekłada się na mniej przerw w pracy. Dla użytkowników tego systemu to odczuwalna zmiana w codziennym korzystaniu z narzędzia.

    Kontekst ma znaczenie — dlaczego to istotne dla web devu i AI

    Dla osób pracujących z kodem na co dzień ta aktualizacja niesie konkretną wartość. Trwałe zarządzanie kontekstem sprawdza się przy zadaniach, które nie kończą się na jednej sesji — refaktoringu, budowaniu komponentów, testowaniu. Agent, który pamięta cele, to mniej czasu na odtwarzanie stanu i więcej na faktyczną pracę.

    Z perspektywy rozwoju AI widać wyraźny kierunek: agenty przestają być narzędziami jednorazowych promptów i stają się operatorami zdolnymi do długoterminowej współpracy. Ta aktualizacja to kolejny krok w tę stronę.


    Źródła

  • Zed 1.0: Kamień milowy dla edytora kodu – oto nowości, które zmienią Twoją pracę

    Zed 1.0: Kamień milowy dla edytora kodu – oto nowości, które zmienią Twoją pracę

    Po ponad tysiącu wersji i kilku latach intensywnego rozwoju, Zed – ultraszybki edytor kodu napisany w języku Rust – oficjalnie doczekał się stabilnej wersji 1.0. Projekt, stworzony przez Nathana Sobo, jednego z twórców Atom, osiągnął poziom dojrzałości, który pozwala określić go jako „kompletny edytor kodu”. Wydanie to oznacza nie tylko zakończenie pewnego etapu, ale także wprowadzenie wielu funkcji, które znacznie poprawiają komfort pracy programistów na systemach macOS, Windows i Linux.

    Najważniejsze informacje

    • Zed 1.0 to pierwsza stabilna wersja edytora, po ponad 1000 wydaniach przedpremierowych.
    • Nowe funkcje obejmują trwałe zakładki, ulepszone dopasowywanie rozmyte, wsparcie dla modeli AI (w tym Zeta LLM) oraz animacje GIF w podglądzie Markdown.
    • Zed 1.0 od początku pisany jest w Rust, co zapewnia szybkie działanie na wszystkich trzech głównych platformach.
    • Edytor stawia na współpracę z AI, integrując modele językowe jako asystentów kodowania.
    • Git zyskał rozbudowane narzędzia, a stabilność została poprawiona dzięki setkom poprawek błędów.

    Od tysiąca wersji do 1.0 – droga do dojrzałości

    Zed 1.0 rozpoczął życie jako eksperyment mający połączyć wydajność Rust z nowoczesnym podejściem do edycji kodu. Przez kilka lat zespół Zed Industries wprowadzał kolejne aktualizacje co tydzień, poprawiając silnik graficzny, parser drzewa składniowego oraz mechanizmy współpracy. Po przekroczeniu tysiąca edycji, twórcy uznali, że edytor spełnia obietnicę „kompletności”. Stabilna wersja 1.0 to sygnał, że środowisko jest wystarczająco dojrzałe i stabilne, aby można je było bez obaw wykorzystywać w codziennej pracy produkcyjnej.

    Nowości, które robią różnicę

    Najnowsze wydanie przynosi kilka funkcji, o które społeczność prosiła od dawna. Trwałe zakładki zapamiętują pozycję w kodzie między sesjami, co jest przydatne dla osób pracujących z dużymi bazami kodu. Dopasowywanie rozmyte zostało usprawnione, co przyspiesza przeskakiwanie między plikami i uzupełnianie ścieżek. W obszarze AI poprawiono wsparcie dla modeli językowych – Zed 1.0 współpracuje teraz z własnym modelem Zeta LLM oraz zewnętrznymi dostawcami, oferując kontekstowe sugestie i asystę. Podgląd Markdown obsługuje teraz animowane obrazy GIF, co ułatwia dokumentowanie projektów i notatki. Przeprojektowane narzędzia Git oferują wygodniejszy widok diffów i usprawnienia w zarządzaniu gałęziami, co przyspiesza przeglądanie repozytoriów.

    Zed 1.0 a konkurencja – szybkość i współpraca

    W przeciwieństwie do wielu edytorów, Zed 1.0 nie korzysta z silnika Electron, lecz z własnej, natywnej warstwy interfejsu stworzonej w Rust. Dzięki temu uruchamia się bardzo szybko, a przewijanie i operacje na tekście pozostają płynne nawet przy dużych plikach. Duży nacisk kładziono na współpracę: edytor umożliwia jednoczesną pracę wielu osób nad tym samym projektem, z opcją udostępniania kanałów terminala i edytora. Integracja z modelami AI, w tym zewnętrznymi dostawcami i własnym Zeta LLM, pozwala na kontekstowe podpowiedzi, refaktoryzację czy generowanie kodu bez opuszczania edytora, co sprawia, że praca staje się bardziej zintegrowana.

    Stabilność na trzech platformach i setki poprawek

    Wydanie 1.0 to także ogromny wysiłek związany z usuwaniem błędów. Wprowadzono liczne poprawki stabilności, obejmujące m.in. renderowanie diagnostyki, kompatybilność z różnymi środowiskami graficznymi oraz integrację z Language Server Protocol. Zespół zadbał o spójne działanie narzędzi AI z różnymi dostawcami. Dzięki tym działaniom Zed 1.0 na macOS, Windows i Linux działa przewidywalnie, a inżynierowie pracujący w różnych środowiskach mogą liczyć na identyczne doświadczenia wszędzie tam, gdzie go zainstalują.

    Przejście do wersji 1.0 to nie tylko formalność – to zachęta dla programistów, którzy czekali na oznakę dojrzałości, by dać Zedowi 1.0 szansę. Szybkość, natywne wsparcie dla AI i nowe narzędzia Git sprawiają, że edytor ten może poważnie zagrozić dominacji VS Code, zwłaszcza wśród osób ceniących lekkość i współpracę w czasie rzeczywistym.


    Źródła

  • Claude Code 2.1.123: Mikropoprawka, która ratuje zespoły przed pętlą OAuth

    Claude Code 2.1.123: Mikropoprawka, która ratuje zespoły przed pętlą OAuth

    Anthropic wydało wersję 2.1.123 Claude Code, która jest małym hotfixem, ale kluczowym dla funkcjonowania w środowiskach korporacyjnych i kontenerowych. Problem dotyczył mechanizmu OAuth, który, gdy funkcje eksperymentalne były wyłączone, wpadał w nieskończoną pętlę ponawiania żądań z kodem 401, co uniemożliwiało dostęp do agenta. Poprawka została wprowadzona dzień po wydaniu wersji 2.1.122 i dwa dni przed wersją 2.1.126, co pokazuje, że Anthropic traktuje ten błąd poważnie.

    Kluczowe fakty o aktualizacji

    • Claude Code 2.1.123 to hotfix eliminujący pętlę 401 w mechanizmie OAuth.
    • Zmienna CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1 w środowiskach z restrykcyjnymi politykami bezpieczeństwa wywoływała regresję uniemożliwiającą uwierzytelnienie.
    • OAuth zamiast zgłosić błąd, w kółko ponawiał żądania, blokując terminal i workflow programisty.
    • Równoległa łatka dotyczyła wycieku poświadczeń OAuth użytkownika do niestandardowej bramy API zamiast dedykowanego tokena bramy.
    • Kontekst wydania: hotfix został wydany pomiędzy wersją 2.1.122 (18 poprawek) a 2.1.126 (33 poprawki) — Anthropic pominęło numery 2.1.124 i 2.1.125, co sugeruje wewnętrzne kompilacje testowe.

    Dlaczego to nie jest błahy problem

    Dla programisty pracującego samodzielnie z kluczem API ta poprawka może wydawać się nieistotna. Jednak w zespołach, które standaryzują konfigurację przez zmienne środowiskowe — zwłaszcza w kontenerach Dockera, na maszynach deweloperskich zarządzanych przez IT lub w pipeline'ach CI/CD — CLAUDE_CODE_DISABLE_EXPERIMENTAL_BETAS=1 jest wymogiem polityki bezpieczeństwa. Organizacje wyłączają funkcje beta, aby uniknąć wprowadzenia niestabilnych modułów do produkcji. Te organizacje doświadczyły regresji: po aktualizacji do wersji 2.1.122 ich agenci Claude Code przestali się logować.

    Pętla 401 w OAuth jest problematyczna, ponieważ nie daje użytkownikowi żadnej wskazówki. Terminal pokazuje kolejne nieudane próby autoryzacji, a jedynym rozwiązaniem jest ręczne wyłączenie zmiennej — co może naruszać zasady firmy. W sytuacji, gdy programista uruchamia agenta o 8:00, a o 8:02 wciąż widzi wirujący wskaźnik logowania, frustracja rośnie.

    Szerszy obraz: OAuth jako kierunek strategiczny

    Szerszy obraz: OAuth jako kierunek strategiczny

    Ta poprawka wpisuje się w szerszy trend: Anthropic coraz bardziej stawia na OAuth zamiast kluczy API. OAuth umożliwia centralne zarządzanie dostępem, rotację tokenów i audyt, co jest trudne do osiągnięcia z rozrzuconymi kluczami. W tym samym changelogu pojawiła się również poprawka dla bram API: wcześniej niestandardowy gateway mógł otrzymać poświadczenia OAuth użytkownika zamiast własnego tokena, co stanowiło poważny problem bezpieczeństwa.

    Analizując całą serię wydań między 2.1.121 a 2.1.126, widać, że Anthropic traktuje Claude Code jako dojrzały produkt dla przedsiębiorstw, a nie eksperymentalne narzędzie dla entuzjastów. Wersja 2.1.126 zawiera 33 poprawki, w tym osobny mechanizm fallbacku OAuth dla sesji SSH, WSL2 i kontenerów, co świadczy o operacyjnym utwardzaniu narzędzia.

    Co to mówi o cyklu wydawniczym Anthropic

    Anthropic wprowadza aktualizacje niemal codziennie, a czasem nawet częściej. Między 2.1.121 a 2.1.126 minęły cztery dni, a w tym czasie ukazały się cztery wydania (z pominięciem dwóch numerów). Pojedynczy hotfix, taki jak ten w 2.1.123, otrzymuje własny numer wersji i trafia do użytkowników natychmiast, bez czekania na kumulację poprawek. To podejście "ship fast, fix faster" sprawdza się w narzędziach, gdzie przestój oznacza realne straty produktywności.

    Dla użytkowników końcowych oznacza to, że warto śledzić changelog — nie tylko dla nowych funkcji, ale także dla takich mikropoprawek. Jeśli zespół korzysta z OAuth i ma ustawioną blokadę funkcji beta, pominięcie 2.1.123 mogło oznaczać cały dzień bez dostępu do agenta. Alternatywnie, ręczne odblokowanie bet może wymagać zgody przełożonego i zmiany w zarządzanej konfiguracji.


    Źródła

  • Claude Code 2.1.122: konfigurowalne poziomy usług Bedrock i inteligentniejsze wznawianie sesji

    Claude Code 2.1.122: konfigurowalne poziomy usług Bedrock i inteligentniejsze wznawianie sesji

    Anthropic wprowadziło aktualizację Claude Code 2.1.122, która dodaje zmienną środowiskową ANTHROPIC_BEDROCK_SERVICE_TIER do konfiguracji poziomów usług AWS Bedrock oraz poprawia mechanizm wznawiania sesji przez adresy URL pull requestów. To wydanie jest skierowane głównie do zespołów DevOps i deweloperów pracujących w regulowanych środowiskach, gdzie kontrola nad infrastrukturą jest kluczowa.

    Kluczowe zmiany w skrócie

    • ANTHROPIC_BEDROCK_SERVICE_TIER umożliwia wybór między default, flex a priority bez potrzeby modyfikacji kodu aplikacji.
    • Wznawianie sesji przez PR URL ułatwia odzyskiwanie kontekstu w długotrwałych zadaniach i przerywanych sesjach terminalowych.
    • Usprawnione logowanie OpenTelemetry zwiększa transparentność w agentowych workflow.
    • Poprawki stabilności obejmują m.in. fork branchy, resize obrazów i zachowanie powłoki terminala.

    Bedrock zyskuje warstwy usług – co to znaczy w praktyce

    Nowa zmienna ANTHROPIC_BEDROCK_SERVICE_TIER odpowiada na potrzeby zespołów korzystających z Claude'a przez AWS Bedrock. Wysłana jako nagłówek X-Amzn-Bedrock-Service-Tier, przyjmuje trzy wartości: default, flex oraz priority.

    Dzięki temu można dostosować zachowanie modelu na poziomie żądania – wybierając niższy priorytet dla zadań wsadowych lub wyższy dla interaktywnych sesji deweloperskich, gdzie opóźnienie jest szczególnie odczuwalne. Nie ma potrzeby zmiany kodu ani architektury – wystarczy ustawić zmienną środowiskową.

    Claude Code 2.1.122 został udostępniony w Bedrock z kontekstem 200 000 tokenów (około 150 000 słów, czyli ponad 500 stron tekstu), a integracja była od początku pozycjonowana jako rozwiązanie do budowy aplikacji gotowych do użycia w przedsiębiorstwie. Teraz zyskujesz dodatkową dźwignię operacyjną – idealną w środowiskach wielokontowych, gdzie różne zespoły mają różne wymagania dotyczące throughputu i kosztów.

    Wznawianie sesji przez PR – koniec zgadywania

    Wznawianie sesji przez PR – koniec zgadywania

    Każdy, kto spędził godziny na debugowaniu w terminalu, zna ten moment paniki: sesja się rozłącza, prompt znika, a Claude nagle nie pamięta, nad czym pracowałeś. Wydanie 2.1.122 rozwiązuje ten problem, umożliwiając znajdowanie sesji po adresie URL pull requesta.

    Mechanizm jest prosty, ale skuteczny. Jeśli prowadzisz długą sesję programistyczną powiązaną z konkretnym PR-em, możesz ją teraz łatwo odzyskać. To szczególnie istotne w scenariuszach, gdzie utrata kontekstu może znacznie obniżyć produktywność.

    Logowanie OpenTelemetry i poprawki infrastrukturalne

    Logowanie OpenTelemetry i poprawki infrastrukturalne

    Obserwowalność jest obecnie wymogiem. Rozszerzone logowanie OpenTelemetry w tej wersji daje lepszy wgląd w to, co robią agenci Claude'a – od wywołań narzędzi po decyzje klasyfikatora trybu auto.

    Dodatkowo Anthropic poprawiło kilka irytujących błędów. Udoskonalone zostało zachowanie przy fork branchy, gdzie wcześniej mogło dochodzić do niespójności. Naprawiono również resize obrazów w kontekście przetwarzania przez model oraz ujednolicono działanie powłoki terminala, co doceni każdy, kto miał problemy z różnymi emulatorami.

    Co to znaczy dla deweloperów

    Aktualizacja 2.1.122 nie wprowadza rewolucyjnych zmian, co jest pozytywne. To solidny zestaw ulepszeń, które eliminują problemy, z którymi deweloperzy borykali się od tygodni. Konfigurowalne poziomy Bedrock to korzyść dla zespołów dbających o koszty w AWS. Wznawianie sesji przez PR to z kolei udogodnienie dla tych, którzy pracują z Claude'em przez dłuższy czas i nie mogą sobie pozwolić na utratę kontekstu.

    Takie aktualizacje często są niedoceniane w świecie AI, gdzie uwaga skupia się na spektakularnych nowościach. Jednak to właśnie drobne poprawki w logowaniu, powłoce terminala i obsłudze nagłówków tworzą narzędzie, na którym można polegać w produkcji.

    Szczegóły techniczne i pełną listę zmian można znaleźć w oficjalnym changelogu Claude Code.


    Źródła