Tag: Zarządzanie zadaniami

  • Codex 0.128.0 wprowadza trwałe workflow i daje agentom pamięć, której do tej pory brakowało

    Codex 0.128.0 wprowadza trwałe workflow i daje agentom pamięć, której do tej pory brakowało

    OpenAI wprowadziło aktualizację Codex 0.128.0, która wprowadza istotne zmiany w sposobie, w jaki agenci radzą sobie z długotrwałymi zadaniami. Najważniejszą nowością jest trwałe zarządzanie kontekstem, które umożliwia agentowi tworzenie, wstrzymywanie i wznawianie zadań. Dodatkowo, aktualizacja oferuje szersze możliwości kontroli dostępu, usprawnione zarządzanie wtyczkami oraz lepszą orkiestrację wielu agentów. Wprowadzone zmiany obejmują również nowe kontrolki w interfejsie terminalowym oraz poprawki stabilności.

    Co nowego w aktualizacji Codex 0.128.0 — najważniejsze fakty

    • Trwałe stany zadań — agent może wracać do wcześniej zdefiniowanych celów i kontynuować pracę po przerwie, korzystając z zapamiętanego kontekstu.
    • Większe możliwości kontroli uprawnień — więcej opcji określania, do czego agent ma dostęp w środowisku deweloperskim.
    • Usprawnione wtyczki — lepsza jakość integracji i obsługi wtyczek.
    • Udoskonalona praca z wieloma agentami — płynniejsza współpraca i konfiguracja agentów w złożonych workflow.
    • Poprawki stabilności Windows — zwiększona niezawodność sandboksa i przewidywalność działania.

    Zarządzanie kontekstem — agent pamięta, nad czym pracuje

    Dotychczas praca z agentem przypominała rozmowę z kimś, kto po każdym „dziękuję” zapomina, o czym była mowa. Aktualizacja wprowadza mechanizmy trwałego kontekstu, dzięki którym agent zachowuje świadomość celu między sesjami. Można przerwać pracę, sprawdzić status i wrócić do zadania bez potrzeby tłumaczenia wszystkiego od nowa.

    Technicznie chodzi o ponowne wykorzystywanie wątków, kompresję konwersacji i planowanie długich zadań. Kontekst nie jest już tylko jednorazowym promptem — agent może odtwarzać stan i kontynuować złożone zadania. Dla osób pracujących nad wieloetapowym refaktoringiem lub projektem UI rozłożonym na kilka sesji, to znacząca zmiana.

    Co ważne, kontekst potrafi przetrwać przełączanie między wątkami. Agent nie gubi wątku, gdy przechodzimy z jednego obszaru pracy do drugiego. To krok w stronę modelu, w którym agent działa jako operator stanowy, a nie bezmyślny wykonawca jednorazowych poleceń.

    Więcej kontroli, mniej niespodzianek — uprawnienia i wtyczki

    Rozszerzone możliwości kontroli uprawnień odpowiadają na realny problem: jak dać agentowi swobodę działania, nie otwierając wszystkich drzwi. Aktualizacja pozwala lepiej określić, do czego agent ma dostęp, co jest istotne dla zespołów DevOps i hostingowych, które chcą bezpieczniej korzystać z Codex 0.128.0 w środowiskach produkcyjnych.

    Zarządzanie wtyczkami również zostało poprawione. Lepsza obsługa wtyczek oznacza mniej błędów przy instalacji i stabilniejsze działanie rozszerzeń. Dla web developerów korzystających z Codex 0.128.0 jako asystenta przy kodzie frontendu czy backendu to oznacza mniej frustracji przy konfiguracji środowiska.

    Orkiestracja wielu agentów i TUI — wszystko pod kontrolą

    Współpraca agentów w jednym workflow doczekała się usprawnień, które ułatwiają zarządzanie ich rolami. Chodzi o to, aby agenty nie wchodziły sobie w drogę, a konfiguracja była bardziej przewidywalna. Dla osób eksperymentujących z vibe codingiem i uruchamiających kilka agentów równolegle, to różnica między chaosem a sensowną orkiestracją.

    Interfejs terminalowy także został ulepszony. Nowe kontrolki TUI ułatwiają zarządzanie długotrwałymi zadaniami — łatwiej sprawdzić status, wznowić przerwane zadanie czy wyczyścić niepotrzebny stan.

    Windows i stabilność — mniej awarii, więcej przewidywalności

    Aktualizacja eliminuje kilka irytujących błędów. Na Windowsie zwiększono stabilność sandboksa i poprawiono niezawodność dostawców modeli, co przekłada się na mniej przerw w pracy. Dla użytkowników tego systemu to odczuwalna zmiana w codziennym korzystaniu z narzędzia.

    Kontekst ma znaczenie — dlaczego to istotne dla web devu i AI

    Dla osób pracujących z kodem na co dzień ta aktualizacja niesie konkretną wartość. Trwałe zarządzanie kontekstem sprawdza się przy zadaniach, które nie kończą się na jednej sesji — refaktoringu, budowaniu komponentów, testowaniu. Agent, który pamięta cele, to mniej czasu na odtwarzanie stanu i więcej na faktyczną pracę.

    Z perspektywy rozwoju AI widać wyraźny kierunek: agenty przestają być narzędziami jednorazowych promptów i stają się operatorami zdolnymi do długoterminowej współpracy. Ta aktualizacja to kolejny krok w tę stronę.


    Źródła

  • Claude Code wprowadza własną komendę /goal — długoterminowe zarządzanie zadaniami dla AI

    Claude Code wprowadza własną komendę /goal — długoterminowe zarządzanie zadaniami dla AI

    Anthropic wprowadził nową komendę /goal dla Claude Code, która umożliwia AI zarządzanie długoterminowymi celami i autonomiczne wykonywanie zadań do momentu ich zakończenia zgodnie z określonymi kryteriami. Funkcja ta jest dostępna od wersji 2.1.139 i stanowi alternatywę dla podobnych rozwiązań w Claude Code, koncentrując się na bardziej złożonym zarządzaniu oraz audytach realizacji. Komenda pozwala na tworzenie zadań, które Claude będzie realizował w sposób ciągły, przerywając jedynie na prośbę użytkownika lub gdy zadanie zostanie wykonane.

    Kluczowe informacje o nowej funkcji /goal

    • Persystencja celów: Komenda /goal umożliwia tworzenie zadań, które Claude Code będzie realizował przez wiele sesji, aż do ich ukończenia. Stan zadania jest zapisywany lokalnie (np. w ~/.claude/goals/<id>.md), co eliminuje potrzebę ciągłego podtrzymywania kontekstu przez użytkownika.
    • Zaawansowane zarządzanie: System oferuje kontrolę nad bieżącym zadaniem poprzez komendy takie jak /goal pause (wstrzymanie), /goal resume (wznawianie) oraz /goal clear (wycofanie zadania). Możliwe jest także przełączanie się między różnymi celami.
    • Integracja z skills i subagentami: /goal działa w ramach systemu skills/commands Claude Code, który może wykorzystywać subagentów (komenda /fork) oraz tryb planowania (/plan) dla strategicznego podejścia przed rozpoczęciem realizacji.
    • Audyt i rubryki: W przeciwieństwie do Claude Code, gdzie /goal jest bardziej nastawiony na długoterminowe wykonywanie poleceń terminalowych, implementacja Claude Code kładzie nacisk na jasne kryteria zakończenia, audyt wykonania i rubryki akceptacji, co jest szczególnie przydatne w zadaniach wymagających recenzji, takich jak migracje API czy refaktoring kodu.
    • Persystencja celów jest kluczowa dla długoterminowych, wielosesyjnych workflowów. Zadanie ustanowione przez /goal może być realizowane przez Claude nawet gdy użytkownik zamyka terminal lub przechodzi do innych projektów. AI przechodzi przez cykl: planowanie, działanie, testowanie i recenzja, aż osiągnie zdefiniowane kryteria sukcesu. Stan jest zapisywany w postaci plików markdown, co pozwala na manualne edytowanie planu lub listy kroków.

    • Status i kontrola są dostępne natychmiast dzięki panelowi overlay, który pokazuje wykorzystany czas, liczbę tur i tokenów. Użytkownik może sprawdzić bieżący status komendą /goal bez potrzeby przechodzenia przez pełny cykl promptów. Wstrzymanie zadania (/goal pause) zachowuje stan, a ponowne uruchomienie (/goal resume) pozwala na kontynuację z tego samego miejsca. To jest szczególnie przydatne w przypadku długotrwałych zadań, gdzie człowiek musi interweniować lub sprawdzić postęp.

    • Integracja z skills i subagentami oznacza, że /goal jest częścią większego ekosystemu zarządzania. Może współpracować z subagentami (/fork) dla paralelizacji pracy, używać trybu planowania (/plan) dla strategii bez natychmiastowych zmian w kodzie oraz korzystać z komend takich jak /diff (recenzja zmian), /rewind (cofnij) i /btw (pytania poboczne). To czyni go silnym narzędziem dla złożonych, wieloetapowych projektów.

    Porównanie z Claude Code i praktyczne zastosowania

    Implementacja /goal w Claude Code różni się od rozwiązania Claude Code w kilku kluczowych aspektach. Claude Code koncentruje się na persystencji w terminalu i długoterminowym wykonywaniu poleceń CLI, co jest idealne dla workflowów takich jak refaktoring całego repozytorium, migracje czy naprawa testów, gdzie AI musi działać przez wiele godzin bez ingerencji człowieka. Claude Code, mimo że również może być użyty w takich scenariuszach, wprowadza bardziej zaawansowane zarządzanie zadaniami, jasne rubryki zakończenia i możliwość audytu realizacji.

    Hybrydowe podejście może być korzystne: wykorzystanie Claude Code do długoterminowej, terminalowej realizacji oraz Claude Code do finalnego audytu i recenzji zgodności z ustalonymi kryteriami. Testy pokazują, że takie podejście może być bardzo skuteczne.

    • Praktyczne zastosowania w web development, DevOps i AI-assisted workflow są liczne. /goal może być użyty do autonomicznego refaktoringu API (np. migracja z v1 do v2 z zachowaniem zielonych testów), iteracyjnego setupu infrastruktury (infra-as-code) czy długoterminowych napraw testów. Statystyki z demo pokazują, że 5-minutowe sesje dają pełny status i audyt, a nawet 18-godzinne, autonomiczne uruchomienia są możliwe dla wdrażania funkcji.

    Implementacje społecznościowe i przyszłość

    Komenda /goal w Claude Code nie jest jedyną implementacją w ekosystemie. Istnieje także projekt open-source claude-goal na GitHubie, który dodaje persistent local goal state i continuation instructions, zbliżając się bardziej do modelu Claude Code. To pokazuje aktywność społeczności w rozszerzaniu możliwości Claude Code.

    Nowa funkcja jest istotna dla deweloperów pracujących z AI w długoterminowych projektach. Umożliwia większą autonomię, gdzie AI może pracować niezależnie, a deweloper jedynie okresowo sprawdza status lub interweniuje. Dla DevOps, hosting setups i złożonych migracji, /goal wprowadza poziom automatyzacji, który znacząco redukuje manualne nadzorowanie.

    • Wnioski

    Claude Code /goal stanowi krok w kierunku bardziej autonomicznych, wielosesyjnych workflowów AI-assisted development. Choć podobne funkcje istnieją w innych środowiskach, implementacja Anthropic wyróżnia się naciskiem na zarządzanie, audyt i integrację z istniejącym ekosystemem.


    Źródła