Tag: openai

  • OpenAI Codex CLI zyskuje oczy: głęboka inspekcja obrazów, transkrypcja w czasie rzeczywistym i twardy security

    OpenAI Codex CLI zyskuje oczy: głęboka inspekcja obrazów, transkrypcja w czasie rzeczywistym i twardy security

    Ostatnie aktualizacje pakietu @openai/codex to coś więcej niż zwykłe poprawki błędów. To zestaw ulepszeń wzmacniających jego rolę jako zaawansowanego asystenta kodowania, ze szczególnym naciskiem na bezpieczniejsze i bardziej niezawodne działanie w zautomatyzowanych środowiskach. Brzmi poważnie, bo takie właśnie jest.

    Główny obszar rozwoju koncentruje się na mechanizmach chroniących agenta działającego w krytycznych środowiskach CI/CD. Chodzi o zaostrzenie polityk bezpieczeństwa wykonania (execution security policies), które minimalizują ryzyko podczas automatycznego uruchamiania narzędzi i skryptów.

    Jak działają nowe funkcje bezpieczeństwa w praktyce

    Aktualizacje wprowadzają ulepszenia w obszarze „merged sandbox policies” oraz „safer tool runs”. Gdy pakiet @openai/codex działa jako agent w potokach CI/CD, na przykład w runnerach GitLaba, musi być nie tylko użyteczny, ale przede wszystkim odporny i bezpieczny. Nowe funkcje zaprojektowano właśnie z myślą o takich scenariuszach.

    Mechanizmy te obejmują m.in. „URL hardening”, który zwiększa bezpieczeństwo operacji związanych z adresami internetowymi. Chociaż rozwiązanie to nie generuje szczegółowych raportów bezpieczeństwa w formacie JSON ani nie skanuje automatycznie kodu pod kątem konkretnych podatności, takich jak CVE czy SSRF, tworzy solidniejszą podstawę do bezpiecznego wykonywania zadań. Ogranicza potencjalne wektory ataku, które mogłyby wynikać z automatycznego przetwarzania niepewnych danych wejściowych.

    To głębsze podejście do bezpieczeństwa wykonania pomaga zabezpieczyć agenta przed nieoczekiwanymi interakcjami, które mogłyby zagrozić stabilności środowiska CI/CD lub bezpieczeństwu kodu.

    Wdrażanie i integracja z istniejącymi narzędziami

    Wdrażanie i integracja z istniejącymi narzędziami

    Instalacja najnowszej wersji obejmującej te ulepszenia jest standardowa: npm install -g @openai/codex@latest. W środowiskach efemerycznych, takich jak kontenery CI, kluczowe staje się odpowiednie zarządzanie uprawnieniami i dostępem do plików. Rozwiązaniem są allowlisty – jawne zezwolenia na to, które pliki i katalogi agent może odczytywać lub modyfikować. Zabezpiecza to system przed przypadkową lub złośliwą ingerencją poza wydzielonym obszarem roboczym.

    Integracja z istniejącymi workflowami deweloperskimi pozostaje priorytetem. Pakiet działa jako potężne narzędzie CLI, które można włączyć do różnych etapów tworzenia oprogramowania – od generowania kodu po jego analizę – zawsze z uwzględnieniem wzmocnionych zasad bezpieczeństwa wykonania.

    Podsumowanie: @openai/codex jako niezawodny asystent w automatyzacji

    Te aktualizacje wzmacniają fundamentalne cechy pakietu. @openai/codex utwierdza swoją pozycję zaawansowanego, tekstowego asystenta kodowania, zdolnego do generowania i analizowania kodu na podstawie instrukcji dewelopera.

    Jednocześnie, dzięki zaostrzeniu polityk bezpieczeństwa i zwiększeniu odporności na niepewne dane wejściowe, staje się bardziej godnym zaufania ogniwem w zautomatyzowanych procesach wytwarzania oprogramowania. Połączenie zaawansowanych możliwości generowania kodu z „pancerzem” chroniącym przed nieprzewidzianymi problemami w CI/CD sprawia, że @openai/codex staje się niezawodnym komponentem platformy do programowania wspomaganego przez AI – platformy, która działa odpowiedzialnie i bezpiecznie.

  • OpenAI Codex 0.115.0: Pełna kontrola nad agentami i nowa inspekcja wizualna

    OpenAI Codex 0.115.0: Pełna kontrola nad agentami i nowa inspekcja wizualna

    Marzec 2026 przyniósł ważną aktualizację dla programistów korzystających z zaawansowanych systemów AI. OpenAI wydało Codex w wersji 0.115.0, skupiając się na dwóch kluczowych obszarach: lepszej kontroli nad zespołem agentów i rozszerzeniu możliwości wizualnych. To nie są kosmetyczne poprawki, lecz znaczące ulepszenia fundamentów platformy, która już teraz zdążyła zmienić podejście do tzw. agentowego kodowania (agentic coding).

    Wydanie przynosi pełną inspekcję obrazów w wysokiej rozdzielczości, inteligentniejsze procesy zatwierdzania zmian oraz nowy Python SDK do pracy z systemem plików. Dla użytkowników oznacza to płynniejszą, bardziej wydajną i po prostu sprawniejszą współpracę z AI.

    Inspekcja wizualna w pełnej rozdzielczości

    Jedną z najbardziej wyczekiwanych nowości jest pełna obsługa obrazów. Do tej pory analiza elementów wizualnych w workflow Codexa mogła mieć ograniczenia. Wersja 0.115.0 wprowadza natywne wsparcie dla funkcji view_image oraz codex.emitImage, pozwalając agentom na szczegółowe przeglądanie i analizę grafiki w wysokiej rozdzielczości.

    To ważne ulepszenie dla każdego, kto pracuje nad interfejsami użytkownika, grafiką generatywną czy aplikacjami przetwarzającymi materiały wizualne. Agent może teraz dokładnie „przyjrzeć się” mockupowi, diagramowi architektonicznemu czy zrzutowi ekranu i na tej podstawie podjąć trafniejsze decyzje dotyczące kodu lub sugerowanych zmian.

    Smart Approvals: Strażnicy bezpiecznego kodu

    Najciekawszym elementem nowej wersji jest system Smart Approvals. To rozwiązanie problemu, który pojawia się przy pracy z wieloma agentami działającymi równolegle – kwestii tego, kto i jak zatwierdza ich propozycje.

    OpenAI wprowadza koncepcję „subagentów-strażników” (guardian subagents). Ich rolą jest usprawnienie procesów code review. Zamiast ręcznego zatwierdzania każdej zmiany, deweloper może skonfigurować przepływ, w którym pewne typy modyfikacji – na przykład zmiany w kluczowych plikach konfiguracyjnych czy wrażliwych fragmentach kodu – są automatycznie kierowane do dedykowanego agenta-strażnika. Dokonuje on wstępnej weryfikacji przed przedstawieniem propozycji człowiekowi.

    Co ważne, poprawiono też dziedziczenie reguł piaskownicy (sandbox) dla subagentów, co zwiększa bezpieczeństwo całego systemu. Narzędzie wait_agent zostało również przemianowane dla zachowania spójności z spawn_agent i send_input.

    Nowy Python SDK i ulepszone sesje WebSocket

    Nowy Python SDK i ulepszone sesje WebSocket

    Dla deweloperów stawiających na automatyzację i integracje, nowy Python SDK do filesystem RPCs w wersji 2 to spora wygoda. Umożliwia on programowe wykonywanie operacji na plikach bezpośrednio z poziomu skryptów Pythona, co otwiera drogę do tworzenia zaawansowanych, zautomatyzowanych pipeline'ów z Codexem w roli głównej.

    Równolegle ulepszono sesje komunikacji w czasie rzeczywistym przez WebSocket. Dodano dedykowany tryb transkrypcji, ujednolicono konfigurację sesji pod kluczem [realtime] oraz wprowadzono możliwość płynnego przekazania sesji (handoff) w wersji 2 za pomocą narzędzia codex. To wszystko sprawia, że praca interaktywna z agentem staje się szybsza i mniej podatna na problemy z połączeniem.

    Ulepszenia dla deweloperów: JS REPL, TUI i integracje

    W codziennej pracy przydadzą się też mniejsze, ale istotne ulepszenia. Środowisko JS REPL (Read-Eval-Print Loop) zostało wzbogacone o dostęp do codex.cwd i codex.homeDir, a referencje do codex.tool(...) oraz codex.emitImage(...) są teraz trwale zachowywane między komórkami kodu. Pozwala to na budowanie bardziej złożonych i interaktywnych skryptów.

    Poprawiono także wydajność tekstowego interfejsu użytkownika (TUI) oraz samego JS REPL. Wprowadzono nowy przepływ wyszukiwania narzędzi (tool-search flow) w integracjach aplikacji, co ułatwia odkrywanie funkcjonalności. Współpraca z MCP (Model Context Protocol) i elicitation jest teraz bardziej odporna na błędy, a lokalne proxy lepiej obsługuje połączenia HTTP/1 CONNECT.

    Instalacja i środowisko wykonawcze

    Instalacja i środowisko wykonawcze

    Aktualizację do wersji 0.115.0 można zainstalować standardowo przez npm, komendą:

    $ npm install -g @openai/[email protected]

    Warto pamiętać, że Codex jest zoptymalizowany pod kątem pracy z zaawansowanymi modelami agentowymi OpenAI, takimi jak GPT-5.3-Codex (o oknie kontekstowym 272K tokenów) czy GPT-5.4 (aż 1M tokenów). Te modele, w przeciwieństwie do swoich wersji w ChatGPT, są specjalnie dostrojone do długich, wieloetapowych zadań programistycznych w środowisku CLI, aplikacji desktopowej czy rozszerzeń IDE.

    Pod maską Codex opiera się na solidnych fundamentach: plikach konfiguracyjnych config.toml, systemie piaskownic i zatwierdzeń, dokumentacji AGENTS.md oraz protokole MCP. Bezpieczeństwo na poziomie systemu operacyjnego zapewniają mechanizmy takie jak Seatbelt na macOS czy Landlock i seccomp na Linuxie.

    W kierunku stabilnej platformy agentowej

    Wydanie 0.115.0 to nie tylko nowe funkcje, ale także zestaw poprawek stabilizujących platformę. Przywrócono poprawne działanie codex exec --profile w zakresie przywracania ustawień profilu. Usprawniono normalizację nazw narzędzi w MCP, co zwiększa bezpieczeństwo, oraz zachowywanie parametrów tool_params w promptach. To drobne, ale istotne zmiany, które składają się na bardziej przewidywalne i niezawodne środowisko.

    Ta aktualizacja wpisuje się w szybki cykl rozwoju Codexa. Zaraz po niej, 20 marca, ukazała się wersja 0.116.0 z logowaniem przez kod urządzenia do ChatGPT, ulepszeniami pluginów i hookami na prompty użytkownika. Widać wyraźnie, że OpenAI traktuje Codex jako strategiczną platformę dla przyszłości programowania wspomaganego przez AI.

    Podsumowanie

    Codex v0.115.0 to krok w kierunku dojrzałej platformy do orkiestracji agentów AI. Nie chodzi już tylko o to, by AI napisało fragment kodu, ale o zarządzanie zespołem wyspecjalizowanych agentów, którzy bezpiecznie i pod nadzorem człowieka mogą realizować złożone zadania.

    Wprowadzenie Smart Approvals z guardian subagents, pełna inspekcja wizualna oraz nowy Python SDK to odpowiedź na realne potrzeby deweloperów wchodzących w erę programowania agentowego. Poprawki wydajnościowe i stabilizacyjne cementują pozycję Codexa jako profesjonalnego narzędzia. Wygląda na to, że centrum dowodzenia dla AI w software developmencie właśnie otrzymało potężny upgrade.

  • Codex CLI 0.116.0: Nowe funkcje dla przedsiębiorstw, integracja ChatGPT i ulepszone sesje realtime

    Codex CLI 0.116.0: Nowe funkcje dla przedsiębiorstw, integracja ChatGPT i ulepszone sesje realtime

    Najnowsza wersja potężnego asystenta terminalowego AI, Codex CLI, przynosi istotne ulepszenia. Wydanie 0.116.0-alpha.11, opublikowane w marcu 2026 roku, to solidny krok w stronę środowisk korporacyjnych. OpenAI wyraźnie wysyła sygnał: Codex CLI dorasta i jest gotowy na wdrożenie w zespołach inżynierskich dużych firm. Nowe funkcje związane z bezpieczeństwem, ujednolicenie dostępu z kontem ChatGPT oraz dalsze usprawnienia to najważniejsze punkty tej aktualizacji.

    Jeśli używasz Codex CLI do codziennego kodowania, web developmentu czy automatyzacji zadań DevOps, ta wersja znacząco poszerza Twoje możliwości – szczególnie jeśli pracujesz za firmowym firewallem.

    Zabezpieczenia dla przedsiębiorstw: sandbox i polityki dostępu

    To najważniejszy kierunek rozwoju w najnowszej wersji. OpenAI dodaje funkcje kluczowe dla adopcji narzędzia w dużych organizacjach, gdzie bezpieczeństwo i kontrola są priorytetem.

    Kolejna warstwa to zaostrzone polityki sandbox. Administratorzy zyskują większą kontrolę nad tym, co Codex CLI może wykonać. Mowa tu o trybach zatwierdzania (approval modes), takich jak read-only, auto czy full access dla narzędzi powłoki i plików. Otwiera to drogę do bezpiecznego uruchamiania Codex CLI w zdalnych workflow testowych, gdzie izolacja jest kluczowa.

    Dla deweloperów narzędzi wewnętrznych prawdziwą perełką jest nowy tryb app-server. Pozwala on na integrację Codex CLI z własnymi skryptami, narzędziami czy pipeline'ami. App-server współpracuje z menedżerem wątków i interfejsem TUI, umożliwiając realizację bardziej zaawansowanych scenariuszy automatyzacji. Brzmi to technicznie, ale w praktyce oznacza, że możesz wbudować AI bezpośrednio w swoje wewnętrzne automaty.

    Ujednolicone logowanie przez konto ChatGPT

    To zmiana, która uprości życie wielu użytkownikom. Do tej pory korzystanie z Codex CLI wiązało się głównie z użyciem klucza API. Teraz dostęp jest ujednolicony z kontem ChatGPT.

    Proces jest prosty: używasz swojego istniejącego abonamentu ChatGPT. Niezależnie od tego, czy posiadasz plan ChatGPT Plus, Pro, Business, Edu czy Enterprise – Twój dostęp i limity są przypisane do konta. Nie musisz martwić się o oddzielny klucz API i jego limity, chyba że wolisz tę ścieżkę, która nadal pozostaje dostępna.

    Integracja idzie o krok dalej. Konfiguracja pluginów stała się znacznie płynniejsza. CLI sugeruje teraz instalację brakujących wtyczek czy konektorów (szanując przy tym listy dozwolonych sugestii), synchronizuje ich instalację i deinstalację między urządzeniami, a nawet sprawdza autoryzację podczas instalacji. To drobne usprawnienia, które znacząco poprawiają komfort pracy.

    Ulepszenia stabilności i interfejsu

    Najnowsze wersje alpha skupiają się na dopracowaniu i stabilizacji, szczególnie w kluczowym obszarze współpracy w czasie rzeczywistym (realtime collaboration) i interfejsu terminalowego (TUI).

    Sam interfejs app-servera został dopracowany. TUI potrafi teraz czytać zawartość terminala, a aplikacja Codex sprawdza działające serwery lub wyniki kompilacji, oferując jeszcze lepszy wgląd w stan systemu.

    Warto również wspomnieć, że w kontekście bezpieczeństwa znana jest luka w Codex CLI umożliwiająca przejęcie kontroli przez odpowiednio sformatowany plik, co podkreśla potrzebę ostrożności i regularnego instalowania najnowszych aktualizacji.

    Dlaczego to ważne dla deweloperów?

    Te aktualizacje mogą wydawać się typowo korporacyjne, ale ich zalety odczuje każdy profesjonalny programista, szczególnie zajmujący się web developmentem, AI, DevOps czy „vibe codingiem”.

    Przede wszystkim workflow w terminalu staje się priorytetowy. Pełnoekranowy interfejs TUI z edytorem promptów, podglądem plików i zrzutów ekranu, panelem odpowiedzi ze strumieniowaniem i diffami oraz paskiem statusu z informacjami o modelu, tokenach i stanie Gita – to kompletne środowisko pracy bez konieczności otwierania przeglądarki czy IDE.

    Zyskuje także produktywność. Funkcje takie jak Smart Approvals, które kierują zadania do "subagenta-strażnika", czy lokalny przegląd kodu za pomocą komendy /review (dla diffów, branchy i commitów) to realna pomoc. Możliwość pracy w trybach Auto lub Read-only daje pełną kontrolę nad tym, jak głęboko AI ingeruje w kod.

    Wreszcie warto podkreślić wieloplatformowość i otwartość. Codex CLI działa na macOS (ARM i x86) oraz Linuxie (x86/ARM, także z biblioteką musl). Narzędzie jest budowane w open-source'owym języku Rust, co gwarantuje szybkość i przejrzystość. Można je osadzać w pipeline'ach CI, łączyć przez protokół MCP z serwisami takimi jak GitHub czy Sentry, a także ładować gotowe "Skills" do wielokrotnego użytku w workflow AI.

    Podsumowanie

    Najnowsze aktualizacje Codex CLI to ewolucja w stronę dojrzałości i gotowości na wdrożenia produkcyjne. Nie znajdziemy tu rewolucyjnych modeli AI, ale za to szereg praktycznych, przemyślanych ulepszeń, które eliminują bariery w codziennej pracy.

    Dla programisty indywidualnego największą różnicą będzie wygoda ujednoliconego dostępu przez konto ChatGPT i jeszcze płynniejsza praca. Dla zespołów i firm to otwarcie nowych możliwości: zaawansowana kontrola przez sandbox oraz API do integracji z wewnętrznymi narzędziami.

    OpenAI pokazuje, że Codex CLI nie jest już tylko eksperymentalnym gadżetem, ale poważnym narzędziem pracy, które może stać się integralną częścią procesu developmentu – od małych projektów po korporacyjne centra danych. Najnowsze wersje solidnie budują fundamenty pod tę przyszłość.

  • Codex 0.115.0: pełna inspekcja obrazów, transkrypcje na żywo i zaawansowane API

    Codex 0.115.0: pełna inspekcja obrazów, transkrypcje na żywo i zaawansowane API

    Najnowsze aktualizacje Codex, autonomicznego agenta AI do kodowania i automatyzacji od OpenAI, wprowadzają szereg znaczących ulepszeń, które mogą zmienić sposób pracy deweloperów. Najważniejsze nowości skupiają się na integracjach, narzędziach CLI/SDK oraz stabilności codziennych workflowów. To nie tylko rozwój funkcjonalności, ale też solidna porcja usprawnień technicznych.

    Integracje z narzędziami designerskimi i komunikacyjnymi

    Jednym z kluczowych obszarów rozwoju są integracje z popularnymi platformami, takimi jak Figma. Pozwala to deweloperom i designerom na płynną współpracę, w której Codex może asystować przy analizie interfejsów użytkownika (UI) i flow projektowych bezpośrednio w znanych narzędziach. Podobne integracje z platformami komunikacyjnymi, takimi jak Slack, umożliwiają włączanie automatyzacji do codziennej komunikacji zespołowej.

    Te połączenia wskazują na ewolucję Codex z narzędzia stricte programistycznego w stronę platformy automatyzacji procesów deweloperskich i projektowych, działającej w kontekście istniejących aplikacji.

    Rozwój CLI, SDK i środowiska deweloperskiego

    Codex oferuje rozbudowane narzędzia wiersza poleceń (CLI) oraz SDK (głównie w TypeScript), które stanowią podstawę interakcji z agentem. Środowisko to jest stale rozwijane, aby zapewnić programistom potężne i elastyczne możliwości automatyzacji.

    Funkcjonalności obejmują zaawansowane zarządzanie wykonywaniem poleceń ze wsparciem dla streamingu stdin/stdout/stderr oraz TTY/PTY. Dla deweloperów pracujących z terminalami i kontenerami to istotne usprawnienie, które pozwala na lepszą integrację z istniejącym ekosystemem. SDK pozwala programistom łatwo integrować operacje Codexa z ich własnym kodem, zapewniając kontrolowany dostęp do automatyzacji.

    Stabilność i bezpieczeństwo automatyzacji

    Każda duża aktualizacja przynosi też poprawki stabilności i bezpieczeństwa, kluczowe dla zautomatyzowanych workflowów.

    Ulepszenia dotyczą bezpieczeństwa i izolacji podczas uruchamiania zautomatyzowanych agentów i subagentów, co stanowi fundament zaufania do platformy. Poprawki w obszarze routingu i normalizacji wewnętrznych procesów zmniejszają ryzyko błędów przy złożonych automatyzacjach.

    Warto też zauważyć zwiększoną transparentność działań agenta – użytkownik ma lepszy wgląd w to, jakie operacje i z jakimi parametrami zostaną wykonane, zanim wyrazi na nie zgodę.

    Ekosystem rozszerzeń i workflow deweloperów

    Rozwój nie ominął też ekosystemu rozszerzeń. Wprowadzane są lepsze integracje aplikacji oraz ulepszone workflowy dla pluginów.

    Dla deweloperów oznacza to łatwiejsze znajdowanie i włączanie potrzebnych funkcjonalności do projektów, choć obecnie odbywa się to raczej przez bezpośrednie integracje niż scentralizowany marketplace. Dbałość o odpowiednie uprawnienia i weryfikację źródeł pluginów podczas instalacji redukuje ryzyko naruszenia bezpieczeństwa i ułatwia zarządzanie zależnościami.

    Wnioski

    Najnowsze aktualizacje Codex idą w dwóch kierunkach: poszerzają konkretne możliwości integracyjne z kluczowymi narzędziami deweloperskimi oraz solidnie wzmacniają istniejącą bazę, zwiększając stabilność, bezpieczeństwo i ergonomię pracy.

    Dla deweloperów codziennie korzystających z automatyzacji poprawki w wykonywaniu poleceń i bezpieczeństwie będą najbardziej odczuwalne w bieżącej pracy. Dla osób budujących bardziej złożone systemy rozwinięte SDK i integracje otwierają nowe możliwości włączania AI do szerszych procesów.

    OpenAI rozwija Codex nie tylko jako asystenta kodowania, ale jako platformę do zaawansowanej automatyzacji developer workflow. Rozwój skupia się zarówno na głębi (zaawansowane SDK, integracje), jak i na szerokości (poprawki stabilności, ulepszenia UX). To dobry kierunek dla wszystkich, którzy oczekują spójnego i bezpiecznego środowiska do automatyzacji całych procesów wytwarzania oprogramowania.

  • OpenAI udostępnia GTP-5.4 nano w API. To najmniejszy i najtańszy model z nowej rodziny

    OpenAI udostępnia GTP-5.4 nano w API. To najmniejszy i najtańszy model z nowej rodziny

    Od 5 marca 2026 roku deweloperzy korzystający z OpenAI API mają do dyspozycji nową, kompaktową broń w swoim arsenale. Jest nią GPT-5.4-nano, najmniejsza i najbardziej ekonomiczna wersja najnowszej rodziny modeli językowych od OpenAI. To nie kolejna iteracja dostępna w popularnym interfejsie ChatGPT, lecz narzędzie dedykowane wyłącznie programistom integrującym AI w swoich aplikacjach i usługach.

    Model został zaprojektowany z myślą o szybkości i wydajności kosztowej w zadaniach wymagających przetwarzania dużych ilości danych. Jego premiera w API to wyraźny sygnał, że OpenAI skupia się na potrzebach rynku deweloperskiego, oferując specjalistyczne rozwiązania do konkretnych zastosowań.

    Dostępność i cennik: API w roli głównej

    GPT-5.4-nano jest dostępny wyłącznie przez OpenAI API. Oznacza to, że przeciętny użytkownik końcowy nie znajdzie go w interfejsie czatu, co podkreśla jego profesjonalny, deweloperski charakter. Dostęp do modelu mają wszyscy programiści z aktywnym kontem OpenAI.

    Kluczowym atutem tego modelu jest jego przewidywalny i atrakcyjny cennik. OpenAI ustaliło stawki na poziomie 0,20 USD za 1 milion tokenów wejściowych oraz 1,25 USD za 1 milion tokenów wyjściowych. Takie podejście do wyceny ułatwia budżetowanie projektów i skalowanie usług bez obaw o niekontrolowany wzrost kosztów. W kontekście zadań o wysokim wolumenie, gdzie liczy się każdy ułamek centa, te liczby robią dużą różnicę.

    Specyfikacja modelu: mały, ale z wizją

    Choć nano jest najmniejszym członkiem rodziny GPT-5.4, nie jest to wyłącznie model tekstowy. OpenAI wyposażyło go w możliwości wizyjne. Obsługa obrazów wiąże się z nieco wyższym kosztem przetwarzania, choć szczegółowy mnożnik dla tokenów wizyjnych nie został publicznie ujawniony. To ciekawe połączenie: lekki, szybki i tani model, który potrafi interpretować nie tylko tekst, ale i grafikę.

    W porównaniu ze swoim poprzednikiem, GPT-5-nano, nowa iteracja stanowi znaczący upgrade. OpenAI zapewnia o poprawie wydajności w wielu wymiarach, choć konkretne benchmarki dla wersji nano nie zostały jeszcze szeroko upublicznione. Sam fakt, że model otrzymał nową numerację (5.4 zamiast 5), sugeruje, że zmiany są istotne, a nie tylko kosmetyczne.

    Gdzie gpt-5.4-nano sprawdzi się najlepiej?

    OpenAI jasno wskazuje rekomendowane scenariusze użycia. GPT-5.4-nano jest zoptymalizowany pod kątem zadań, w których priorytetem są szybkość i niski koszt, często kosztem maksymalnej, „głębokiej” mocy obliczeniowej.

    • Klasyfikacja to jeden z głównych przypadków użycia. Automatyczne sortowanie treści, tagowanie, przypisywanie kategorii – tam, gdzie decyzje są względnie proste, a wolumen duży, nano może być idealnym wyborem.

    • Ekstrakcja danych to kolejny obszar. Wyciąganie strukturyzowanych informacji z nieuporządkowanych tekstów, na przykład parsowanie faktur, wiadomości czy dokumentów, to praca, którą nano może wykonywać wydajnie i bez zbędnego obciążania budżetu.

    • Ranking to naturalne zastosowanie dla mniejszego modelu. Sortowanie wyników wyszukiwania, list produktów czy rekomendacji w oparciu o proste kryteria nie zawsze wymaga potęgi największych modeli.

    Ciekawą sugestią jest też wykorzystanie GPT-5.4-nano jako kodujących subagentów, które zajmują się prostszymi, pomocniczymi zadaniami w większym procesie (pipeline). Można sobie wyobrazić system, w którym główny, potężny agent planuje architekturę funkcji, a kilku „robotników” nano w tle pisze standardowy boilerplate code czy testy jednostkowe.

    Kontekst wydajnościowy: jak nano wypada na tle rodziny?

    Aby zrozumieć miejsce GPT-5.4-nano w ekosystemie, warto spojrzeć na osiągi jego większych braci. Pełnowymiarowy model GPT-5.4 osiąga imponujący wynik 67,3% sukcesów w benchmarku WebArena-Verified, który testuje praktyczne umiejętności korzystania z przeglądarki internetowej.

    Na jeszcze wyższym poziomie, 92,8%, plasuje się w zadaniach Online-Mind2Web, opartych na analizie zrzutów ekranu. To pokazuje, że cała rodzina GPT-5.4 jest niezwykle kompetentna w zadaniach wymagających rozumienia i interakcji ze złożonym, multimodalnym środowiskiem.

    GPT-5.4-nano, jako najmniejszy członek rodziny, nie będzie dorównywał tym wynikom w najbardziej wymagających testach. Jego siła leży gdzie indziej: w równowadze między przyzwoitą, bazową kompetencją a błyskawicznym czasem odpowiedzi i niskim kosztem. To model, który ma „wystarczająco dużo rozumu”, by poradzić sobie z wieloma rutynowymi zadaniami produkcyjnymi, nie zużywając przy tym środków na zbędną moc obliczeniową.

    Jak zintegrować GPT-5.4-nano? Prosta ścieżka dla deweloperów

    Dla programistów pracujących w Pythonie integracja jest błyskawiczna. Wystarczy upewnić się, że korzystają z najnowszej wersji oficjalnego SDK OpenAI. Aktualizacja za pomocą polecenia pip install openai --upgrade otwiera dostęp do nowego modelu poprzez standardowe wywołania API.

    To podejście jest spójne z filozofią OpenAI – minimalizacja barier wejścia dla programistów. Nie ma skomplikowanych procedur migracji, nowych bibliotek czy radykalnych zmian w kodzie. Nowa moc jest dostępna tam, gdzie deweloperzy już pracują.

    Podsumowanie

    Premiera GPT-5.4-nano w API to ważny krok w demokratyzacji dostępu do zaawansowanej sztucznej inteligencji dla biznesu. OpenAI, dostrzegając potrzeby rynku, oferuje nie tylko najpotężniejsze i najdroższe modele, ale też narzędzia skrojone pod realia produkcyjne: wysoką przepustowość, ograniczone budżety i potrzebę krótkiego czasu odpowiedzi.

    Ten model to propozycja dla tych, którzy chcą wdrożyć AI na szeroką skalę, automatyzując tysiące prostszych decyzji dziennie bez generowania astronomicznych rachunków. Jest dowodem na to, że ewolucja modeli językowych to nie tylko wyścig na liczbę parametrów, ale też głębsze zrozumienie różnych warstw potrzeb deweloperskich. GPT-5.4-nano może nie napisze przełomowych poematów, ale pomoże usprawnić działanie tysięcy aplikacji, czyniąc je inteligentniejszymi, szybszymi i tańszymi w utrzymaniu.

  • GPT-5.4 mini: szybszy i wydajniejszy brat dla programistów i nie tylko

    GPT-5.4 mini: szybszy i wydajniejszy brat dla programistów i nie tylko

    To prawdziwa gratka dla każdego, kto używa narzędzi AI do kodowania i automatyzacji. OpenAI udostępniło właśnie nowe wersje swojego flagowego modelu – GPT-5.4 Thinking, GPT-5.4 Pro oraz GPT-5.4 Nano. Choć mniejsze, wcale nie są gorsze. Wręcz przeciwnie, w kluczowych zadaniach potrafią dorównać starszemu rodzeństwu, a przy tym są znacznie szybsze i tańsze w eksploatacji. To strategiczny ruch, który ma upowszechnić najnowsze technologie AI wśród deweloperów i twórców aplikacji.

    Wersje te, które trafiły do ChatGPT, Codexa i API, są szczególnie interesujące. Zostały zoptymalizowane pod kątem kodowania, interakcji z komputerem (np. przeglądarką), wywoływania narzędzi (tool calling) oraz pracy multimodalnej. Największą obietnicą jest jednak wydajność: modele mają być znacznie szybsze niż ich poprzednicy. Dla osób budujących agenty czy aplikacje, w których czas odpowiedzi jest kluczowy, to bardzo dobra wiadomość.

    Co potrafią nowe warianty GPT-5.4?

    Nowe modele to nie tylko obietnice, ale konkretne, potwierdzone wyniki. Warianty GPT-5.4 zostały przetestowane w wymagających benchmarkach i osiągi są imponujące. W testach kodowania, takich jak SWE-bench Pro, ich skuteczność zbliża się do pełnej wersji GPT-5.4. Oznacza to, że programiści korzystający z tych modeli mogą oczekiwać wysokiej jakości wsparcia przy refaktoryzacji, debugowaniu czy pisaniu nowych funkcji.

    Jeszcze większy skok widać w zadaniach związanych z obsługą komputera, czyli tzw. computer use. Modele wykazują ogromny postęp w porównaniu do wcześniejszych wyników. W praktyce przekłada się to na tworzenie bardziej niezawodnych asystentów, którzy potrafią nawigować po stronach internetowych, wypełniać formularze czy ekstrahować dane.

    GPT-5.4 Nano to z kolei najmniejszy i najtańszy członek rodziny. Jego siłą nie jest skomplikowane rozumowanie, lecz szybkość i niski koszt w prostszych zadaniach. Sprawdzi się doskonale jako lekki subagent, narzędzie do klasyfikacji treści, podstawowego parsowania danych czy wszędzie tam, gdzie priorytetem jest niska latencja. Zgodnie z informacjami, oferuje on okno kontekstowe rzędu 128 000 do 200 000 tokenów.

    Oba modele są multimodalne. Obsługują wizję opartą na patchach (fragmentach obrazu) i mogą analizować obrazy w czasie rzeczywistym.

    Szybkość i charakter: co mówią pierwsze testy?

    Liczby z oficjalnych benchmarków to jedno, a doświadczenia z API – drugie. Pierwsze relacje użytkowników potwierdzają ogromny przyrost prędkości. Nowe warianty GPT-5.4 potrafią generować odpowiedzi błyskawicznie w standardowym trybie API.

    Jeśli potrzebujemy maksymalnej prędkości, wersja Nano generuje tekst wyjątkowo szybko. To kolosalna różnica dla aplikacji wymagających płynnej, konwersacyjnej interakcji. Pojawiają się też głosy, że nowe modele bywają „bardziej dzikie” lub mniej przewidywalne w swoich odpowiedziach niż ich poprzednicy. Często jednak te odpowiedzi są trafniejsze i bardziej bezpośrednie, co w wielu zastosowaniach jest cechą pożądaną.

    Warto pamiętać o dacie odcięcia wiedzy (knowledge cutoff) modeli. Jest ona ustalona na 31 sierpnia 2025 roku. Oznacza to, że nie mają one informacji o wydarzeniach lub technologiach, które pojawiły się po tej dacie.

    Gdzie i za ile? Dostępność i cennik

    Nowe modele są już dostępne w kluczowych kanałach OpenAI. Podstawowym miejscem dla deweloperów jest API, gdzie można od razu korzystać z nowych wariantów.

    W ChatGPT sytuacja jest nieco bardziej złożona. Pełna wersja GPT-5.4 z trybem Thinking jest zarezerwowana dla subskrybentów płatnych planów (Plus, Team, Pro).

    Codex, dedykowane narzędzie do kodowania, również zaczyna wdrażać nowe modele. Proces ten odbywa się stopniowo.

    Jeśli chodzi o koszty, cennik jest przejrzysty i atrakcyjny, zwłaszcza dla wersji Nano. API oferuje też różne tryby rozliczeniowe. Tani tryb Batch/Flex jest dostępny za połowę stawki, a szybszy Priority – za podwójną. Daje to elastyczność w dopasowaniu wydatków do potrzeb projektu.

    Dlaczego to ważne? Kierunek rozwoju AI

    Dlaczego to ważne? Kierunek rozwoju AI

    Wydanie nowych wariantów GPT-5.4 to nie tylko kolejna aktualizacja modelu. To sygnał, w jakim kierunku zmierza branża. Zamiast skupiać się wyłącznie na powiększaniu najpotężniejszych modeli, OpenAI inwestuje w tworzenie wyspecjalizowanych, wydajnych i ekonomicznych wariantów. To podejście ma znacznie większy sens praktyczny dla ekosystemu deweloperów.

    Dzięki niższym kosztom i wyższej prędkości zaawansowane możliwości kodowania i automatyzacji stają się dostępne dla szerszego grona odbiorców. Można budować bardziej złożone systemy agentowe, w których zadania są delegowane do modeli o różnej mocy i cenie. GPT-5.4 Nano może zajmować się prostym routingiem i klasyfikacją, a inne warianty – bardziej wymagającymi problemami, a wszystko to w czasie zbliżonym do rzeczywistego.

    Optymalizacja pod kątem computer use to też niezwykle istotny krok w stronę praktycznej autonomii. Modele, które naprawdę rozumieją, co dzieje się na ekranie i potrafią działać w interfejsach użytkownika, otwierają drzwi do nowej generacji asystentów cyfrowych. To już nie tylko chatboty, ale współpracownicy zdolni do wykonywania konkretnych, powtarzalnych zadań w środowisku cyfrowym.

    Podsumowanie

    Premiera nowych wariantów GPT-5.4 to wydarzenie przede wszystkim dla praktyków: dla programistów szukających szybszego i celniejszego wsparcia w kodowaniu, dla twórców aplikacji budujących systemy wieloagentowe i dla wszystkich, którzy potrzebują wydajnej AI do interakcji z oprogramowaniem. Znaczny wzrost prędkości przy zachowaniu, a nawet poprawie jakości w kluczowych zadaniach, to mocny argument.

    Choć pełna wersja GPT-5.4 pozostaje najpotężniejszym narzędziem do najbardziej złożonych problemów, to właśnie te mniejsze modele mogą stać się prawdziwymi „kołami zamachowymi” codziennego wykorzystania AI. Są szybsze, tańsze i specjalnie dostrojone do tego, co w rozwoju oprogramowania najważniejsze: pisania, testowania i automatyzacji kodu oraz interakcji z cyfrowym światem. Ich sukces będzie mierzony nie rankingami, a liczbą aplikacji, które dzięki nim powstaną.

  • Codex 0.114.0: lepsza izolacja, haki i usprawnienia workflow

    Codex 0.114.0: lepsza izolacja, haki i usprawnienia workflow

    Najnowsza wersja narzędzi deweloperskich OpenAI, opartych na modelach takich jak Codex, przynosi zestaw eksperymentalnych funkcji, które mają na celu zwiększenie kontroli i stabilności pracy programistów. To nie jest rewolucyjna aktualizacja, lecz seria precyzyjnych udoskonaleń rozwiązujących konkretne problemy zgłaszane przez społeczność. Głównymi nowościami w tym wydaniu są eksperymentalny tryb kodu dla lepszej izolacji, nowy silnik hooków oraz kluczowe poprawki błędów wpływające na codzienną pracę.

    Eksperymentalny tryb kodu: izolacja na pierwszym planie

    Jedną z najciekawszych nowości jest eksperymentalny tryb kodu (experimental code mode). Jego głównym zadaniem jest zapewnienie bardziej odizolowanych środowisk pracy. W praktyce oznacza to, że różne zadania czy workflowy mogą być uruchamiane w osobnych, wydzielonych kontekstach.

    Po co taka izolacja? Chodzi o redukcję interferencji. Podczas pracy nad kilkoma projektami jednocześnie lub testowania różnych skryptów istnieje ryzyko, że zmiany w jednym środowisku wpłyną nieoczekiwanie na drugie. Nowy tryb ma minimalizować to ryzyko, tworząc "piaskownice" (sandboxy) dla poszczególnych zadań. To podejście jest szczególnie cenne w złożonych pipeline'ach lub podczas eksperymentowania z nowymi bibliotekami, gdzie czystość środowiska ma kluczowe znaczenie.

    Nowy silnik hooków: SessionStart i SessionStop

    Kolejną eksperymentalną funkcją jest silnik hooków (hooks engine). Wprowadza on dwa nowe zdarzenia: SessionStart i SessionStop. Hooki to potężny mechanizm pozwalający deweloperom na "podpinanie" własnej logiki w kluczowych momentach cyklu życia sesji.

    Wyobraź sobie, że chcesz automatycznie uruchomić skrypt czyszczący pliki tymczasowe po zakończeniu sesji, zainicjować konkretną konfigurację środowiska na jej starcie lub wysłać powiadomienie do zespołu. Dzięki nowym hookom takie automatyzacje stają się możliwe bez bezpośredniego modyfikowania jądra (core) narzędzia. Otwiera to drogę do lepszego dostosowywania środowiska do specyficznych potrzeb projektu i wewnętrznych procedur.

    Endpointy health check dla WebSocketów i wyłączanie systemowych skilli

    Endpointy health check dla WebSocketów i wyłączanie systemowych skilli

    Dla osób wdrażających aplikacje oparte na WebSocketach aktualizacja wprowadza praktyczne ulepszenie operacyjne. WebSocket app-server deployments wystawiają teraz endpointy GET /readyz oraz GET /healthz na tym samym listenerze.

    To standardowe, ale niezwykle ważne punkty końcowe w świecie DevOps. Umożliwiają one narzędziom monitorującym (takim jak Kubernetes czy load balancery) łatwe sprawdzanie żywotności i gotowości usługi. Dzięki temu wdrożenia produkcyjne stają się bardziej odporne i łatwiejsze w zarządzaniu.

    Dodano też prosty, ale użyteczny przełącznik konfiguracyjny: możliwość wyłączenia wbudowanych systemowych skilli (bundled system skills). Nie każdy projekt potrzebuje pełnego zestawu domyślnych umiejętności. Dzięki tej opcji użytkownicy mogą odciążyć środowisko z niepotrzebnych komponentów, co może przełożyć się na mniejsze zużycie zasobów i mniejszy "szum" w interakcjach.

    Usprawnienia workflowu: lepsze handoffy i czytelniejszy picker

    Wydanie przynosi też subtelne, ale odczuwalne poprawki w płynności pracy. Handoffy (przekazywanie zadań) zostały wzbogacone o kontekst z transkrypcji w czasie rzeczywistym. Gdy przekazujesz zadanie innemu członkowi zespołu lub wznawiasz pracę nad wątkiem po przerwie, masz teraz lepszy wgląd w to, co działo się wcześniej. Poprawia to ciągłość pracy i skraca czas potrzebny na ponowne wejście w kontekst zadania.

    Ulepszono również mention picker – narzędzie służące do wybierania i odwoływania się do różnych elementów. Poprawki skupiły się na zwiększeniu jego czytelności, co ma przyspieszyć nawigację i zmniejszyć liczbę pomyłek podczas codziennego użytkowania.

    Ważne poprawki błędów zwiększające stabilność

    Ważne poprawki błędów zwiększające stabilność

    Żadne wydanie nie mogłoby się obyć bez poprawek, a w tej aktualizacji są one szczególnie istotne dla stabilności:

    • Naprawiono awarie tmux. To krytyczna poprawka dla użytkowników pracujących w terminalu, gdzie crashe mogły skutkować utratą sesji.
    • Zaostrzono kontrole włączania aplikacji. Naprawiono problem, przez który aplikacje mogły być uruchamiane w nieobsługiwanych sesjach, co prowadziło do niespójnego zachowania.
    • Rozwiązano problem z wątkami oznaczanymi jako "w toku". Dotyczyło to sytuacji, gdy użytkownik zakończył pracę w trakcie działania procesu (mid-run), a później ją wznowił – wątek mógł utknąć w nieprawidłowym stanie.
    • Ulepszono zarządzanie uprawnieniami. Poprawka zachowuje oczekiwane zachowanie dla workspace-write, zapewniając jednocześnie bezpieczną degradację (graceful degradation) w starszych buildach. Jest to kluczowe dla kompatybilności wstecznej.

    Jak zainstalować i kontekst szerszych wydań

    Instalacja nowych narzędzi i bibliotek OpenAI zazwyczaj odbywa się przez menedżery pakietów, takie jak npm. Warto zapoznać się z oficjalną dokumentacją OpenAI, aby poznać aktualne metody instalacji i dostępne pakiety.

    Warto spojrzeć na to wydanie w szerszym kontekście cyklu rozwojowego. Ta aktualizacja koncentruje się na izolacji, hookach i stabilności. Kolejne wersje wprowadzały już bardziej spektakularne nowości, takie jak inspekcja obrazów w pełnej rozdzielczości czy rozszerzony kontekst JavaScript REPL. Pokazuje to iteracyjne podejście: najpierw buduje się solidny fundament i mechanizmy (jak hooki), a potem na nich opiera nowe, bogatsze funkcje.

    Podsumowanie: solidny krok naprzód

    Ta aktualizacja to wydanie inżynieryjne, które może nie rzucać się w oczy efektownymi interfejsami, ale znacząco poprawia jakość i kontrolę nad procesem deweloperskim. Wprowadzenie eksperymentalnego trybu izolacji i silnika hooków wskazuje na kierunek rozwoju platformy w stronę większej modularności, bezpieczeństwa i możliwości automatyzacji. Jednocześnie poprawki błędów związanych z tmux, wątkami i uprawnieniami bezpośrednio rozwiązują problemy użytkowników, zwiększając ogólną niezawodność narzędzia. To właśnie takie aktualizacje, które naprawiają, usprawniają i dają nowe, bazowe możliwości, często mają największy wpływ na produktywność w dłuższej perspektywie.

  • Codex 0.113.0: większa kontrola nad uprawnieniami, rynek pluginów i lepszy serwer aplikacji

    Codex 0.113.0: większa kontrola nad uprawnieniami, rynek pluginów i lepszy serwer aplikacji

    Wydanie Codex 0.113.0 to nie tylko kolejna aktualizacja, ale solidny krok naprzód w budowaniu platformy do zaawansowanej automatyzacji kodowania. OpenAI skupia się na trzech kluczowych filarach: bezpieczeństwie, ekosystemie i użyteczności. Najnowsza wersja wprowadza dynamiczne żądania uprawnień w runtime, ulepsza zarządzanie pluginami i znacząco poprawia wydajność serwera aplikacji. Dla developerów oznacza to większą elastyczność i mniej problemów technicznych.

    Dynamiczne uprawnienia: agent pyta o pozwolenie

    Jedna z najciekawszych nowości to wbudowane narzędzie request_permissions. Do tej pory Codex wymagał predefiniowanego zestawu uprawnień przy uruchomieniu. Jeśli w trakcie pracy agent potrzebował dostępu do nowego zasobu, mógł po prostu przestać działać.

    Teraz to się zmienia. Działający agent może w trakcie wykonywania zadania poprosić użytkownika o dodatkowe uprawnienia, np. dostęp do konkretnego katalogu, połączenia sieciowego czy uruchomienie zewnętrznego polecenia. To rozwiązanie przypomina systemy uprawnień znane z nowoczesnych mobilnych systemów operacyjnych.

    Dlaczego to ważne? Zwiększa płynność pracy. Zamiast przewidywać każdy scenariusz w konfiguracji, możemy zacząć zadanie z podstawowym zestawem uprawnień, a Codex poprosi o więcej w miarę potrzeb. To duży krok w stronę bardziej interaktywnej i opartej na współpracy automatyzacji.

    Dojrzałość ekosystemu pluginów: odkrywanie i zarządzanie

    Pluginy w Codex zyskują na dojrzałości, co widać w kilku konkretnych ulepszeniach. Po pierwsze, dodano endpoint plugin/uninstall, który wreszcie pozwala na czyste usunięcie niechcianych rozszerzeń. To podstawowa funkcja, której brak był dotkliwy przy zarządzaniu środowiskiem.

    Po drugie, metadane zwracane przez polecenie plugin/list są teraz bogatsze. Mamy więcej informacji o samym pluginie, jego autorze czy wymaganiach. Instalacja jest też bezpieczniejsza, ponieważ weryfikacja autoryzacji następuje już na etapie instalacji, a nie dopiero przy pierwszym uruchomieniu. Te zmiany sprawiają, że zarządzanie wtyczkami przestaje być eksperymentem, a staje się przewidywalną częścią workflow.

    Aplikacje i serwer: poprawki i niezawodność

    Ulepszenia serwera aplikacji (app-server) są skierowane do osób, które używają Codex w zautomatyzowanych pipeline'ach lub integrują go z własnymi narzędziami. Wprowadzono między innymi health checki, które zwiększają niezawodność monitorowania.

    Exec został też przeniesiony na nową, wewnątrzprocesową ścieżkę serwera aplikacji, co zwiększa wydajność i stabilność. Te poprawki sprawiają, że integracja Codex z innymi systemami staje się bardziej niezawodna.

    Bezpieczeństwo i konfiguracja: nowy język polityk

    Bezpieczeństwo i konfiguracja: nowy język polityk

    Bezpieczeństwo sandboxa przeszło spory lifting. Wprowadzono wstępne wsparcie dla konfiguracji profili uprawnień (permission-profile) w pliku config.toml. Jest to istotne dla zespołów korporacyjnych i każdego, kto poważnie traktuje bezpieczeństwo. Daje to administratorom narzędzie do definiowania zasad zgodnych z polityką firmy, bez blokowania produktywnej pracy.

    Konfiguracja wyszukiwania w sieci również została rozbudowana. Nie jest to już prosty przełącznik on/off. Możemy skonfigurować filtry, ustawienia zależne od lokalizacji i inne parametry narzędzia, co pozwala dostosować je do specyficznych potrzeb projektu lub wymogów compliance.

    Poprawki i usprawnienia pod maską

    Wydanie przynosi też zestaw ważnych poprawek rozwiązujących codzienne problemy. Dodano ściślejszą walidację katalogu roboczego przy starcie sandboxa, co powinno zwiększyć stabilność działania.

    Dla użytkowników pluginów istotna jest poprawka gwarantująca, że wtyczki ładują się poprawnie w sesjach TUI. Brzmi to technicznie, ale wcześniej mogło się zdarzyć, że plugin był zainstalowany, lecz nie działał w interfejsie tekstowym.

    Ciekawostką jest dodanie funkcji inspekcji obrazów. Dla użytkowników Windowsa mamy dobrą wiadomość: wydania CLI są teraz publikowane także w menedżerze pakietów winget.

    Podsumowanie: w stronę bardziej responsywnej platformie

    Codex 0.113.0 nie rewolucjonizuje jednej konkretnej funkcji, ale konsekwentnie poprawia fundamenty platformy. Wprowadzenie dynamicznych uprawnień to zmiana filozofii – ze sztywnego agenta na współpracownika, który pyta i dostosowuje się na bieżąco. Dojrzałość zarządzania pluginami oraz istotne ulepszenia serwera aplikacji otwierają nowe możliwości integracji i automatyzacji złożonych procesów.

    Nowe wsparcie dla profili uprawnień to odpowiedź na potrzeby profesjonalnego, zespołowego wykorzystania Codex w środowiskach, gdzie kontrola jest kluczowa. Wszystko to uzupełnia solidna porcja poprawek błędów, dzięki którym codzienna praca z narzędziem staje się po prostu przyjemniejsza. Widać wyraźnie, że projekt open-source Codex CLI ewoluuje w kompletne, robustowe środowisko deweloperskie. Aktualizację można zainstalować standardowo przez npm: npm install -g @openai/[email protected].

  • Codex v0.112.0 wprowadza wzmianki @plugin i zaostrza bezpieczeństwo sandboxów

    Codex v0.112.0 wprowadza wzmianki @plugin i zaostrza bezpieczeństwo sandboxów

    Najnowsza wersja terminalowego asystenta programistycznego od OpenAI, Codex 0.112.0, to solidna aktualizacja skupiająca się na dwóch kluczowych obszarach: wygodzie integracji pluginów i bezpieczeństwie wykonywania narzędzi. Wydanie, które trafiło do użytkowników w marcu 2026 roku, nie przynosi rewolucyjnych zmian w interfejsie, ale za to subtelnie, acz znacząco, usprawnia codzienną pracę z AI w terminalu.

    Głównymi nowościami tej odsłony są możliwość bezpośredniego przywoływania pluginów w czacie za pomocą symbolu @ oraz fundamentalne zmiany w polityce sandboxów, które mają zapobiegać nieautoryzowanym działaniom. To ewolucja wpisująca się w trend rozbudowy ekosystemu Codexa – lekkiego agenta, który zdobył już sporą popularność wśród deweloperów.

    Łatwiejsza integracja: wywołaj plugin w rozmowie za pomocą @

    Jedną z bardziej praktycznych nowości jest funkcja @plugin mentions. Do tej pory korzystanie z funkcjonalności pluginów mogło wymagać pamiętania o specyficznych komendach lub kontekstach. Teraz, w trakcie rozmowy z Codexem w terminalu (TUI), wystarczy wspomnieć o pluginie, używając @nazwa_plugina.

    Na przykład, pisząc „@git jaki jest status mojego repozytorium?”, użytkownik automatycznie załącza kontekst związany z danym pluginem, aplikacją lub umiejętnością (skill). To małe, ale niezwykle przydatne udogodnienie, które sprawia, że praca z wieloma rozszerzeniami staje się bardziej płynna i intuicyjna. Zmiana ta (oznaczona w changelogu jako #13510) bezpośrednio odpowiada na potrzeby użytkowników, którzy chcą szybko przełączać się między różnymi narzędziami bez przerywania flow pracy.

    Poza tym zaktualizowano też katalog modeli w interfejsie TUI. Teraz wybór modelu podczas rozpoczynania sesji lepiej odzwierciedla aktualną ofertę OpenAI.

    Bezpieczeństwo przede wszystkim: nowa polityka sandboxów dla zsh-fork

    Jeśli integracja pluginów to kwestia wygody, to druga główna zmiana dotyczy fundamentów bezpieczeństwa. W wersji 0.112.0 połączono profile uprawnień wykonywalnych z polityką sandboxa na każdą turę (per-turn sandbox policy). To techniczne, ale kluczowe usprawnienie dotyczące wykonywania umiejętności typu zsh-fork.

    W skrócie: kiedy Codex uruchamia narzędzie systemowe lub skrypt, robi to w izolowanym środowisku (sandboxie). Dotychczasowe, oddzielne profile uprawnień zostały teraz scalone z główną polityką sandboxa dla danej operacji. Daje to bardziej spójny, addytywny (czyli kumulujący uprawnienia tylko w razie potrzeby) i przede wszystkim bezpieczniejszy model przyznawania dostępu. Sandbox stał się surowszy i bardziej przewidywalny, co minimalizuje ryzyko nieautoryzowanych działań podczas automatycznego wykonywania poleceń.

    Ta zmiana (o numerze #13496) pokazuje, że twórcy Codexa traktują bezpieczeństwo poważnie, szczególnie w kontekście agenta, który ma bezpośredni dostęp do systemu i może wykonywać polecenia. Jest to niezwykle istotne dla deweloperów i zespołów DevOps, którzy powierzają Codexowi automatyzację wrażliwych części workflow.

    Stabilność i izolacja: poprawki pod maską

    Oprócz dwóch flagowych funkcji, wydanie 0.112.0 naprawia szereg błędów i wzmacnia system. To właśnie te poprawki często decydują o tym, czy narzędzie jest po prostu dobre, czy też można na nim polegać w codziennej pracy.

    • Naprawiono obsługę stanu JS REPL*. REPL (Read-Eval-Print Loop) to interaktywne środowisko do uruchamiania kodu JavaScript, a problemy z zarządzaniem jego stanem mogły prowadzić do niespójnych wyników lub błędów. Teraz funkcja ta działa poprawniej.

    Kluczową poprawką jest też bezpieczne zamykanie serwera (graceful shutdown). Gdy aplikacja serwerowa Codexa otrzymuje sygnał SIGTERM (standardowy sygnał zamknięcia), traktuje go jak naciśnięcie Ctrl-C. Dzięki temu połączenia WebSocket zamykają się w uporządkowany sposób, a nie są gwałtownie przerywane. Pozwala to uniknąć potencjalnego uszkodzenia danych i zapewnia stabilność.

    Wzmocniono także bezpieczeństwo przesyłania obrazów w JS REPL. Funkcja emitImage została „utwardzona” i teraz akceptuje wyłącznie adresy URL zaczynające się od data:. Blokuje to możliwość przesyłania obrazów z zewnętrznych, potencjalnie niebezpiecznych źródeł, zamykając kolejną ewentualną lukę.

    Usprawnienia dla różnych systemów operacyjnych

    Usprawnienia dla różnych systemów operacyjnych

    Codex rozwija się jako narzędzie wieloplatformowe, stąd poprawki dotyczące specyfiki różnych systemów.

    W przypadku Linuxa usprawniono izolację za pomocą bubblewrap (narzędzia do tworzenia sandboxów). Poprawka (#13624) zapewnia, że przestrzenie nazw użytkownika (user namespaces) nie są współdzielone, co gwarantuje silniejszą izolację. Działa to niezawodnie nawet w sytuacjach, gdy Codex jest uruchamiany z uprawnieniami roota, co jest ważne w zaawansowanych scenariuszach DevOps.

    Dla użytkowników macOS naprawiono konfigurację sieci w sandboxie opartym na mechanizmie Seatbelt od Apple. Z kolei w wersji na Linuxa poprawiono ogólne ustawienia sieciowe sandboxa, aby działały bardziej przewidywalnie.

    Jak to wpisuje się w szerszy obraz Codexa?

    Wydanie 0.112.0 to kolejny krok po znaczących aktualizacjach z ostatnich miesięcy.

    Wersja 0.111.0 włączyła domyślnie tryb Fast (szybsze, ale mniej szczegółowe odpowiedzi), dodała dynamiczne importy w JS REPL i rozszerzyła możliwości pracy z obrazami. Z kolei 0.110.0 była dużą zmianą, wprowadzającą cały system pluginów z umiejętnościami i konektorami, trwały przełącznik trybu Fast, ulepszone „wspomnienia” (memories) oraz liczne poprawki stabilności.

    Codex ewoluuje z prostego, tekstowego bota do kodowania w pełnoprawny ekosystem. Kolejne wersje, jak 0.113.0, rozbudowują go dalej o zaawansowane przepływy pracy z pluginami.

    • Podsumowując*, Codex v0.112.0 to aktualizacja stawiająca na praktyczność i bezpieczeństwo. Wprowadzenie wzmianek @plugin upraszcza interakcję z rosnącą biblioteką rozszerzeń, czyniąc terminalowego asystenta bardziej elastycznym. Jednocześnie głębokie przebudowanie polityki sandboxów dla zsh-fork oraz liczne poprawki stabilności świadczą o dojrzałości projektu.

    Choć zmiany te nie rzucają się w oczy od razu, to właśnie takie udoskonalenia – poprawiające codzienną ergonomię i budujące zaufanie do bezpieczeństwa wykonywanych poleceń – są często najcenniejsze. Dla deweloperów, szczególnie tych zajmujących się web developmentem, AI i automatyzacją DevOps, Codex 0.112.0 oferuje płynniejsze i znacznie pewniejsze środowisko do „vibe codingu” bez wychodzenia z terminala.

  • Codex 0.111.0: Szybszy Tryb, Lepsze Wtyczki i Usprawnione Praca z Obrazami

    Codex 0.111.0: Szybszy Tryb, Lepsze Wtyczki i Usprawnione Praca z Obrazami

    OpenAI kontynuuje rozwój swojego narzędzia Codex, wprowadzając ulepszenia, które bezpośrednio przekładają się na efektywność pracy programistów. To nie są drobne poprawki, ale zmiany dotykające kluczowych obszarów: wydajności, rozszerzalności i integracji.

    Istotne są ulepszenia w systemie wtyczek oraz nowe możliwości dla programistów JavaScript. Dla osób pracujących z web developmentem i vibe codingiem, te aktualizacje mogą oznaczać wyraźny skok w komforcie codziennych zadań.

    Lepsza Integracja Wtyczek: Model Wie, Co Ma Do Dyspozycji

    To może być najważniejsza, choć mniej widowiskowa, zmiana w ostatnim wydaniu. System pluginów w Codex zyskał na inteligencji. Od teraz, na początku każdej sesji, model jest informowany o tym, jakie wtyczki (MCP, aplikacje, umiejętności) są aktywne i gotowe do użycia.

    Dlaczego to takie istotne? Wcześniej model mógł nie mieć pełnej świadomości dostępnych narzędzi. Deweloper musiał czasem ręcznie "podpowiedzieć" asystentowi, że może skorzystać z konkretnej wtyczki. Teraz Codex robi to automatycznie. Ta poprawiona odkrywalność wtyczek (enhanced plugin discovery) oznacza płynniejszą pracę.

    Jeśli masz zainstalowane wtyczki do łączenia się z bazą danych, zarządzania serwerem czy analizy logów, model od razu wie, że może z nich skorzystać. To redukuje niepotrzebne dialogi i pozwala od razu przejść do rozwiązywania problemu. Dla workflow dev ops, gdzie integracja z zewnętrznymi systemami jest kluczowa, to ogromne ułatwienie.

    Ulepszenie to, śledzone pod numerem #13433, stanowi krok w stronę prawdziwie kontekstowego asystenta, który rozumie nie tylko Twój kod, ale także ekosystem narzędzi, w jakim pracujesz.

    js_repl Uczy Się Importować: Większa Elastyczność w Pracy z JavaScript

    Dla programistów JavaScript i Node.js mała perełka. Repl JavaScript (`js_repl`) zyskał możliwość dynamicznego importowania lokalnych plików .js i .mjs**.

    W praktyce co to daje? Wyobraź sobie, że pracujesz nad projektem i masz w przestrzeni roboczej zestaw pomocniczych funkcji czy konfiguracji. Wcześniej, chcąc je przetestować lub użyć w interaktywnej sesji REPL, musiałeś je kopiować lub przepisywać. Teraz możesz po prostu zaimportować.

    To brzmi technicznie, ale znacząco wspiera styl pracy "vibe coding" – swobodne, iteracyjne eksperymentowanie z kodem. Pozwala szybko testować fragmenty skryptów, korzystać z narzędzi budujących z poziomu REPL-a i generalnie lepiej integrować interaktywną sesję z resztą projektu. Zmiana (o numerze #13437) pokazuje, jak Codex ewoluuje, by lepiej wspierać realne, codzienne środowisko programistyczne, a nie być tylko odizolowanym chatem.

    Podsumowanie

    Ostatnie aktualizacje Codexa stawiają na świadomość kontekstu i gładszą integrację. Informowanie modelu o wtyczkach od ręki eliminuje zbędne tarcie. Możliwość importowania lokalnych skryptów w js_repl to konkretne ułatwienie dla developerów JavaScript.

    Razem te zmiany nie rewolucjonizują narzędzia, ale wyraźnie je polerują i dopasowują do faktycznych potrzeb programistów pracujących w nowoczesnym stosie technologicznym. Pokazują kierunek, w którym podążają asystenci programistyczni: nie tylko generują kod, ale stają się centralnymi, inteligentnymi hubami, które rozumieją cały ekosystem dewelopera – jego narzędzia, pliki i workflow. Dla zespołów zajmujących się web developmentem i dev ops, to kolejny krok w stronę bardziej zautomatyzowanego i płynnego procesu tworzenia oprogramowania.