Wydana 16 marca 2026 roku wersja Codex CLI 0.115.0 przynosi dwie funkcje mocno wyczekiwane przez społeczność: pełną inspekcję obrazów w oryginalnej rozdzielczości oraz transkrypcję audio w czasie rzeczywistym. To nie są drobne poprawki, lecz narzędzia, które mogą zmienić sposób, w jaki deweloperzy pracują z kodem generowanym przez AI, szczególnie w obszarach frontendu i współpracy zespołowej.
Pełna rozdzielczość dla precyzyjnej analizy wizualnej
Kluczową nowością jest zaawansowana inspekcja obrazów. Obsługiwane modele AI mogą teraz żądać przesyłania plików w pełnej, oryginalnej rozdzielczości. Dzieje się to poprzez komendę view_image lub wywołanie codex.emitImage(..., detail: "original"). Skąd potrzeba takiej precyzji?
Przed tym wydaniem model często analizował zminiaturyzowane wersje screenshotów czy diagramów. Teraz, otrzymując pełny plik, może dostrzec drobne szczegóły – odstępy między elementami UI, dokładne odcienie kolorów czy mały tekst na schematach. To istotne ulepszenie dla tzw. „vibe codingu”, gdzie na podstawie zrzutu ekranu generowany jest odpowiadający mu kod HTML i CSS.
Praca z interfejsem stała się też płynniejsza. Obrazy można teraz po prostu przeciągnąć i upuścić w prompt lub bezpośrednio w terminalu Codex. Dla frontendowców oznacza to szybsze prototypowanie i wierniejsze odwzorowywanie projektów, a dla osób pracujących z dokumentacją techniczną – możliwość konwersji skomplikowanych diagramów architektonicznych w czytelny szkic kodu.
Transkrypcja w czasie rzeczywistym i lepsza współpraca
Druga wielka zmiana dotyczy sesji audio. Codex CLI wprowadza dedykowany tryb transkrypcji w sesjach WebSocket w czasie rzeczywistym. W praktyce umożliwia to płynne przetwarzanie na żywo dyktowanych komend, pomysłów czy notatek podczas pair programmingu z asystentem AI.
Co więcej, wprowadzono ujednolicony system konfiguracji [realtime] oraz funkcję przekazywania sesji (handoff) w wersji 2 poprzez narzędzie codex. To świetna wiadomość dla zespołów DevOps lub osób pracujących nad dużymi monorepozytoriami. Można teraz zacząć sesję w terminalu na serwerze, a następnie płynnie przejąć ją w edytorze VS Code lub Cursor, kontynuując pracę bez utraty kontekstu.
Drobne, ale użyteczne ulepszenia obejmują też nowe funkcje w js_repl, takie jak codex.cwd i codex.homeDir, oraz trwałe zapisywanie referencji do narzędzi i obrazów między komórkami kodu. Serwer aplikacji w wersji 2 otrzymał potężny zestaw zdalnych wywołań procedur (RPC) dla operacji na systemie plików, co otwiera drogę do bardziej złożonych, zdalnie sterowanych workflowów.
Korzyści i obawy użytkowników
Dla kogo te zmiany są najważniejsze? Web deweloperzy zyskają narzędzie do błyskawicznego tłumaczenia designu na kod. Architekci i inżynierowie DevOps mogą efektywniej współpracować, dzieląc się sesjami i kontekstem. Skraca to czas konfiguracji zadań wykorzystujących multimodalne agenty AI, pozwalając skupić się na kreatywnej pracy zamiast na walce z narzędziami.
Nie wszystko jednak wygląda idealnie. Wciąż pojawiają się zgłoszenia użytkowników dotyczące niestabilności usługi Codex Cloud. Problem z zadaniami typu „remote compact”, wymagającymi rozpoczynania nowych sesji, został już zidentyfikowany (Issue #14860). Przypomina to, że mimo bardzo szybkiego tempa wydań (wersja 0.116.0 pojawiła się zaledwie trzy dni później), niektóre obszary – zwłaszcza chmurowe – wciąż wymagają dopracowania pod kątem niezawodności.
Podsumowanie
Codex CLI 0.115.0 to wydanie, które konkretnie odpowiada na potrzeby deweloperów pracujących z rzeczywistymi danymi wizualnymi oraz w dynamicznym środowisku zespołowym. Zamiast ogólnych obietnic otrzymujemy konkretne funkcje: precyzyjną inspekcję obrazów i płynną transkrypcję. To kroki w stronę dojrzałej platformy, w której AI staje się naturalnym, a nie kłopotliwym elementem workflow. Choć wyzwania związane ze stabilnością usług chmurowych pokazują, że droga jest jeszcze długa, obrany kierunek wydaje się bardzo obiecujący.







