Tag: Python

  • Perplexity rewolucjonizuje wyszukiwanie agentowe: architektura Search as Code

    Perplexity rewolucjonizuje wyszukiwanie agentowe: architektura Search as Code

    Perplexity ogłosiła nową architekturę wyszukiwania – Search as Code (SaC) – która rezygnuje z sztywnych interfejsów API na rzecz programowalnych komponentów. Modele AI nie tylko wysyłają zapytania do czarnej skrzynki; teraz same budują potok wyszukiwania za pomocą generowanego kodu Pythona, co daje im większą kontrolę nad każdym etapem przetwarzania informacji. To zmiana, która pozwala agentom AI na przeprowadzanie setek, a nawet tysięcy operacji wyszukiwania w ramach jednego przebiegu wnioskowania.

    Kluczowe informacje o Search as Code

    • Perplexity wprowadza Search as Code w ramach Agent API oraz w produkcie Computer, zastępując wcześniejsze interfejsy typu function calling i MCP.
    • Modele AI generują kod Pythona, który orkiestruje wyszukiwanie – od pobierania danych, przez ranking, filtrowanie, aż po fan-outy – i wykonują go w izolowanym środowisku.
    • Agent uzyskuje dostęp do stanów pośrednich, takich jak listy kandydatów czy sygnały rankingowe, co pozwala na dynamiczną optymalizację strategii podczas realizacji zadania.
    • Architektura SaC wprowadza nowy standard wydajności kosztowej w benchmarkach wyszukiwania agentowego, znacznie poprawiając precyzję i redukując zbędne obciążenie kontekstu modelu.

    Czym jest Search as Code?

    Termin „Search as Code” może budzić skojarzenia z narzędziami do przeszukiwania repozytoriów (jak Google Code Search czy Sourcegraph), jednak w kontekście ogłoszenia Perplexity oznacza coś innego. SaC to architektura, w której wyszukiwanie nie jest wywoływane jako gotowy serwis przez funkcję API czy protokół MCP, lecz składane na żądanie przez model AI z atomowych prymitywów udostępnionych w SDK. Model, korzystając z generowania kodu, decyduje, jak skonfigurować retrieval, jakie filtry zastosować, czy uruchomić wiele równoległych zapytań i jak połączyć wyniki. Cały proces odbywa się w bezpiecznym środowisku, bez udziału zewnętrznych interfejsów komunikacyjnych.

    Tradycyjne systemy wyszukiwania były projektowane dla ludzi: użytkownik wpisywał zapytanie, a silnik zwracał stronę wyników (SERP). Gdy modele AI zaczęły korzystać z tych systemów, dziedziczyły ten sam kontrakt – podaj zapytanie, otrzymaj przetworzoną listę dokumentów. Dla prostych zadań to wystarczało, ale dla złożonych, wieloetapowych zadań agentowych stało się to wąskim gardłem.

    Dlaczego tradycyjne API przestało wystarczać?

    Monolityczne API narzuca modelowi sztywną logikę potoku wyszukiwania, co prowadzi do trzech powtarzających się problemów:

    1. Zbyt gruby kontekst – gdy agent potrzebuje jednej precyzyjnej informacji, a pipeline nastawiony jest na wysoką kompletność, do kontekstu trafia wiele nieistotnych danych, co zwiększa koszty i szum.
    2. Niewykorzystana wiedza dziedzinowa – model może rozpoznać, że dla danego zadania lepiej połączyć sygnały leksykalne z semantycznymi, nadać priorytet konkretnym źródłom lub agregować wyniki po określonym kluczu, ale nie ma możliwości przekazania tych wskazówek do API.
    3. Nieefektywna kontrola przepływu – agent nie może dostosować logiki potoku do specyfiki zadania, co prowadzi do nieoptymalnych wyników.

    Źródła

  • OpenAI Codex 0.115.0: Pełna kontrola nad agentami i nowa inspekcja wizualna

    OpenAI Codex 0.115.0: Pełna kontrola nad agentami i nowa inspekcja wizualna

    Marzec 2026 przyniósł ważną aktualizację dla programistów korzystających z zaawansowanych systemów AI. OpenAI wydało Codex w wersji 0.115.0, skupiając się na dwóch kluczowych obszarach: lepszej kontroli nad zespołem agentów i rozszerzeniu możliwości wizualnych. To nie są kosmetyczne poprawki, lecz znaczące ulepszenia fundamentów platformy, która już teraz zdążyła zmienić podejście do tzw. agentowego kodowania (agentic coding).

    Wydanie przynosi pełną inspekcję obrazów w wysokiej rozdzielczości, inteligentniejsze procesy zatwierdzania zmian oraz nowy Python SDK do pracy z systemem plików. Dla użytkowników oznacza to płynniejszą, bardziej wydajną i po prostu sprawniejszą współpracę z AI.

    Inspekcja wizualna w pełnej rozdzielczości

    Jedną z najbardziej wyczekiwanych nowości jest pełna obsługa obrazów. Do tej pory analiza elementów wizualnych w workflow Codexa mogła mieć ograniczenia. Wersja 0.115.0 wprowadza natywne wsparcie dla funkcji view_image oraz codex.emitImage, pozwalając agentom na szczegółowe przeglądanie i analizę grafiki w wysokiej rozdzielczości.

    To ważne ulepszenie dla każdego, kto pracuje nad interfejsami użytkownika, grafiką generatywną czy aplikacjami przetwarzającymi materiały wizualne. Agent może teraz dokładnie „przyjrzeć się” mockupowi, diagramowi architektonicznemu czy zrzutowi ekranu i na tej podstawie podjąć trafniejsze decyzje dotyczące kodu lub sugerowanych zmian.

    Smart Approvals: Strażnicy bezpiecznego kodu

    Najciekawszym elementem nowej wersji jest system Smart Approvals. To rozwiązanie problemu, który pojawia się przy pracy z wieloma agentami działającymi równolegle – kwestii tego, kto i jak zatwierdza ich propozycje.

    OpenAI wprowadza koncepcję „subagentów-strażników” (guardian subagents). Ich rolą jest usprawnienie procesów code review. Zamiast ręcznego zatwierdzania każdej zmiany, deweloper może skonfigurować przepływ, w którym pewne typy modyfikacji – na przykład zmiany w kluczowych plikach konfiguracyjnych czy wrażliwych fragmentach kodu – są automatycznie kierowane do dedykowanego agenta-strażnika. Dokonuje on wstępnej weryfikacji przed przedstawieniem propozycji człowiekowi.

    Co ważne, poprawiono też dziedziczenie reguł piaskownicy (sandbox) dla subagentów, co zwiększa bezpieczeństwo całego systemu. Narzędzie wait_agent zostało również przemianowane dla zachowania spójności z spawn_agent i send_input.

    Nowy Python SDK i ulepszone sesje WebSocket

    Nowy Python SDK i ulepszone sesje WebSocket

    Dla deweloperów stawiających na automatyzację i integracje, nowy Python SDK do filesystem RPCs w wersji 2 to spora wygoda. Umożliwia on programowe wykonywanie operacji na plikach bezpośrednio z poziomu skryptów Pythona, co otwiera drogę do tworzenia zaawansowanych, zautomatyzowanych pipeline'ów z Codexem w roli głównej.

    Równolegle ulepszono sesje komunikacji w czasie rzeczywistym przez WebSocket. Dodano dedykowany tryb transkrypcji, ujednolicono konfigurację sesji pod kluczem [realtime] oraz wprowadzono możliwość płynnego przekazania sesji (handoff) w wersji 2 za pomocą narzędzia codex. To wszystko sprawia, że praca interaktywna z agentem staje się szybsza i mniej podatna na problemy z połączeniem.

    Ulepszenia dla deweloperów: JS REPL, TUI i integracje

    W codziennej pracy przydadzą się też mniejsze, ale istotne ulepszenia. Środowisko JS REPL (Read-Eval-Print Loop) zostało wzbogacone o dostęp do codex.cwd i codex.homeDir, a referencje do codex.tool(...) oraz codex.emitImage(...) są teraz trwale zachowywane między komórkami kodu. Pozwala to na budowanie bardziej złożonych i interaktywnych skryptów.

    Poprawiono także wydajność tekstowego interfejsu użytkownika (TUI) oraz samego JS REPL. Wprowadzono nowy przepływ wyszukiwania narzędzi (tool-search flow) w integracjach aplikacji, co ułatwia odkrywanie funkcjonalności. Współpraca z MCP (Model Context Protocol) i elicitation jest teraz bardziej odporna na błędy, a lokalne proxy lepiej obsługuje połączenia HTTP/1 CONNECT.

    Instalacja i środowisko wykonawcze

    Instalacja i środowisko wykonawcze

    Aktualizację do wersji 0.115.0 można zainstalować standardowo przez npm, komendą:

    $ npm install -g @openai/[email protected]

    Warto pamiętać, że Codex jest zoptymalizowany pod kątem pracy z zaawansowanymi modelami agentowymi OpenAI, takimi jak GPT-5.3-Codex (o oknie kontekstowym 272K tokenów) czy GPT-5.4 (aż 1M tokenów). Te modele, w przeciwieństwie do swoich wersji w ChatGPT, są specjalnie dostrojone do długich, wieloetapowych zadań programistycznych w środowisku CLI, aplikacji desktopowej czy rozszerzeń IDE.

    Pod maską Codex opiera się na solidnych fundamentach: plikach konfiguracyjnych config.toml, systemie piaskownic i zatwierdzeń, dokumentacji AGENTS.md oraz protokole MCP. Bezpieczeństwo na poziomie systemu operacyjnego zapewniają mechanizmy takie jak Seatbelt na macOS czy Landlock i seccomp na Linuxie.

    W kierunku stabilnej platformy agentowej

    Wydanie 0.115.0 to nie tylko nowe funkcje, ale także zestaw poprawek stabilizujących platformę. Przywrócono poprawne działanie codex exec --profile w zakresie przywracania ustawień profilu. Usprawniono normalizację nazw narzędzi w MCP, co zwiększa bezpieczeństwo, oraz zachowywanie parametrów tool_params w promptach. To drobne, ale istotne zmiany, które składają się na bardziej przewidywalne i niezawodne środowisko.

    Ta aktualizacja wpisuje się w szybki cykl rozwoju Codexa. Zaraz po niej, 20 marca, ukazała się wersja 0.116.0 z logowaniem przez kod urządzenia do ChatGPT, ulepszeniami pluginów i hookami na prompty użytkownika. Widać wyraźnie, że OpenAI traktuje Codex jako strategiczną platformę dla przyszłości programowania wspomaganego przez AI.

    Podsumowanie

    Codex v0.115.0 to krok w kierunku dojrzałej platformy do orkiestracji agentów AI. Nie chodzi już tylko o to, by AI napisało fragment kodu, ale o zarządzanie zespołem wyspecjalizowanych agentów, którzy bezpiecznie i pod nadzorem człowieka mogą realizować złożone zadania.

    Wprowadzenie Smart Approvals z guardian subagents, pełna inspekcja wizualna oraz nowy Python SDK to odpowiedź na realne potrzeby deweloperów wchodzących w erę programowania agentowego. Poprawki wydajnościowe i stabilizacyjne cementują pozycję Codexa jako profesjonalnego narzędzia. Wygląda na to, że centrum dowodzenia dla AI w software developmencie właśnie otrzymało potężny upgrade.