Kategoria: Sztuczna Inteligencja

  • Adaptive w Windsurf: Inteligentny router modeli oszczędza twoje tokeny

    Adaptive w Windsurf: Inteligentny router modeli oszczędza twoje tokeny

    Windsurf wprowadził nową funkcję o nazwie Adaptive. Jest to inteligentny router modeli, który pomaga zarządzać miesięcznym limitem tokenów. Zmiana ta wpływa na sposób, w jaki środowisko korzysta z dostępnych modeli językowych, i jest już dostępna dla wszystkich użytkowników.

    Jak działa Adaptive w Windsurf

    Zasada działania Adaptive jest prosta. Po wybraniu tej opcji w menu, system automatycznie dobiera model AI (np. GPT, Claude lub Gemini), który najlepiej poradzi sobie z danym zadaniem. Może to być poprawianie błędów, pisanie dokumentacji czy zmiana struktury kodu.

    Najważniejszą cechą Adaptive jest stała stawka za token. Niezależnie od tego, który model zostanie wybrany przez system do wykonania zadania, koszt pozostaje taki sam. Pozwala to systemowi na używanie lżejszych modeli do prostych zapytań, co sprawia, że limit tokenów użytkownika wyczerpuje się wolniej.

    Przejrzystość kosztów i kontrola w menu modeli

    Przy okazji premiery Adaptive, twórcy Windsurf odświeżyli menu wyboru modeli. Użytkownicy zyskali większą kontrolę nad tym, ile zasobów zużywają. Po najechaniu myszką na konkretny model pojawiają się teraz szczegółowe stawki za tokeny wejściowe (input), wyjściowe (output) oraz odczyt z pamięci podręcznej (cache read).

    W interfejsie dodano również dwa nowe elementy:

    • Licznik czasu pamięci podręcznej (prompt cache timer): informuje, jak długo kontekst rozmowy jest przechowywany w pamięci.
    • Licznik tokenów przy odpowiedziach: każda wiadomość od AI pokazuje teraz dokładną liczbę zużytych jednostek.

    Dzięki temu programiści widzą koszt każdej operacji bezpośrednio w oknie czatu.

    Kontekst aktualizacji i poprawki techniczne

    Wprowadzenie Adaptive to kolejny etap zmian w zarządzaniu zasobami w Windsurf. Wcześniej w IDE pojawił się podgląd limitów (quota), a nowa funkcja ma pomagać w ich mądrzejszym wykorzystywaniu.

    W procesie wdrażania wyeliminowano też błędy techniczne. Jedna z ostatnich poprawek usunęła problem, przez który użytkownicy nie mogli zmienić modelu na inny po wysłaniu pierwszego zapytania w trybie Adaptive.

    Co to oznacza dla programistów

    Dla osób zajmujących się tworzeniem stron, rozwiązaniami AI czy operacjami DevOps, nowości te oznaczają mniej pracy przy pilnowaniu limitów. System sam dba o to, by nie marnować drogich zasobów na proste pytania.

    Warto dodać, że ceny za dodatkowe użycie (extra usage) są teraz rozliczane według stawek API. Zmiany objęły również użytkowników planu Max, którzy otrzymali zmodyfikowane limity, co pozwala im na dłuższą pracę bez przerw.

    Adaptive w Windsurf pokazuje kierunek, w którym rozwijają się asystenci kodowania. Zamiast używać najpotężniejszych modeli do każdego przecinka w kodzie, systemy zaczynają dopasowywać narzędzie do trudności problemu. Pozwala to programistom pracować płynniej, bez obaw o nagłe wyczerpanie dostępnych kredytów w połowie projektu.


    Źródła

  • Google uwalnia potencjał sztucznej inteligencji na Macu. Gemini for Mac już oficjalnie dostępne

    Google uwalnia potencjał sztucznej inteligencji na Macu. Gemini for Mac już oficjalnie dostępne

    Google udostępniło natywną aplikację Gemini na komputery Mac. Program nie jest jedynie kopią wersji przeglądarkowej, ale został napisany od podstaw w języku Swift, co pozwala na integrację z systemem macOS. Użytkownicy mogą korzystać z darmowej wersji z limitami lub wybrać płatne pakiety, takie jak AI Plus, AI Pro czy AI Ultra.

    Aplikacja jest dostępna do pobrania na stronie gemini.google/mac/. Google zdecydowało się ominąć App Store, co pozwala firmie wydawać aktualizacje bez czekania na weryfikację Apple. Do działania wymagany jest komputer z procesorem Apple Silicon oraz system macOS 15 (Sequoia) lub nowszy. Osoby korzystające ze starszych wersji systemu lub komputerów z procesorami Intel nie mogą zainstalować tej wersji.

    Szybkość i analiza treści na ekranie

    Główną zaletą aplikacji jest łatwy dostęp, przypominający działanie systemowej wyszukiwarki Spotlight. Program można wywołać skrótem klawiaturowym Option + Spacja, co otwiera małe okno do szybkich pytań. Pełny czat uruchamia się kombinacją Option + Shift + Spacja. Ikona Gemini jest widoczna w Docku oraz na górnym pasku menu.

    Aplikacja potrafi analizować to, co aktualnie wyświetla się na monitorze. Po włączeniu odpowiednich uprawnień w ustawieniach prywatności i dostępności, Gemini widzi otwarte dokumenty PDF, arkusze kalkulacyjne czy kod w edytorze. Dzięki temu asystent może streścić tekst, wyjaśnić skomplikowane fragmenty danych lub zasugerować poprawki w projekcie graficznym bez konieczności ręcznego kopiowania treści.

    Narzędzia dla twórców i programistów

    Gemini na Maca oferuje te same funkcje, co wersja mobilna i przeglądarkowa. Użytkownicy mogą korzystać z modelu Imagen 3 do generowania obrazów oraz narzędzia Veo do tworzenia krótkich materiałów wideo. Program ułatwia pracę nad projektami kreatywnymi i technicznymi.

    Programiści i osoby pracujące z dużą ilością danych mogą przesyłać pliki bezpośrednio do aplikacji. Gemini pomaga w pisaniu kodu, tłumaczeniu tekstów i planowaniu zadań. Dzięki temu, że aplikacja działa lokalnie jako natywny program, reaguje szybciej niż interfejs w przeglądarce internetowej.

    Konkurencja na rynku

    Wprowadzenie tej aplikacji to ruch wymierzony w ChatGPT Desktop oraz Microsoft Copilot. Google postawiło na ścisłe połączenie asystenta z systemem operacyjnym, co ma przyciągnąć osoby na co dzień korzystające z komputerów Apple.

    Oficjalna premiera odbyła się 16 kwietnia 2024 roku, kończąc okres zamkniętych testów. Od pierwszych zapowiedzi aplikacja została rozbudowana o stabilną analizę ekranu i obsługę plików. Google regularnie dodaje nowe funkcje, dostosowując narzędzie do aktualnych możliwości modeli językowych.

    Dostępność i wymagania

    Gemini na Maca jest skierowane do osób, które chcą mieć dostęp do sztucznej inteligencji bez przełączania się między kartami przeglądarki. Choć wymóg posiadania najnowszego systemu i procesora Apple Silicon ogranicza grono odbiorców, zapewnia to płynne działanie programu.

    Aplikacja obsługuje język polski oraz wszystkie inne języki dostępne wcześniej w wersji mobilnej. Wybór między instalacją aplikacji a korzystaniem z przeglądarki zależy od tego, jak bardzo asystent ma być zintegrowany z codziennymi zadaniami. Google promuje rozwiązanie systemowe jako szybszy i wygodniejszy sposób pracy na Macu.

  • Claude Opus 4.7 gotowy do premiery. będzie wspierać nowe narzędzie do projektowania stron

    Claude Opus 4.7 gotowy do premiery. będzie wspierać nowe narzędzie do projektowania stron

    Anthropic przygotowuje się do premiery swojego najnowszego modelu – Claude Opus 4.7. Nie jest to całkowita zmiana architektury, a raczej aktualizacja wersji 4.6. Model wprowadza zmiany przydatne głównie dla programistów i projektantów pracujących nad złożonymi zadaniami. Premiera zbiega się w czasie z informacjami o nowym narzędziu do automatycznego tworzenia stron internetowych, prezentacji i prototypów.

    Model będzie dostępny bezpośrednio w aplikacjach Claude oraz przez API, Amazon Bedrock i Google Cloud Vertex AI. Ceny nie ulegną zmianie: 5 dolarów za milion tokenów wejściowych i 25 dolarów za milion tokenów wyjściowych. W systemach deweloperskich model otrzyma identyfikator anthropic-claude-opus-4-7.

    Możliwości nowego modelu

    Claude Opus 4.7 został przygotowany głównie pod kątem inżynierii oprogramowania. Użytkownicy mają rzadziej nadzorować model przy trudnych zadaniach programistycznych. System lepiej radzi sobie z długimi procesami, dokładniej trzyma się instrukcji i samodzielnie sprawdza kod przed zwróceniem wyniku.

    Aktualizacja obejmuje też funkcje wizualne. Model przetwarza obrazy w wyższej rozdzielczości, co ma pomagać przy projektowaniu interfejsów użytkownika, slajdów i dokumentów technicznych. W testach przeprowadzonych przez partnerów Anthropic, wersja 4.7 uzyskiwała wyższe noty niż Claude 4.6.

    Bezpieczeństwo i praca z kodem

    Ważną częścią wdrożenia są kwestie bezpieczeństwa. Brytyjski instytut UK AI Safety Institute sprawdzał model pod nazwą "Mythos Preview" pod kątem potencjalnych zagrożeń w sieci. Z tego powodu możliwości Claude Opus 4.7 w zakresie cyberbezpieczeństwa mogą być ograniczone przez automatyczne filtry, które blokują zapytania o wysokim ryzyku.

    Dla osób zajmujących się tworzeniem stron i aplikacji istotne jest okno kontekstowe sięgające 1 000 000 tokenów. Pozwala to modelowi na analizę bardzo dużych projektów i długotrwałą pracę bez utraty wątku. Jest to przydatne dla agentów AI, którzy samodzielnie naprawiają błędy w kodzie lub prowadzą research.

    Wpływ na rynek

    Claude Opus 4.7 pokazuje, że modele AI przestają być tylko prostymi czatbotami. Zaczynają pełnić funkcję samodzielnych narzędzi zdolnych do prowadzenia spójnych działań przez wiele godzin.

    Lepsza analiza obrazu i wyczucie estetyki łączą się z planami Anthropic dotyczącymi generatora stron i prototypów sterowanego głosem lub tekstem. Claude Opus 4.7 ma być silnikiem tych rozwiązań, co stawia go w roli konkurenta dla serwisów takich jak Gamma czy narzędzi projektowych od Google.

    Programiści mogą spodziewać się mniejszej liczby błędów i szybszego tempa pracy nad projektami. Zamiast poprawiać każdą linię kodu, użytkownik będzie mógł skupić się na architekturze systemu, podczas gdy model zajmie się wieloetapową realizacją zadania. To zmiana w stronę modelu pracy, w którym inżynier zarządza procesami wykonywanymi przez sztuczną inteligencję.


    Źródła

  • Cursor 3 definiuje nową erę rozwoju: od IDE do fabryki oprogramowania sterowanej agentami

    Cursor 3 definiuje nową erę rozwoju: od IDE do fabryki oprogramowania sterowanej agentami

    Środowisko programistyczne Cursor przechodzi właśnie głęboką transformację. Wersja 3 to nie kolejna aktualizacja, ale fundamentalna zmiana paradygmatu – przejście od klasycznego IDE do zunifikowanej przestrzeni roboczej zaprojektowanej od podstaw do pracy z „flotą” agentów AI. To odpowiedź na rodzącą się trzecią erę rozwoju oprogramowania, w której autonomiczne agenty piszą niemal cały kod, a rolą programisty staje się zarządzanie procesem i review.

    Okno agentów: centralne stanowisko dowodzenia

    Sercem Cursor 3 jest nowe Okno Agentów (Agents Window), dostępne przez Cmd+Shift+P. To dedykowany panel boczny, który konsoliduje wszystkie agenty – lokalne, chmurowe, zdalne przez SSH czy te działające w worktrees – w jednym, przejrzystym interfejsie. Kluczową innowacją jest możliwość równoległego uruchamiania wielu agentów. Można np. uruchomić jednego agenta do eksploracji nowej architektury, drugiego do implementacji backendu, a trzeciego do pisania testów – wszystko jednocześnie, nawet w różnych repozytoriach.

    Interfejs jest z natury wielorepozytoryjny, co ułatwia współpracę człowieka i agentów w rozproszonych projektach. Co ważne, Cursor pozwala na płynne „przekazywanie” sesji agenta między środowiskami. Długotrwałe zadanie można przenieść z lokalnego komputera do chmury, aby działało, gdy laptop jest zamknięty. Gdy zaś potrzebne są szybkie iteracje i testy na własnej maszynie, sesję chmurową można pobrać lokalnie, korzystając z wydajnego modelu Composer 2.

    Tryb projektowania i kafelki: precyzja i wielozadaniowość

    Dwa inne flagowe elementy to Tryb Projektowania (Design Mode) i Karty Agentów (Agent Tabs). Tryb Projektowania, aktywowany skrótem Cmd+Shift+D, pozwala na bezpośrednią interakcję z UI w przeglądarce. Można zaznaczać obszary, dodawać elementy do chatu i dawać agentom precyzyjne wskazówki wizualne, co znacząco przyspiesza iteracje nad frontendem.

    Karty Agentów w edytorze umożliwiają natomiast przeglądanie wielu konwersacji jednocześnie – obok siebie lub w siatce. Uwalnia to programistę od uciążliwego przełączania się między zakładkami i pozwala śledzić postępy w różnych wątkach pracy. W najnowszej aktualizacji 3 wprowadzono też układ kafelkowy (tiled layout) w samym Oknie Agentów, co dodatkowo ułatwia multitasking i porównywanie wyników pracy różnych agentów.

    Samodzielne uczenie się i bezpieczeństwo w centrum

    Samodzielne uczenie się i bezpieczeństwo w centrum

    Cursor 3 to nie tylko interfejs. W parze z nim idą potężne funkcje automatyzacji. Bugbot, narzędzie do code review, zyskało zdolność do samodzielnego uczenia się (Learned Rules). Analizuje reakcje i komentarze recenzentów w pull requestach, tworząc na tej podstawie reguły, które stopniowo usprawniają przyszłe przeglądy. Te, które się sprawdzają, są automatycznie promowane, a nieskuteczne – wyłączane.

    Dla zespołów priorytetyzujących bezpieczeństwo i kontrolę, Cursor wprowadza samohostowane agenty chmurowe. Działają one wewnątrz własnej infrastruktury użytkownika, zapewniając, że codebase, dane wyjściowe buildów i wrażliwe informacje nigdy nie opuszczają sieci wewnętrznej, podczas gdy agent wykonuje polecenia lokalnie.

    Statystyki wewnętrzne: wizja przyszłości w działaniu

    Statystyki wewnętrzne: wizja przyszłości w działaniu

    Najbardziej wymowna jest wewnętrzna statystyka firmy Cursor. Według niej 35% wewnętrznych pull requestów jest już tworzonych przez autonomiczne agenty chmurowe działające na maszynach wirtualnych. Co więcej, agenty piszą niemal 100% kodu w tych procesach, a deweloperzy skupiają się na dekompozycji problemów, recenzji i udzielaniu feedbacku.

    W marcu 2025 roku użytkowników funkcji autouzupełniania (Tab) było 2,5 raza więcej niż użytkowników agentów. Dziś proporcje się odwróciły – użytkowników agentów jest 2 razy więcej. To pokazuje gwałtowną zmianę w sposobie pracy. Prognozy twórców są śmiałe: większość pracy programistycznej będzie wykonywana przez takie agenty w ciągu najbliższego roku.

    Podsumowanie: od pisania kodu do budowy fabryki

    Cursor 3 nie jest już narzędziem służącym przede wszystkim do pisania kodu. Jak mówią sami twórcy, stał się środowiskiem „pomagającym deweloperom w budowie fabryki, która tworzy ich oprogramowanie”. To przejście od modelu „pokaż i monitoruj” jednego agenta do zarządzania linią produkcyjną, gdzie floty agentów pracują asynchronicznie, a programista włącza się w obieg w odpowiednich momentach – do recenzji, feedbacku i dekompozycji skomplikowanych problemów.

    Dzięki integracji agentów z różnych kanałów (Slack, GitHub, Linear, web, mobile) w jeden spójny interfejs, Cursor 3 redukuje konieczność przełączania kontekstu i oferuje prawdziwie zunifikowane stanowisko pracy. To krok w stronę przyszłości, w której środowisko programistyczne nie tyle asystuje w kodowaniu, co zarządza autonomicznymi procesami wytwórczymi, stając się centrum dowodzenia dla nowej generacji inżynierii oprogramowania.


    Źródła

  • GPT-5.4-Cyber – plotka czy nowy front w defensywnym AI?

    GPT-5.4-Cyber – plotka czy nowy front w defensywnym AI?

    Pojawiające się w sieci doniesienia o modelu GPT-5.4-Cyber budzą spore zainteresowanie, ale też sporo wątpliwości. Według krążących informacji miałaby to być specjalistyczna wersja systemu skupiona na defensywnym cyberbezpieczeństwie, dostępna tylko dla zweryfikowanych firm i badaczy. Dostępne fakty nie potwierdzają jednak, by OpenAI wydało taki osobny produkt. Prawdopodobnie mamy do czynienia z połączeniem kilku różnych inicjatyw firmy.

    Skąd wzięły się te informacje?

    Zamieszanie wynika najpewniej z premiery modelu GPT-5.4, którą OpenAI ogłosiło w marcu 2026 roku. Jest to system przeznaczony do najbardziej złożonych zadań profesjonalnych. Ma on funkcje sterowania systemami operacyjnymi i przeglądarkami, co potwierdzają wyniki w testach OSWorld-Verified i WebArena-Verified. Dodatkowo model posiada okno kontekstowe o wielkości miliona tokenów oraz architekturę typu "Thinking". Te parametry sprawiają, że system nadaje się do zaawansowanej analityki, w tym do zadań związanych z bezpieczeństwem cyfrowym.

    Nazwa "GPT-5.4-Cyber" jest więc najpewniej potocznym określeniem na użycie standardowego modelu GPT-5.4 w kontrolowanych scenariuszach obronnych. Nie jest to nowa, osobna architektura, lecz wykorzystanie istniejącej technologii w konkretnym, wrażliwym celu.

    Przyczyny ograniczonego dostępu

    Wprowadzenie restrykcji w dostępie do zaawansowanych modeli wynika z kwestii bezpieczeństwa. Sztuczna inteligencja w rękach ekspertów od zabezpieczeń pozwala szybciej analizować logi systemowe, wykrywać nietypowe zachowania sieci, zarządzać ryzykiem czy przygotowywać materiały szkoleniowe chroniące przed phishingiem.

    Jednocześnie te same funkcje mogą zostać wykorzystane do automatyzacji ataków, generowania złośliwego oprogramowania lub prowadzenia kampanii socjotechnicznych. Ograniczenie dostępu do sprawdzonych organizacji ma na celu wsparcie obrony przy jednoczesnym utrudnieniu działań przestępczych. Takie działania wpisują się w ramy prawne, takie jak unijny AI Act oraz Cyber Resilience Act, które nakładają na producentów wymóg odpowiedzialnego wdrażania technologii.

    Rynek i rola AI w ochronie danych

    Niezależnie od tego, czy powstanie dedykowana wersja "Cyber", zapotrzebowanie na AI w sektorze bezpieczeństwa rośnie. Firmy zmagają się z brakiem specjalistów, a straty finansowe powodowane przez ataki hakerskie są coraz wyższe.

    W Polsce brakuje przede wszystkim analityków SOC, testerów penetracyjnych i ekspertów od chmury. Model GPT-5.4 generuje o 18% mniej błędów i o 33% rzadziej zmyśla informacje (halucynuje) w porównaniu do wersji GPT-5.2. Dzięki możliwości przetwarzania dużych zbiorów danych system ten może odciążyć zespoły techniczne, działając jako asystent przy codziennych operacjach.

    Podsumowanie

    Informacje o GPT-5.4-Cyber to prawdopodobnie interpretacja możliwości modelu GPT-5.4 połączona z zapowiedziami o selektywnym udostępnianiu narzędzi AI branży cyberbezpieczeństwa. Obecnie nie ma dowodów na istnienie oddzielnego produktu o tej nazwie.

    Widać jednak wyraźny kierunek rozwoju branży. Skuteczna ochrona cyfrowa będzie wymagała korzystania z AI, ale w sposób kontrolowany. Zamiast szukać jednego, dedykowanego narzędzia, firmy i regulatorzy skupiają się na tworzeniu bezpiecznych zasad i ekosystemów, które pozwolą wykorzystać ogólne modele językowe do wzmocnienia systemów obronnych.

  • Google łączy siły: NotebookLM teraz głęboko zintegrowany z aplikacją Gemini

    Google łączy siły: NotebookLM teraz głęboko zintegrowany z aplikacją Gemini

    Google wprowadziło zmianę w sposobie korzystania ze swoich narzędzi AI, łącząc NotebookLM bezpośrednio z aplikacją Gemini. NotebookLM, który do tej pory był osobnym programem do analizy dokumentów, jest teraz dostępny z poziomu głównego czatu Gemini. Dzięki temu użytkownicy nie muszą już przełączać się między różnymi kartami przeglądarki, aby pracować na swoich materiałach.

    Obsługa tej funkcji jest prosta. W oknie czatu Gemini, obok ikony dodawania plików, znajduje się przycisk NotebookLM. Po jego kliknięciu można wybrać konkretny notatnik zawierający pliki PDF, artykuły czy transkrypcje z YouTube. Od tego momentu Gemini wykorzystuje te dokumenty jako bazę do udzielania odpowiedzi. AI automatycznie uwzględnia treść źródeł przy tworzeniu streszczeń czy analiz, bez konieczności każdorazowego wklejania tekstu do czatu.

    Jak to działa w praktyce

    Główną korzyścią jest wygoda. Użytkownik rozmawia z Gemini, korzystając z możliwości modelu, a jednocześnie ma pewność, że odpowiedzi opierają się na jego własnych plikach. Aby sprawdzić konkretne źródło lub dodać nowy dokument, wystarczy kliknąć przycisk "źródła". Wszystkie dane i zmiany w notatnikach są aktualizowane na bieżąco.

    Integracja pozwala też na zarządzanie bazą wiedzy bezpośrednio z poziomu Gemini. Można tam dodawać nowe linki i pliki, a także zapisywać fragmenty rozmów bezpośrednio w strukturze notatnika.

    Różnica w sposobie działania

    To połączenie zmienia sposób, w jaki AI przetwarza informacje. Standardowy NotebookLM jest systemem zamkniętym, co oznacza, że odpowiada tylko na podstawie wgranych dokumentów. Wersja wbudowana w Gemini daje większy wybór.

    Użytkownik może zdecydować, czy AI ma trzymać się wyłącznie dostarczonych materiałów, czy może uzupełnić odpowiedź o informacje z internetu. Pozwala to na łączenie precyzyjnej analizy własnych danych z szeroką wiedzą dostępną w sieci.

    Zastosowanie w nauce i pracy

    Połączenie bazy wiedzy NotebookLM z funkcjami konwersacyjnymi Gemini ułatwia pracę osobom zajmującym się analizą danych, studentom i badaczom. Rozwiązuje to problem wyboru między narzędziem do pracy na źródłach a wszechstronnym asystentem AI.

    W edukacji rozwiązanie to wykorzystuje model Gemini z komponentami LearnLM, które są dostosowane do celów dydaktycznych. Nauczyciele mogą dzięki temu sprawniej przygotowywać materiały na podstawie konkretnych podręczników, a studenci mogą analizować literaturę przedmiotu w jednym oknie.

    Nowe możliwości dla użytkowników

    Wprowadzenie NotebookLM do Gemini upraszcza proces badania i gromadzenia informacji. Zamiast korzystać z kilku osobnych narzędzi, użytkownik otrzymuje jedno środowisko, w którym porządkuje źródła i od razu o nie pyta.

    Obecnie funkcja ta jest wdrażana stopniowo, głównie dla użytkowników korzystających z komputerów. Google dąży do ściślejszego powiązania swoich usług AI, co w praktyce oznacza mniej kopiowania danych i szybszy dostęp do własnych notatek podczas rozmowy z botem. Dla osób pracujących z dużą ilością tekstu jest to ułatwienie, które realnie przyspiesza codzienną pracę.

  • Kimi Code CLI 1.29.0: Lepsza Kontrola Agentów i Kompatybilność Terminala

    Kimi Code CLI 1.29.0: Lepsza Kontrola Agentów i Kompatybilność Terminala

    Kimi Code CLI, terminalowy asystent programistyczny od MoonshotAI, otrzymał właśnie znaczącą aktualizację. Wersja 1.29.0, dostępna jako najnowsze wydanie stabilne, wprowadza szereg usprawnień skupionych na precyzyjnym sterowaniu agentami AI oraz niezawodności pracy w różnych środowiskach terminalowych. To kolejny krok w ewolucji narzędzia, które zamienia terminal w pełnoprawnego, inteligentnego współpracownika przy pisaniu kodu.

    Hierarchiczne instrukcje projektowe z AGENTS.md

    Jedną z kluczowych nowości jest wsparcie dla hierarchicznego ładowania plików AGENTS.md. Jak to działa? CLI automatycznie wykrywa i scala instrukcje z plików AGENTS.md, zaczynając od katalogu głównego projektu Git aż do aktualnego katalogu roboczego, uwzględniając także pliki w ukrytych katalogach .kimi/. Co ważne, instrukcje z głębszych poziomów hierarchii mają priorytet, ale całość podlega limitowi 32 KiB. Dzięki temu najbardziej szczegółowe wytyczne dla agenta w konkretnym podkatalogu nie zostaną pominięte przez limity kontekstu, co zapewnia precyzyjne sterowanie zachowaniem AI na poziomie projektu.

    To eleganckie rozwiązanie problemu zarządzania złożonymi instrukcjami w dużych repozytoriach, gdzie różne części kodu mogą wymagać odmiennego podejścia.

    Większa niezawodność środowiska terminalowego

    Najnowsza wersja kładzie duży nacisk na poprawę komfortu pracy w terminalu. Naprawiono problemy z renderowaniem kolorów na terminalach bez wsparcia truecolor (np. w popularnym Xshell). Dodano także nowe zmienne środowiskowe: KIMI_CLI_PASTE_CHAR_THRESHOLD i KIMI_CLI_PASTE_LINE_THRESHOLD. Pozwalają one kontrolować, kiedy wklejany tekst jest zwijany do postaci placeholderów. Jest to istotne dla użytkowników wprowadzających znaki CJK (chińskie, japońskie, koreańskie) w terminalach takich jak Xshell po połączeniu przez SSH – zapobiega to błędom przy przetwarzaniu danych wejściowych.

    Dodano również obsługę proxy SOCKS, automatycznie normalizując prefiks socks:// do socks5:// w zmiennych środowiskowych dla lepszej kompatybilności. Ułatwia to pracę za zaporami sieciowymi czy w specyficznych konfiguracjach korporacyjnych.

    Nowe komendy i usprawnienia agentów

    Wśród nowych funkcji znajdziemy komendę /title, która pozwala na ręczne przemianowanie sesji. Co istotne, zapobiega ona nadpisaniu nazwy przez automatyczny mechanizm nadawania tytułów, jednocześnie unifikując stan sesji w pliku state.json.

    Znacząco ulepszono także agenta explore, odpowiedzialnego za analizę kodu. Zyskał on możliwość przyjmowania wyspecjalizowanych ról, różnych poziomów szczegółowości (thoroughness levels) oraz automatyczne dostarczanie kontekstu środowiska, np. informacji o repozytorium przy starcie. Teraz potrafi on też aktywnie sugerować głównemu agentowi wykorzystanie swoich możliwości podczas researchu w bazie kodu.

    Poprawki stabilności i wydajności

    Pod maską dokonano wielu istotnych poprawek. Rozwiązano problem konwersji znaków nowej linii (LF na CRLF) w systemie Windows, który mógł uszkadzać pliki tekstowe. Dodano nagłówki Cache-Control do zasobów webowych, aby uniknąć błędów 404 związanych z buforowaniem po aktualizacji. Ulepszono także mechanizm czyszczenia pustych sesji, który teraz działa na wszystkich ścieżkach wyjścia z programu, w tym przy błędach i awaryjnym zakończeniu.

    Dodanie informacji o systemie operacyjnym i powłoce (shell) do promptu systemowego poprawia kompatybilność z Windows, a refaktoryzacja współdzielonej logiki prepare_soul eliminuje wyścigi (race conditions) przy współbieżnym wznawianiu sesji w tle.

    Podsumowanie: dojrzałość narzędzia dla deweloperów

    Wydanie Kimi Code CLI 1.29.0 to nie spektakularna rewolycja, ale solidny krok w stronę dojrzałości produktu. Skupia się na eliminowaniu niedogodności – od lepszego wsparcia znaków międzynarodowych, przez naprawę błędów na specyficznych platformach, po wprowadzenie bardziej elastycznego zarządzania instrukcjami projektowymi. Te usprawnienia, wraz z potężnym modelem Kimi K2.5 i wsparciem dla Model Context Protocol (MCP), umacniają pozycję tego otwartoźródłowego narzędzia jako jednego z najbardziej zaawansowanych asystentów AI działających bezpośrednio w terminalu. Aktualizację można pobrać w formie plików binarnych ze SourceForge lub śledzić oficjalne release notes na GitHubie.


    Źródła

  • Claude Code Wprowadza Interaktywne Lekcje i Optymalizuje Wydajność w Wersji 2.1.90

    Claude Code Wprowadza Interaktywne Lekcje i Optymalizuje Wydajność w Wersji 2.1.90

    Nowa aktualizacja Claude Code, oznaczona numerem 2.1.90, przynosi znaczące usprawnienia zarówno dla nowych użytkowników, jak i zaawansowanych deweloperów. Wydanie skupia się na stabilności, naprawia uciążliwe błędy i wzmacnia bezpieczeństwo, szczególnie w środowiskach DevOps, a także wprowadza kluczowe funkcjonalności, takie jak asynchroniczne agenty i pamięć sesji.

    Nowe możliwości: asynchroniczne agenty i pamięć sesji

    Flagową funkcją tej aktualizacji jest wprowadzenie zaawansowanych, asynchronicznych agentów. Pozwalają one na bardziej złożoną i długotrwałą automatyzację zadań programistycznych, działając w tle i zarządzając wieloma wątkami pracy. To ogromny krok naprzód w kwestii efektywności, zwłaszcza w kontekście „vibe coding” – płynnego, intuicyjnego programowania wspomaganego przez AI.

    Dodano również ulepszoną pamięć sesji, która pozwala Claude Code lepiej śledzić kontekst i stan długich, złożonych zadań. Dzięki temu narzędzie może płynniej współpracować z programistą przez cały cykl rozwoju funkcji – od planowania po wdrożenie – zachowując spójność i unikając powtarzania instrukcji.

    Znaczące usprawnienia wydajności i stabilności

    Pod maską wersji 2.1.90 kryje się solidna porcja optymalizacji. Inżynierowie skupili się na poprawie działania długotrwałych sesji, które są kluczowe dla zaawansowanych agentów AI i złożonych workflow hostingowych.

    Przeprojektowano architekturę, aby lepiej obsługiwać warstwowy system uprawnień, integracje MCP (Model Context Protocol) i podagenty. Te zmiany zwiększają ogólną niezawodność systemu, szczególnie podczas wykonywania rozbudowanych, zautomatyzowanych zadań.

    Krytyczne poprawki błędów dla płynnej automatyzacji

    Aktualizacja usuwa kilka uciążliwych problemów, które mogły zakłócać pracę, szczególnie w zautomatyzowanych pipeline'ach. Rozwiązano konflikty edycji plików, w tym irytujący błąd „File content has changed”, który często pojawiał się przy hookach typu format-on-save, oraz wyeliminowano fałszywe pozytywy przy kolejnych edycjach. Działanie narzędzia zostało zoptymalizowane, aby zapewnić płynniejszą i bardziej przewidywalną automatyzację.

    Wzmacnianie bezpieczeństwa i kontroli środowiskowej

    W kwestii bezpieczeństwa wersja 2.1.90 wprowadza wzmocnienia sandboxa, niezbędne w środowiskach produkcyjnych DevOps. Architektura z warstwowym systemem uprawnień i hookami zapewnia lepszą kontrolę nad wykonywanymi działaniami.

    Dodano także nowe zmienne środowiskowe, które dają administratorom większą swobodę w konfiguracji środowisk offline lub wyspecjalizowanych. Ulepszono tryb Auto, który teraz ściślej przestrzega jawnych instrukcji, takich jak „don't push”, oraz wprowadzono inteligentniejsze bramki workflow.

    Podsumowanie: krok naprzód dla profesjonalnych inżynierów

    Wydanie Claude Code 2.1.90 to dowód na skupienie się na potrzebach profesjonalnych inżynierów oprogramowania. Łączy ono zaawansowane możliwości automatyzacji (asynchroniczne agenty i pamięć sesji) z głębokimi usprawnieniami technicznymi, które wspierają wymagające, zautomatyzowane workflow.

    Te zmiany, będące częścią szybkiego cyklu iteracyjnego projektu, bezpośrednio wspierają nowoczesne praktyki web developmentu i AI. Dzięki nim długotrwałe sesje agentów są stabilniejsze, automatyzacja mniej podatna na błędy, a możliwości narzędzia – znacznie szersze. To kompleksowa aktualizacja, która podnosi poprzeczkę w kategorii inteligentnych asystentów programistycznych.


    Źródła

  • OpenCode Zwiększa Wydajność i Stabilność – Caching Promptów i Naprawa Azure w Wersji 1.3.12

    OpenCode Zwiększa Wydajność i Stabilność – Caching Promptów i Naprawa Azure w Wersji 1.3.12

    Nowa wersja open-source'owego asystenta programistycznego OpenCode, oznaczona numerem v1.3.12, przynosi istotne ulepszenia dla osób korzystających z zaawansowanych modeli AI. To wydanie skupia się na poprawie wydajności i stabilności, wprowadzając mechanizmy cache'owania oraz naprawiając błędy.

    Ogólne usprawnienia cache'owania

    Wydanie OpenCode v1.3.12 wprowadza ulepszenia w zakresie cache’owania sesji. To optymalizacja, która może znacząco przyspieszyć pracę i obniżyć koszty.

    W praktyce oznacza to, że gdy OpenCode wielokrotnie używa podobnych lub identycznych fragmentów promptów w sesji, może teraz efektywniej zarządzać danymi, zamiast za każdym razem wysyłać je od nowa do API. Jest to szczególnie cenne podczas długich, iteracyjnych sesji programistycznych, w których agent często odwołuje się do tych samych fragmentów kodu, specyfikacji czy logiki.

    Stabilizacja i nowe funkcje

    Aktualizacja przynosi szereg poprawek i nowych funkcjonalności, w tym wsparcie dla OAuth OpenAI oraz usprawnienia w obsłudze poleceń Bash i proxy. To kluczowe poprawki dla zespołów wykorzystujących różne modele AI, które są popularnym wyborem w środowiskach korporacyjnych ze względu na zgodność (compliance) i integrację.

    Stabilizacja interfejsu terminalowego (TUI)

    Wydanie przynosi także ważne poprawki dla samego Terminal User Interface (TUI). Prace skupiają się na zapewnieniu płynnego i bardziej przewidywalnego działania interfejsu, co jest kluczowe dla zachowania "flow" programisty podczas pracy w terminalu. OpenCode stawia mocno na User Experience w TUI, oferując różne tryby pracy, które można szybko przełączać za pomocą poleceń takich jak /init czy /undo.

    Szerszy kontekst rozwoju OpenCode

    Wersja v1.3.12 wpisuje się w intensywny rozwój OpenCode jako otwartej alternatywy dla komercyjnych asystentów. Projekt wspiera już ponad 75 modeli językowych dzięki integracji z platformami takimi jak Models.dev, a także specyficzne narzędzia, jak GitHub Copilot.

    W ostatnich wydaniach dodano wsparcie dla nowych providerów, przywrócono tryby review oparte na Git, dodano pełne wsparcie dla proxy HTTP i zmodernizowano komponenty wewnętrzne, w tym zaktualizowano Effect library (wersja beta.37) w usługach konfiguracyjnych. Wszystko to służy jednemu celowi: stworzeniu wydajnego, wielofunkcyjnego agenta AI, który działa tam, gdzie programista pracuje na co dzień – w terminalu lub ulubionym IDE.

    Dla kogo są te ulepszenia?

    Aktualizacja OpenCode v1.3.12 to przede wszystkim dobra wiadomość dla programistów i zespołów DevOps korzystających z:

    • Zaawansowanych modeli AI – odczują korzyści w postaci stabilniejszych integracji i nowych funkcji, takich jak OAuth.
    • Pracy w terminalu – interfejs stanie się bardziej responsywny i przewidywalny.
    • Różnorodnych dostawców modeli – platforma stale poszerza zakres wsparcia.

    To wydanie pokazuje dbałość o niezawodność i wydajność fundamentów platformy, które są niezbędne dla vibe codingu – płynnego, skupionego stanu przepływu podczas programowania z asystentem AI.


    Źródła

  • Codex 0.118.0: Lepsze Sieciowanie w Windows, Autoryzacja Kodem Urządzenia i Ulepszenia CLI

    Codex 0.118.0: Lepsze Sieciowanie w Windows, Autoryzacja Kodem Urządzenia i Ulepszenia CLI

    Wydanie Codex 0.118.0 z kwietnia 2026 roku przyniosło serię kluczowych ulepszeń skupionych na stabilności, bezpieczeństwie i elastyczności dla programistów oraz inżynierów AI. OpenAI skoncentrowało się na trudnych aspektach pracy z sandboxami sieciowymi, wprowadziło przydatne flow autoryzacyjne oraz znacznie poprawiło narzędzia wiersza poleceń, co wspiera efektywniejsze kodowanie wspomagane przez AI (AI-driven coding) oraz agentic workflows.

    Sieciowanie w Windows na poziomie systemu operacyjnego

    Największą zmianą w tej wersji jest gruntowna przebudowa obsługi sieci dla sandboxów w systemie Windows. Do tej pory proxy konfigurowano głównie za pomocą zmiennych środowiskowych, co bywało niewystarczające w skomplikowanych środowiskach korporacyjnych. Wersja 0.118.0 wprowadza proxy-only networking z wykorzystaniem reguł egress na poziomie samego systemu operacyjnego.

    Oznacza to, że sandbox Codex może teraz ściśle egzekwować polityki dostępu do sieci. Administratorzy i użytkownicy mają do dyspozycji precyzyjne mechanizmy kontroli: mogą ograniczyć dostęp wyłącznie do menedżerów pakietów, takich jak npm czy PyPI, zezwolić na pełny dostęp do internetu dla testów, otworzyć jedynie konkretne domeny lub całkowicie zablokować ruch sieciowy. Dodano też pełne wsparcie dla protokołów proxy, w tym SOCKS5, oraz dedykowanych zmiennych WS_PROXY/WSS_PROXY dla ruchu WebSocket, co wprowadzono już we wcześniejszej wersji 0.104.0. To rozwiązanie długo oczekiwanych problemów z łącznością w środowiskach korporacyjnych.

    Nowa autoryzacja kodem urządzenia dla ChatGPT oraz dynamiczne tokeny

    Kolejnym ważnym ulepszeniem jest dodanie device code sign-in flow dla ChatGPT w ramach serwera aplikacji Codex. Ten mechanizm autoryzacji pozwala użytkownikowi zalogować się bezpiecznie na urządzeniu z ograniczonymi możliwościami wprowadzania danych (np. w sandboxie), używając kodu z innego urządzenia. Zwiększa to bezpieczeństwo i wygodę, szczególnie w zdalnych i zarządzanych konfiguracjach.

    Dla twórców integracji z własnymi modelami (custom model providers) wprowadzono dynamiczne odświeżanie tokenów bearer. To automatyczne, bezproblemowe odświeżanie tokenów uwierzytelniających zapobiega przerwom w działaniu usług spowodowanym wygasaniem sesji, zapewniając płynność w długotrwałych zadaniach AI.

    Elastyczność CLI i wzrost stabilności sandboxów

    Interfejs wiersza poleceń (CLI) Codex zyskał nowe możliwości. Polecenie codex exec obsługuje teraz workflow prompt-plus-stdin, który pozwala na bardziej elastyczne łączenie promptów z danymi ze standardowego wejścia. Ułatwia to skryptowanie i automatyzację zadań. CLI lepiej zachowuje teraz ustawienia przypisane do profilów, a w systemie pojawiła się eksperymentalna podkomenda exec-server.

    Jeśli chodzi o stabilność, wersja 0.118.0 przynosi istotne poprawki dla sandboxów na Linuxie i Windowsie. Naprawiono m.in. obsługę podzielonych systemów plików, błędy związane z operacjami apply_patch na systemach tylko do odczytu oraz problemy z zaporą sieciową w Windows. Na macOS rozwiązano błąd typu panic w kliencie HTTP wewnątrz sandboxa. Wszystko to sprawia, że środowisko izolowane działa znacznie bardziej niezawodnie.

    Przywrócenie kluczowych przepływów pracy w TUI i ulepszenia MCP

    Interfejs tekstowy (TUI) odzyskał kilka utraconych funkcji, stając się znów w pełni funkcjonalnym narzędziem. Ogólnie TUI działa teraz płynniej i szybciej. Usunięto zbędne odpytywanie o autoryzacją (polling) dla wyłączonych serwerów, a MCP (Model Control Plane) lepiej obsługuje znormalizowane narzędzia i zachowuje kolejność wyników wyszukiwania, zamiast sortować je alfabetycznie.

    Środowisko zdalne i app-server również zyskał na aktualizacji, otrzymując m.in. transport egress dla WebSocketów, przekazywanie katalogu roboczego (--cd) oraz nowe API systemu plików zintegrowane z sandboxem. Te zmiany spajają ekosystem Codex, obejmujący już CLI, aplikację desktopową, IDE i chmurę, działający w oparciu o modele GPT-5.x-Codex.

    Co oznaczają te zmiany dla deweloperów i inżynierów AI?

    Wydanie Codex 0.118.0 to przede wszystkim aktualizacja skupiona na pracy inżynieryjnej „pod maską”. Nie ma tu spektakularnych, widocznych na pierwszy rzut oka funkcji, ale wprowadzono fundamentalne ulepszenia, które usuwają chroniczne przeszkody. Lepsza kontrola sieci w sandboxach otwiera drzwi do bezpieczniejszego stosowania Codex w firmach z restrykcyjnymi politykami IT. Wygodniejsza autoryzacja i stabilniejsze CLI poprawiają codzienne doświadczenie dewelopera.

    Poprawki stabilizacyjne dla Linuxa, Windowsa i macOS oznaczają mniej frustracji podczas pracy z agentami AI, które często intensywnie korzystają z izolowanych środowisk. W połączeniu z szerszym kontekstem – jak wsparcie ogromnych okien kontekstowych (1M) przez GPT-5.4 – Codex 0.118.0 solidnie wzmacnia fundamenty pod zaawansowane zdolności agentowe (agentic workflows) w web devie i DevOps, czyniąc je bardziej przewidywalnymi i niezawodnymi. To krok w stronę dojrzałości platformy, dzięki której inżynierowie mogą skupić się na tworzeniu, a nie na walce z narzędziami.


    Źródła