Autor: Franczeska

  • Kimi K2.6 Moonshot AI: Nowa Potęga wśród Modeli Kodujących Niszczy Rywali

    Kimi K2.6 Moonshot AI: Nowa Potęga wśród Modeli Kodujących Niszczy Rywali

    Moonshot AI oficjalnie wprowadził Kimi K2.6 – nową, zaawansowaną wersję swojego flagowego modelu sztucznej inteligencji, który jest przystosowany do zadań związanych z kodowaniem i działaniem jako agent. Model uzyskuje wysokie wyniki w benchmarkach, konkurując z takimi modelami jak Claude 3.5/3.7 Opus, GPT-4o/4.1 oraz Gemini 2.0/2.5 Pro. Oferuje przy tym efektywność w tworzeniu aplikacji z jednego promptu, a jego koszty są znacznie niższe niż u konkurencji. Kimi K2.6 ma potencjał, aby stać się jednym z najskuteczniejszych narzędzi dla programistów.

    Jednym z kluczowych elementów Kimi K2.6 jest jego architektura Mixture-of-Experts (MoE), która zawiera bilion parametrów, z których 32 miliardy są aktywne podczas każdego przebiegu. Taka konstrukcja zapewnia modelowi dużą wydajność i szybkość. Innowacją jest także natywna multimodalność, dzięki integracji z Kimi-VL, co umożliwia generowanie kodu na podstawie projektów UI lub zrzutów ekranu. Model obsługuje kontekst do 262 144 tokenów, co jest istotne dla złożonych, wieloetapowych zadań programistycznych.

    Kluczowe informacje

    • Wysoka wydajność: Kimi K2.6 uzyskuje konkurencyjne wyniki w benchmarkach kodowania, takich jak SWE-Bench Verified (około 60.4% dla pokrewnego modelu) oraz LiveCodeBench.
    • Architektura dla profesjonalistów: Model oparty na MoE z bilionem parametrów i 262K tokenami kontekstu, z natywną wizją lub integracją Kimi-VL do generowania kodu z projektów graficznych.
    • Moc agentów i niski koszt: Obsługuje do 100 równoległych sub-agentów oraz do 1500 wywołań narzędzi, przy koszcie inferencji zaczynającym się od około $0.0006 za 1K tokenów wejściowych na zewnętrznych platformach.

    Rewolucja vibe coding i full-stack development

    Kimi K2.6 został zaprojektowany z myślą o vibe codingu – procesie, w którym programista opisuje swoją wizję, a AI przekształca ją w kompletną, działającą aplikację. Model został zoptymalizowany do tworzenia pełnych rozwiązań full-stack z jednego, dobrze skonstruowanego promptu. Już teraz demonstruje swoje możliwości w generowaniu zaawansowanych animacji frontendowych, w tym wideo jako tła czy elementów 3D, oraz w budowaniu całych symulacji, takich jak przeglądarkowy system operacyjny czy symulator deskorolki w C++.

    Kimi K2.6 potrafi koordynować pracę grupy agentów. Do 100 równoległych sub-agentów może współpracować nad rozwiązywaniem złożonych problemów w całym repozytorium, automatycznie poprawiając błędy lub implementując nowe funkcjonalności. Model jest w stanie zarządzać długoterminowymi projektami, utrzymując spójność i kontekst przez cały proces.

    Szczegóły techniczne i wydajność

    Szczegóły techniczne i wydajność

    W porównaniu do konkurencji, Kimi K2.6 prezentuje się bardzo dobrze. W benchmarku SWE-Bench Verified, który ocenia zdolność do rozwiązywania rzeczywistych problemów z GitHub, uzyskuje wysokie wyniki. Na LiveCodeBench, oceniającym umiejętność kodowania w oparciu o najnowsze, niestandardowe problemy, model również osiąga dobre noty. Niski wskaźnik błędów przy edycjach diff w rzeczywistym kodzie pokazuje, że model dobrze rozumie kontekst i nie wprowadza przypadkowych zmian.

    Koszt inferencji jest znacznie niższy niż w przypadku komercyjnych API od OpenAI czy Anthropic. Dla deweloperów i firm, które chcą wdrożyć model, dostępność przez API (np. OpenRouter, Moonshot platform) zapewnia dużą elastyczność.

    Perspektywy dla branży deweloperskiej

    Wprowadzenie Kimi K2.6 przez Moonshot AI wskazuje na rozwój wyspecjalizowanych, potężnych i tanich modeli AI dla deweloperów. Model dorównuje czołowym, zamkniętym rozwiązaniom w kluczowych zadaniach koderskich, a jego użytkowanie jest znacznie tańsze. To narzędzie, które może przyspieszyć prototypowanie, automatyzować rutynowe zadania i umożliwić małym zespołom realizację projektów, które wcześniej wymagałyby znacznie większych zasobów.

    Integracja z istniejącymi workflow'ami jest prosta dzięki oficjalnemu SDK (npm install @moonshotai/kimi-sdk) oraz dedykowanemu CLI. Dla osób zajmujących się web developmentem, DevOps czy tworzeniem gier, Kimi K2.6 oferuje konkretną, praktyczną wartość już teraz.

  • Google Antigravity 1.22.2: Wprowadza Nowy System Uprawnień Agentów

    Google Antigravity 1.22.2: Wprowadza Nowy System Uprawnień Agentów

    Google opublikowało aktualizację 1.22.2 dla środowiska programistycznego Antigravity. Główną zmianą jest wprowadzenie systemu uprawnień dla agentów AI, który zastępuje dotychczasowe rozwiązania w zakresie bezpieczeństwa i kontroli nad automatyzacją kodu. Aktualizacja trafia do użytkowników etapami.

    Nowy mechanizm pozwala precyzyjnie określić, jakie działania agent może podejmować w imieniu programisty. Każda operacja – od wpisywania komend w terminalu po interakcje z przeglądarką i generowanie plików – jest teraz traktowana jako osobny zasób uprawnień. Dzięki temu użytkownicy mają większy wpływ na to, co dzieje się w ich lokalnym środowisku.

    Kontrola nad zadaniami agenta

    Agent w wersji 1.22.2 to system wnioskowania korzystający z modeli językowych klasy frontier. Narzędzie tworzy listy zadań, plany wdrożeń oraz nagrania z sesji w przeglądarce. Wcześniej zarządzanie tymi procesami było mało dokładne, co zmienia obecna aktualizacja.

    W panelu Agent Manager oraz w ustawieniach systemowych pojawiły się trzy główne zasady kontroli. Pierwsza z nich, polityka przeglądu artefaktów (Artifact Review Policy), określa sytuacje, w których agent musi zatrzymać pracę i poczekać na akceptację człowieka. Użytkownik może wybrać tryb „Always Proceed”, aby przyspieszyć proces, co jednak wiąże się z mniejszym nadzorem nad wynikami.

    Druga zasada dotyczy wykonywania poleceń w terminalu. Wykorzystuje ona listy dozwolonych i zabronionych komend (allowlists/blocklists). Pozwala to na automatyczne uruchamianie bezpiecznych operacji, takich jak npm install, przy jednoczesnym blokowaniu ryzykownych skryptów. Trzecia funkcja to polityka JavaScriptu w przeglądarce, która uniemożliwia uruchamianie niezaufanego kodu JS. Ma to chronić przed atakami typu prompt injection podczas testowania aplikacji.

    Naprawione błędy i problemy techniczne

    Wersja 1.22.2 eliminuje błąd, który powodował wyświetlanie zbędnych próśb o dostęp do terminala, nawet jeśli użytkownik zaznaczył opcję „Always run”. Dokumentacja potwierdza naprawę tej usterki, choć monity dotyczące adresów URL w przeglądarce mogą nadal występować.

    Wdrożenie nowych zabezpieczeń wiąże się też z pewnymi trudnościami. Wprowadzony wcześniej sandboxing (w wersji 1.21.6) wywołał u części osób problemy z uprawnieniami Dockera, głównie na systemie macOS. Ponieważ system wymusza aktualizacje do najnowszej wersji, niektórzy specjaliści DevOps nie mogą wrócić do starszego, stabilnego wydania. Odnotowano również przypadki błędów weryfikacji konta u użytkowników z aktywną subskrypcją, co prawdopodobnie wynika z przebudowy systemu autoryzacji.

    Bezpieczeństwo w pracy z AI i DevOps

    Nowy system uprawnień to kolejny etap rozwoju narzędzia w stronę bezpiecznego programowania wspomaganego przez AI. Dla osób pracujących w modelu „vibe coding” lub automatyzujących procesy DevOps, szczegółowe definiowanie uprawnień agenta ogranicza ryzyko przypadkowego usunięcia danych, uruchomienia złośliwego skryptu czy wejścia na niebezpieczną stronę podczas testów.

    Zmiany w wersji 1.22.2 przygotowują grunt pod dalszy rozwój autonomii agentów. Google dąży do modelu, w którym samodzielność sztucznej inteligencji jest ograniczona konkretnymi ramami ustawionymi przez człowieka. Dla zespołów zajmujących się tworzeniem stron internetowych i rozwojem AI oznacza to bardziej przewidywalne warunki pracy przy testowaniu nowych metod budowania aplikacji.


    Źródła

  • Windsurf wprowadza inteligentny router modeli i naprawia uciążliwy błąd

    Windsurf wprowadza inteligentny router modeli i naprawia uciążliwy błąd

    Najnowsza aktualizacja Windsurf, agentycznego środowiska programistycznego (IDE), wprowadza funkcję optymalizacji kosztów oraz poprawkę błędu, który utrudniał pracę części użytkowników. Główną nowością jest inteligentny router modeli. System ten automatycznie wybiera model AI najlepiej dopasowany do konkretnego zadania, co ma zapobiegać zbyt szybkiemu zużywaniu miesięcznego limitu tokenów. Producent naprawił również usterkę blokującą zmianę modelu po wysłaniu pierwszego zapytania i zwrócił wykorzystane limity osobom, które miały z tym problem.

    Zmiany te są reakcją na uwagi społeczności dotyczące tempa wyczerpywania się pakietów po modyfikacji systemu rozliczeń. Windsurf rywalizuje bezpośrednio z Cursorem i skupia się na poprawie wydajności oraz kontroli wydatków podczas pracy w trybie „vibe codingu”.

    Jak działa inteligentny router modeli?

    Inteligentny router modeli to nowa pozycja na liście wyboru modeli. System dynamicznie dobiera odpowiedni model bazowy (taki jak GPT, Claude czy Gemini) do każdego zapytania programistycznego. Najważniejszą cechą tego rozwiązania jest rozliczanie zużycia według stałej stawki za token, bez względu na to, który model premium zostanie faktycznie uruchomiony w tle.

    Mechanizm ten kieruje proste zadania do lżejszych i tańszych modeli, rezerwując zaawansowane jednostki dla trudniejszych problemów. Dzięki temu przydzielona pula tokenów ma wystarczać na dłuższy czas. Z funkcji mogą korzystać użytkownicy indywidualni posiadający plany Pro, Max oraz Teams.

    Przez najbliższe dwa tygodnie obowiązują promocyjne ceny za dodatkowe użycie: 0,50 USD za 1 milion tokenów wejściowych, 2,00 USD za 1 milion tokenów wyjściowych oraz 0,10 USD za 1 milion tokenów odczytu z pamięci podręcznej (cache).

    Przejrzyste koszty i poprawki techniczne

    Aktualizacja zmienia wygląd selektora modeli, aby ułatwić sprawdzanie kosztów. Teraz stawki za tokeny wejściowe, wyjściowe i odczyt z cache są widoczne bezpośrednio przy każdym modelu. Ma to zapewnić użytkownikom lepszy wgląd w to, jak wydawane są ich środki.

    Dodatkowo w oknie odpowiedzi pojawia się teraz informacja o dokładnej liczbie zużytych tokenów dla danego zapytania. W oknie kontekstu dodano też licznik czasu wygaśnięcia pamięci podręcznej promptów.

    Kluczową poprawką jest usunięcie błędu w routerze, który blokował możliwość przełączenia modelu po rozpoczęciu sesji. Firma ogłosiła, że użytkownicy dotknięci tym problemem otrzymali pełny reset limitów oraz zwrot poniesionych opłat dodatkowych.

    Rozwój narzędzia i ekosystemu

    Wprowadzenie routera modeli to część strategii Windsurf opartej na zarządzaniu kosztami i rozwijaniu funkcji agentowych. Wcześniej platforma umożliwiła integrację z Devin Cloud, co pozwala na delegowanie zadań do agenta AI działającego w chmurze.

    Windsurf, rozwijany przez Cognition AI, rozbudowuje także wsparcie dla Model Context Protocol (MCP). Poprawiono między innymi zarządzanie zasobami, widoczność stanu ładowania oraz stabilność połączeń przy inicjalizacji. Ulepszenia te mają znaczenie dla osób korzystających z rozbudowanych procesów deweloperskich i zewnętrznych narzędzi.

    Skuteczność nowego routera zależy od tego, jak trafnie system będzie dobierał modele, by oszczędności nie odbywały się kosztem jakości kodu. Jeśli mechanizm będzie działał sprawnie, może stać się standardowym sposobem korzystania z aplikacji dla osób, które chcą lepiej wykorzystać swój abonament.


    Źródła

  • Claude Code 2.1.94: Wsparcie dla Amazon Bedrock i Poprawa Stabilności

    Claude Code 2.1.94: Wsparcie dla Amazon Bedrock i Poprawa Stabilności

    Aktualizacja Claude Code do wersji 2.1.94 wprowadza zmiany przydatne dla programistów korzystających z AWS oraz osób pracujących w dużych zespołach. Deweloperzy skupili się na obsłudze zewnętrznych platform, poprawie stabilności i usunięciu błędów utrudniających codzienną pracę.

    Integracja z Amazon Bedrock przez Mantle

    Główną nowością jest obsługa Amazon Bedrock za pomocą systemu Mantle. Jest to wewnętrzne rozwiązanie firmy Anthropic, które przekierowuje zapytania do infrastruktury Bedrock. Funkcja ta jest skierowana do firm, które chcą korzystać z modeli AI bez przesyłania danych poza swoje środowisko AWS.

    Aby aktywować tę funkcję, należy ustawić zmienną środowiskową CLAUDE_CODE_USE_MANTLE=1. Pozwala to na komunikację z modelami przez zarządzaną infrastrukturę AWS, co ułatwia zachowanie zgodności z wewnętrznymi zasadami bezpieczeństwa i wykorzystanie posiadanych kredytów AWS. Claude Code wciąż korzysta z formatu API Anthropica, a Mantle służy jako łącznik między tym standardem a interfejsem Bedrock.

    Wyższy domyślny poziom Effort

    W tej wersji zmieniono domyślne ustawienie intensywności pracy narzędzia. Dla użytkowników korzystających z kluczy API oraz platform Bedrock, Vertex, Foundry, a także planów Team i Enterprise, poziom effort został podniesiony z medium na high.

    W praktyce oznacza to, że model poświęca więcej zasobów na analizę i generowanie odpowiedzi. Ma to poprawić jakość kodu, choć może wiązać się z nieco dłuższym czasem oczekiwania i większym zużyciem tokenów. Użytkownicy, którzy wolą poprzednie ustawienie, mogą je przywrócić poleceniem /effort.

    Ulepszenia pluginów i integracji

    Wersja 2.1.94 wprowadza zmiany w sposobie działania dodatków. Nazwy umiejętności (skills) w pluginach są teraz pobierane z pola name w sekcji frontmatter, co ułatwia ich poprawne wywoływanie.

    Poprawiono również współpracę ze Slackiem. Gdy Claude wysyła wiadomość przez protokół MCP (Model Context Protocol), w konsoli pojawia się nagłówek Slacked #channel. Zawiera on bezpośredni link do kanału, co przyspiesza przełączanie się między terminalem a komunikatorem.

    Poprawki błędów

    Większość zmian w tej wersji to usunięcie usterek zgłaszanych przez użytkowników:

    • Limity zapytań (rate limits): Program informuje o przekroczeniu limitów od razu. Wcześniej aplikacja mogła przestać odpowiadać bez podania przyczyny.
    • Logowanie w macOS: Naprawiono błędy podczas logowania w konsoli. Teraz problemy można zdiagnozować za pomocą komendy claude doctor.
    • Kodowanie znaków: Rozwiązano problem z błędnym wyświetlaniem polskich liter i innych znaków specjalnych podczas przesyłania danych w formacie JSON.
    • Autoryzacja w Bedrock: Usunięto błąd 403 "Authorization header is missing", który pojawiał się przy specyficznych konfiguracjach zmiennych środowiskowych.

    Dodatkowo poprawiono renderowanie interfejsu w terminalu oraz zarządzanie aktywnymi sesjami.

    Podsumowanie

    Claude Code 2.1.94 to aktualizacja techniczna, która poprawia działanie narzędzia w środowiskach korporacyjnych. Wsparcie dla Amazon Bedrock ułatwia wdrożenie narzędzia w firmach opartych na AWS, a wyższy poziom „effort” ma zapewniać lepsze wyniki pracy modelu. Najważniejszą zmianą dla większości użytkowników będzie jednak wyeliminowanie błędów związanych z logowaniem i limitami zapytań, co przekłada się na stabilniejsze działanie programu.


    Źródła

  • Adaptive w Windsurf: Inteligentny router modeli oszczędza twoje tokeny

    Adaptive w Windsurf: Inteligentny router modeli oszczędza twoje tokeny

    Windsurf wprowadził nową funkcję o nazwie Adaptive. Jest to inteligentny router modeli, który pomaga zarządzać miesięcznym limitem tokenów. Zmiana ta wpływa na sposób, w jaki środowisko korzysta z dostępnych modeli językowych, i jest już dostępna dla wszystkich użytkowników.

    Jak działa Adaptive w Windsurf

    Zasada działania Adaptive jest prosta. Po wybraniu tej opcji w menu, system automatycznie dobiera model AI (np. GPT, Claude lub Gemini), który najlepiej poradzi sobie z danym zadaniem. Może to być poprawianie błędów, pisanie dokumentacji czy zmiana struktury kodu.

    Najważniejszą cechą Adaptive jest stała stawka za token. Niezależnie od tego, który model zostanie wybrany przez system do wykonania zadania, koszt pozostaje taki sam. Pozwala to systemowi na używanie lżejszych modeli do prostych zapytań, co sprawia, że limit tokenów użytkownika wyczerpuje się wolniej.

    Przejrzystość kosztów i kontrola w menu modeli

    Przy okazji premiery Adaptive, twórcy Windsurf odświeżyli menu wyboru modeli. Użytkownicy zyskali większą kontrolę nad tym, ile zasobów zużywają. Po najechaniu myszką na konkretny model pojawiają się teraz szczegółowe stawki za tokeny wejściowe (input), wyjściowe (output) oraz odczyt z pamięci podręcznej (cache read).

    W interfejsie dodano również dwa nowe elementy:

    • Licznik czasu pamięci podręcznej (prompt cache timer): informuje, jak długo kontekst rozmowy jest przechowywany w pamięci.
    • Licznik tokenów przy odpowiedziach: każda wiadomość od AI pokazuje teraz dokładną liczbę zużytych jednostek.

    Dzięki temu programiści widzą koszt każdej operacji bezpośrednio w oknie czatu.

    Kontekst aktualizacji i poprawki techniczne

    Wprowadzenie Adaptive to kolejny etap zmian w zarządzaniu zasobami w Windsurf. Wcześniej w IDE pojawił się podgląd limitów (quota), a nowa funkcja ma pomagać w ich mądrzejszym wykorzystywaniu.

    W procesie wdrażania wyeliminowano też błędy techniczne. Jedna z ostatnich poprawek usunęła problem, przez który użytkownicy nie mogli zmienić modelu na inny po wysłaniu pierwszego zapytania w trybie Adaptive.

    Co to oznacza dla programistów

    Dla osób zajmujących się tworzeniem stron, rozwiązaniami AI czy operacjami DevOps, nowości te oznaczają mniej pracy przy pilnowaniu limitów. System sam dba o to, by nie marnować drogich zasobów na proste pytania.

    Warto dodać, że ceny za dodatkowe użycie (extra usage) są teraz rozliczane według stawek API. Zmiany objęły również użytkowników planu Max, którzy otrzymali zmodyfikowane limity, co pozwala im na dłuższą pracę bez przerw.

    Adaptive w Windsurf pokazuje kierunek, w którym rozwijają się asystenci kodowania. Zamiast używać najpotężniejszych modeli do każdego przecinka w kodzie, systemy zaczynają dopasowywać narzędzie do trudności problemu. Pozwala to programistom pracować płynniej, bez obaw o nagłe wyczerpanie dostępnych kredytów w połowie projektu.


    Źródła

  • OpenCode v1.3.15 naprawia krytyczny błąd z npm i node-gyp

    OpenCode v1.3.15 naprawia krytyczny błąd z npm i node-gyp

    Aktualizacja OpenCode do wersji 1.3.15 rozwiązuje błąd, który utrudniał pracę wielu programistom. Wydanie z 4 kwietnia 2026 roku usuwa problem uniemożliwiający poprawną instalację pakietów npm w konkretnych konfiguracjach. Poprawka ta poprawia współpracę narzędzia z menedżerem pakietów npm oraz stabilność samego rdzenia aplikacji.

    Błąd powodował przerywanie operacji npm install. Przyczyną były ścieżki do node-gyp (narzędzia kompilującego natywne moduły Node.js) zapisane w plikach binarnych OpenCode. Gdy komponent Arborist wewnątrz npm napotykał te dane, proces instalacji kończył się niepowodzeniem. Wersja 1.3.15 eliminuje te konflikty.

    Kontekst wydania i wcześniejsze zmiany

    Wydanie 1.3.15 pojawia się krótko po wersji, która przywróciła tryby przeglądu oparte na Git (git-backed review modes). Funkcja ta pozwala deweloperom analizować różnice (diffy) w niezacommitowanych zmianach oraz między poszczególnymi gałęziami projektu bezpośrednio w narzędziu.

    W ostatnich aktualizacjach dodano również Venice AI jako dostawcę modeli i poprawiono obsługę sesji przy korzystaniu z narzędzi zgodnych z API OpenAI. Wprowadzono także wsparcie dla natywnego PowerShella w systemie Windows, co pokazuje, że twórcy skupiają się na poprawie wygody pracy w różnych środowiskach.

    Stabilność pluginów i poprawki techniczne

    Poza zmianami w samym rdzeniu, wersja 1.3.15 naprawia błędy związane z systemem rozszerzeń. Rozwiązano problemy z instalacją pluginów przez aliasy npm oraz bezpośrednio z linków do repozytoriów Git. Deweloperzy poprawili też obsługę ścieżek cache w systemie Windows, które wcześniej bywały problematyczne.

    Jest to istotne ze względu na rosnącą liczbę dostępnych dodatków. W rejestrze npm znajdują się oficjalne pakiety, takie jak @opencode-ai/sdk (wersja 1.4.3) i @opencode-ai/plugin (wersja 1.4.6), a także projekty tworzone przez społeczność, np. zestaw poprawek oh-my-opencode.

    Rozwój ekosystemu i znane błędy

    Ostatnie serie aktualizacji wzbogaciły OpenCode o eksport danych telemetrycznych OTLP, pełną obsługę proxy HTTP oraz poprawki dla OpenRouter. Zredukowano także zużycie pamięci przez TypeScript LSP.

    Mimo postępów, w aplikacji występują jeszcze pewne problemy. Użytkownicy starszych procesorów Intel (np. architektura Ivy Bridge) zgłaszali trudności z uruchomieniem programu po aktualizacji. W takich przypadkach konieczne jest wyłączenie automatycznych aktualizacji lub powrót do starszej wersji. Innym odnotowanym błędem jest brak odświeżania wersji deweloperskich pluginów podczas pracy w trybie dev z wykorzystaniem Tauri.

    Znaczenie aktualizacji dla programistów

    Dla osób zajmujących się web developmentem w JavaScript i TypeScript, sprawne działanie npm jest niezbędne. Błędy przy npm install wstrzymują pracę nad projektem i zmuszają do szukania obejść. Wersja 1.3.15 usuwa tę barierę.

    Poprawa stabilności instalacji pluginów ułatwia dostosowanie środowiska do własnych potrzeb. Możliwość rozbudowy narzędzia o dodatki ma bezpośredni wpływ na szybkość i komfort pisania kodu.

    Aktualizacja do wersji 1.3.15 jest zalecana dla wszystkich użytkowników OpenCode. Oprócz naprawy błędów z npm, zawiera ona wszystkie wcześniejsze usprawnienia dotyczące integracji z Gitem, zarządzania sesjami i obsługi nowych modeli AI.


    Źródła

  • Cursor 3 definiuje nową erę rozwoju: od IDE do fabryki oprogramowania sterowanej agentami

    Cursor 3 definiuje nową erę rozwoju: od IDE do fabryki oprogramowania sterowanej agentami

    Środowisko programistyczne Cursor przechodzi właśnie głęboką transformację. Wersja 3 to nie kolejna aktualizacja, ale fundamentalna zmiana paradygmatu – przejście od klasycznego IDE do zunifikowanej przestrzeni roboczej zaprojektowanej od podstaw do pracy z „flotą” agentów AI. To odpowiedź na rodzącą się trzecią erę rozwoju oprogramowania, w której autonomiczne agenty piszą niemal cały kod, a rolą programisty staje się zarządzanie procesem i review.

    Okno agentów: centralne stanowisko dowodzenia

    Sercem Cursor 3 jest nowe Okno Agentów (Agents Window), dostępne przez Cmd+Shift+P. To dedykowany panel boczny, który konsoliduje wszystkie agenty – lokalne, chmurowe, zdalne przez SSH czy te działające w worktrees – w jednym, przejrzystym interfejsie. Kluczową innowacją jest możliwość równoległego uruchamiania wielu agentów. Można np. uruchomić jednego agenta do eksploracji nowej architektury, drugiego do implementacji backendu, a trzeciego do pisania testów – wszystko jednocześnie, nawet w różnych repozytoriach.

    Interfejs jest z natury wielorepozytoryjny, co ułatwia współpracę człowieka i agentów w rozproszonych projektach. Co ważne, Cursor pozwala na płynne „przekazywanie” sesji agenta między środowiskami. Długotrwałe zadanie można przenieść z lokalnego komputera do chmury, aby działało, gdy laptop jest zamknięty. Gdy zaś potrzebne są szybkie iteracje i testy na własnej maszynie, sesję chmurową można pobrać lokalnie, korzystając z wydajnego modelu Composer 2.

    Tryb projektowania i kafelki: precyzja i wielozadaniowość

    Dwa inne flagowe elementy to Tryb Projektowania (Design Mode) i Karty Agentów (Agent Tabs). Tryb Projektowania, aktywowany skrótem Cmd+Shift+D, pozwala na bezpośrednią interakcję z UI w przeglądarce. Można zaznaczać obszary, dodawać elementy do chatu i dawać agentom precyzyjne wskazówki wizualne, co znacząco przyspiesza iteracje nad frontendem.

    Karty Agentów w edytorze umożliwiają natomiast przeglądanie wielu konwersacji jednocześnie – obok siebie lub w siatce. Uwalnia to programistę od uciążliwego przełączania się między zakładkami i pozwala śledzić postępy w różnych wątkach pracy. W najnowszej aktualizacji 3 wprowadzono też układ kafelkowy (tiled layout) w samym Oknie Agentów, co dodatkowo ułatwia multitasking i porównywanie wyników pracy różnych agentów.

    Samodzielne uczenie się i bezpieczeństwo w centrum

    Samodzielne uczenie się i bezpieczeństwo w centrum

    Cursor 3 to nie tylko interfejs. W parze z nim idą potężne funkcje automatyzacji. Bugbot, narzędzie do code review, zyskało zdolność do samodzielnego uczenia się (Learned Rules). Analizuje reakcje i komentarze recenzentów w pull requestach, tworząc na tej podstawie reguły, które stopniowo usprawniają przyszłe przeglądy. Te, które się sprawdzają, są automatycznie promowane, a nieskuteczne – wyłączane.

    Dla zespołów priorytetyzujących bezpieczeństwo i kontrolę, Cursor wprowadza samohostowane agenty chmurowe. Działają one wewnątrz własnej infrastruktury użytkownika, zapewniając, że codebase, dane wyjściowe buildów i wrażliwe informacje nigdy nie opuszczają sieci wewnętrznej, podczas gdy agent wykonuje polecenia lokalnie.

    Statystyki wewnętrzne: wizja przyszłości w działaniu

    Statystyki wewnętrzne: wizja przyszłości w działaniu

    Najbardziej wymowna jest wewnętrzna statystyka firmy Cursor. Według niej 35% wewnętrznych pull requestów jest już tworzonych przez autonomiczne agenty chmurowe działające na maszynach wirtualnych. Co więcej, agenty piszą niemal 100% kodu w tych procesach, a deweloperzy skupiają się na dekompozycji problemów, recenzji i udzielaniu feedbacku.

    W marcu 2025 roku użytkowników funkcji autouzupełniania (Tab) było 2,5 raza więcej niż użytkowników agentów. Dziś proporcje się odwróciły – użytkowników agentów jest 2 razy więcej. To pokazuje gwałtowną zmianę w sposobie pracy. Prognozy twórców są śmiałe: większość pracy programistycznej będzie wykonywana przez takie agenty w ciągu najbliższego roku.

    Podsumowanie: od pisania kodu do budowy fabryki

    Cursor 3 nie jest już narzędziem służącym przede wszystkim do pisania kodu. Jak mówią sami twórcy, stał się środowiskiem „pomagającym deweloperom w budowie fabryki, która tworzy ich oprogramowanie”. To przejście od modelu „pokaż i monitoruj” jednego agenta do zarządzania linią produkcyjną, gdzie floty agentów pracują asynchronicznie, a programista włącza się w obieg w odpowiednich momentach – do recenzji, feedbacku i dekompozycji skomplikowanych problemów.

    Dzięki integracji agentów z różnych kanałów (Slack, GitHub, Linear, web, mobile) w jeden spójny interfejs, Cursor 3 redukuje konieczność przełączania kontekstu i oferuje prawdziwie zunifikowane stanowisko pracy. To krok w stronę przyszłości, w której środowisko programistyczne nie tyle asystuje w kodowaniu, co zarządza autonomicznymi procesami wytwórczymi, stając się centrum dowodzenia dla nowej generacji inżynierii oprogramowania.


    Źródła

  • Zed 0.230.1 Daje Kontrolę Nad Zadaniami i Interfejsem

    Zed 0.230.1 Daje Kontrolę Nad Zadaniami i Interfejsem

    Nowa aktualizacja wydajnego edytora kodu Zed, oznaczona numerem 0.230.1, przynosi istotne udoskonalenia dla deweloperów, którzy cenią sobie precyzyjną kontrolę nad workflow. W centrum uwagi znalazły się dwa kluczowe obszary: konfiguracja zadań systemowych oraz personalizacja interfejsu użytkownika. Te zmiany, choć mają charakter szlifów technicznych, znacząco wpływają na codzienną wygodę programowania.

    Wersja 0.230.1 wprowadza bardziej przemyślaną logikę wykonywania zdefiniowanych zadań oraz daje użytkownikom nowe możliwości w układaniu przestrzeni roboczej, szczególnie w kontekście paneli Terminala i Agenta AI.

    Konfiguracja zadań: precyzyjne sterowanie zapisem

    Jedną z najbardziej wyczekiwanych poprawek w tym wydaniu jest udoskonalenie zachowania zadań wobec niezapisanych zmian w edytorze. W poprzedniej wersji (0.230.1) Zed przestał domyślnie zapisywać edytowane bufory przed uruchomieniem zadania. Chociaż dla wielu jest to preferowane zachowanie, niektórzy deweloperzy potrzebowali bardziej elastycznej kontroli.

    Aktualizacja 0.230.1 rozwiązuje ten problem, wprowadzając nowe pole "save" w plikach konfiguracyjnych tasks.json. Dzięki temu użytkownik może dla każdego zadania z osobna określić, czy Zed ma automatycznie zapisać wszystkie zmiany przed jego wykonaniem. To odwrócenie domyślnego zachowania z wersji 0.230.1 odbywa się teraz w sposób świadomy i konfigurowalny.

    Zadania w Zed można definiować na dwa sposoby. Plik globalny ~/.config/zed/tasks.json przechowuje komendy dostępne we wszystkich projektach. Z kolei plik lokalny .zed/tasks.json w katalogu głównym projektu pozwala na zdefiniowanie specyficznych dla niego skryptów, np. do budowania, testowania czy uruchamiania serwera deweloperskiego. Dostęp do edycji tych plików można uzyskać przez polecenia zed: open tasks (globalne) i zed: open project tasks (lokalne).

    Co ważne, zadania wspierają zmienne środowiskowe, takie jak $ZED_WORKTREE_ROOT (ścieżka do katalogu projektu), co pozwala tworzyć przenośne skrypty. Przykładowe zadanie do uruchomienia narzędzia lazygit mogłoby wyglądać następująco: {"label": "Otwórz lazygit", "command": "lazygit -p $ZED_WORKTREE_ROOT"}. Dzięki temu deweloperzy zajmujący się web developmentem czy DevOps mogą tworzyć powtarzalne, projektowe zestawy poleceń, które przyspieszają codzienną pracę.

    Elastyczny interfejs: panele na Twoich zasadach

    Drugi filar aktualizacji to dalsze usprawnienia personalizacji interfejsu użytkownika. Wersja 0.230.1 rozszerza możliwości wprowadzone w 0.230.1, dodając pełną kontrolę nad szerokością paneli Terminala i Agenta AI.

    Od teraz użytkownik może przełączać te panele między trybem stałej i elastycznej szerokości. Tryb elastyczny, znany już z centralnych paneli edycyjnych, pozwala panelowi na dynamiczne dopasowanie rozmiaru do dostępnej przestrzeni, co jest niezwykle użyteczne podczas pracy na mniejszych ekranach lub w złożonych układach okien.

    Ustawienie to można zmienić na dwa sposoby: bezpośrednio w oknie ustawień Zed lub szybciej – przez menu kontekstowe, wywoływane prawym przyciskiem myszy na przycisku danego panelu w pasku stanu. To małe, ale niezwykle praktyczne udogodnienie, które oddaje użytkownikowi pełnię kontroli nad organizacją przestrzeni roboczej, pozwalając dopasować ją do aktualnych potrzeb – czy to podczas pisania kodu z pomocą AI, czy zarządzania procesami w terminalu.

    Znaczenie w szerszym kontekście rozwoju Zed

    Wydanie 0.230.1 jest częścią cotygodniowego cyklu stabilnych aktualizacji Zed, który konsekwentnie wprowadza ulepszenia mające na celu usprawnienie pracy programistów. W ostatnim czasie zespół skupiał się na integracji funkcji AI, współpracy w czasie rzeczywistym, wsparciu dla Dev Containers oraz – jak widać – na dopracowywaniu podstawowych narzędzi, takich jak system zadań.

    Dopracowanie konfiguracji zadań wzmacnia pozycję Zed jako edytora, który nie tylko świetnie radzi sobie z edycją tekstu, ale także aspiruje do bycia centrum dowodzenia dla całego procesu rozwoju oprogramowania. Możliwość precyzyjnego zarządzania skryptami budowania, testowania i wdrażania bez opuszczania edytora to ważny krok w tym kierunku.

    Warto pamiętać, że system nie jest pozbawiony pewnych ograniczeń. Jak wskazują niektóre źródła, zadania mogą mieć problem z precyzyjnym dostępem do zmiennych stanu edytora, takich jak $ZED_FILE, co jest znanym błędem. Mimo to kierunek rozwoju jest wyraźny: Zed stara się scalać różne aspekty pracy dewelopera w spójnym, szybkim i konfigurowalnym środowisku. Aktualizacja 0.230.1, choć przyrostowa, solidnie przyczynia się do realizacji tego celu.


    Źródła

  • Kimi Code CLI 1.30.0: Lepsza Obsługa Sesji, Bezpieczeństwo i Narzędzia Pracy

    Kimi Code CLI 1.30.0: Lepsza Obsługa Sesji, Bezpieczeństwo i Narzędzia Pracy

    Wydanie Kimi Code CLI 1.30.0 to kolejny solidny krok w rozwoju tego narzędzia dla programistów. Agent CLI od MoonshotAI otrzymał zestaw funkcjonalności skupiających się na płynniejszym zarządzaniu sesjami, wzmocnieniu bezpieczeństwa oraz wygodniejszych narzędziach wspierających codzienną pracę z kodem. To aktualizacja, która w dużej mierze dotyka fundamentalnych aspektów użytkowania – stabilności, ochrony danych i kontroli nad przebiegiem pracy.

    Wygodniejsze zarządzanie sesjami i nowe komendy

    Jednym z kluczowych obszarów poprawy jest obsługa sesji. Wprowadzone zostały flagi --session oraz --resume (z krótkim aliasem -r), które pozwalają łatwo wrócić do poprzedniej sesji. Bez argumentu otwierają one interaktywny selektor sesji w terminalu, a z podanym ID sesji – wznawiają konkretną konwersację. CLI wyświetla nawet przypomnienie (kimi -r <session-id>) przy zakończeniu sesji, aby użytkownik zawsze wiedział, jak może ją kontynuować.

    Co ciekawe, dodano też komendy /undo oraz /fork do tworzenia forków sesji. /undo pozwala wybrać poprzednią turę i utworzyć nową sesję z wybraną wiadomością przygotowaną do ponownej edycji. /fork duplikuje całą historię konwersacji do nowej sesji. Warto podkreślić, że oryginalna sesja zawsze zostaje zachowana – to bezpieczny sposób na eksperymentowanie bez ryzyka utraty kontekstu.

    Dodano też ujednolicony tryb --plan oraz opcję konfiguracyjną default_plan_mode. Rozpoczęcie nowej sesji z flagą --plan lub poprzez ustawienie default_plan_mode = true w ~/.kimi/config.toml pozwala zacząć pracę w trybie planowania. Sesje wznowione zachowują swój dotychczasowy stan tego trybu.

    Zaawansowane filtry bezpieczeństwa dla plików

    Bezpieczeństwo otrzymało znaczący impuls. Narzędzia Grep oraz Read zostały wzmocnione ochroną plików wrażliwych. Automatycznie filtrują lub blokują one dostęp do takich plików jak .env, prywatne klucze SSH (id_rsa, id_ed25519, id_ecdsa) oraz pliki z danymi uwierzytelniającymi do chmury (.aws/credentials, .gcp/credentials). Co ważne, pliki typu .env.example, .env.sample czy .env.template są wyłączone z tej ochrony – rozróżnienie między rzeczywistymi danymi a przykładami jest kluczowe.

    Narzędzie Grep zyskało również nowy parametr include_ignored. Kiedy jest on ustawiony na true, włącza flagę ripgrep --no-ignore, pozwalając na przeszukiwanie plików wykluczonych przez .gitignore, takich jak artefakty budowania czy node_modules. Pliki wrażliwe pozostają jednak filtrowane przez dodatkową warstwę ochrony. Domyślnie wartość ta wynosi false, co zachowuje dotychczasowe zachowanie programu.

    Ulepszenia kompatybilności i stabilności

    Wydanie 1.30.0 naprawia też kilka problemów związanych z kompatybilnością i stabilnością. Rozwiązano błąd, przez który custom_headers nie były przekazywane do dostawców innych niż Kimi (OpenAI, Anthropic, Google GenAI, Vertex AI). Teraz są one poprawnie przesyłane dalej.

    Poprawiono wykrywanie skilli w katalogach marki (np. ~/.kimi/skills/). Wcześniej, jeśli istniejący katalog ogólny (~/.config/agents/skills/) był pusty, skille z katalogu marki mogły "zniknąć". Teraz mechanizm discovery niezależnie przeszukuje obie grupy katalogów i łączy wyniki. Dodano też opcję konfiguracyjną merge_all_available_skills. Gdy jest ona włączona, skille ze wszystkich istniejących katalogów marek (~/.kimi/skills/, ~/.claude/skills/, ~/.codex/skills/) are ładowane i scalane, zamiast używania tylko pierwszego znalezionego. Skille o tej samej nazwie mają priorytet według kolejności: kimi > claude > codex.

    Dopracowanie interfejsu i zachowania shella

    Shell otrzymał szereg subtelnych, ale ważnych poprawek. Udoskonalono automatyczne wyzwalanie autouzupełniania w tle (idle background completion) – wznowione sesje shella nie uruchamiają automatycznie tury na pierwszym planie z zaległymi powiadomieniami z tła przed wysłaniem wiadomości przez użytkownika. Nowe uzupełnienia w tle czekają też chwilę, gdy użytkownik aktywnie pisze, aby nie "ukraść" promptu ani nie zaburzyć wprowadzania znaków w systemach CJK IME.

    Poprawiono również UX komendy kimi export. Narzędzie pokazuje teraz podgląd poprzedniej sesji dla aktualnego katalogu roboczego i prosi o potwierdzenie, wyświetlając ID sesji, tytuł oraz czas ostatniej wiadomości użytkownika. Dodano flagę --yes, aby pominąć potwierdzenie. Naprawiono też parsowanie przy wywołaniach z jawnym ID sesji.

    Cel wydania i dalszy rozwój

    Wydanie Kimi Code CLI 1.30.0 jasno pokazuje kierunek rozwoju tego narzędzia: praktyczne, codzienne ulepszenia dla programistów zajmujących się web developmentem, DevOps czy "vibe codingiem". Skupienie na bezpieczeństwie, niezawodnym zarządzaniu sesjami oraz precyzji narzędzi czyni pracę z agentem CLI napędzanym przez AI bardziej produktywną i kontrolowaną.

    Kimi CLI jest dostępne przez PyPI (kimi-cli), a jego szybkie tempo wydawnicze świadczy o aktywnym rozwoju. Dla osób korzystających z terminala jako głównego środowiska pracy takie aktualizacje są często niedocenianym, ale kluczowym elementem sprawnego workflow.


    Źródła

  • Nowe Możliwości Współpracy w Zed: Udostępnianie Ekranu Na Wayland w Integracja Gita

    Nowe Możliwości Współpracy w Zed: Udostępnianie Ekranu Na Wayland w Integracja Gita

    Najnowsza stabilna wersja edytora Zed, oznaczona numerem 0.220.2, to odpowiedź na prośby społeczności, szczególnie programistów pracujących na Linuksie. Aktualizacja skupia się na usprawnieniu pracy zespołowej i dopracowaniu codziennych zadań deweloperskich. Dwa flagowe dodatki to ulepszenia w integracji z Gitem oraz poprawki dla środowiska Wayland.

    Ta wersja wychodzi naprzeciw potrzebom nowoczesnego programisty, łącząc wydajność lokalnego edytora z funkcjami ułatwiającymi vibe coding i zdalną współpracę. To nie tylko kilka nowych opcji, ale znaczący krok w stronę dojrzałości narzędzia, szczególnie na platformie Linux.

    Ulepszenia dla Wayland

    Dla użytkowników Linuksa, którzy przeszli na nowoczesny protokół wyświetlania Wayland, praca z Zedem bywała utrudniona. Wersja 0.220.2 wprowadza szereg poprawek mających na celu zwiększenie stabilności i komfortu pracy na tej platformie. Rozwiązano niektóre problemy specyficzne dla Wayland, takie jak błędy przy kopiowaniu tekstu do schowka. Należy jednak zaznaczyć, że pełne, natywne udostępnianie ekranu w sesji Wayland pozostaje wyzwaniem, a niektóre błędy (np. związane z uruchamianiem aplikacji) mogą jeszcze występować.

    Git na pierwszym planie: pogłębiona integracja

    Drugim filarem tej aktualizacji jest ściślejsza integracja z systemem kontroli wersji Git. Funkcje wprowadzone wcześniej (np. Git Panel w wersji 0.177) zostały rozbudowane. Wśród ulepszeń znajdują się bardziej uniwersalne narzędzia do wyboru plików (picker) oraz ulepszone widoki diff.

    Bezpośrednia wizualizacja statusu plików w repozytorium przyspiesza nawigację w projekcie i ułatwia orientację w kontekście zmian, co jest nieocenione w dużych, dynamicznie rozwijanych codebase'ach. To drobna, ale niezwykle praktyczna zmiana, która wpływa na codzienny flow programisty.

    Dopracowanie szczegółów dla wydajnej pracy

    Wersja 0.220.2 to także zestaw ulepszeń i poprawek, które razem składają się na znacznie płynniejszą pracę.

    • Wyszukiwanie i zamiana na nowym poziomie. Wprowadzono możliwość wieloliniowego wyszukiwania i zamiany zarówno w wyszukiwarce bufora (Buffer Search), jak i projektu (Project Search). To potężne narzędzie do refaktoryzacji i pracy z rozbudowanymi wzorcami tekstowymi.

    • Agent Panel staje się bardziej wszechstronny. Panel asystenta AI zyskał możliwość bezpośredniego wklejania plików i folderów, co ułatwia przekazywanie kontekstu modelom językowym. Dodano też wsparcie OAuth dla zdalnych serwerów MCP, zwiększając bezpieczeństwo integracji z zewnętrznymi narzędziami.

    • Powrót do korzeni z modelines. Dla miłośników tradycyjnych edytorów, takich jak Vim czy Emacs, dodano obsługę modelines. Są to specjalne komentarze w plikach (np. # vim: syntax=python), które pozwalają na automatyczne wykrywanie języka lub ustawianie konkretnych opcji edytora (np. włączenie trybu Vim) dla danego pliku.

    • Szereg poprawek stabilizacyjnych. Na długiej liście zmian znalazły się m.in.: poprawki renderowania tekstu i tytułów okien na Linuksie (X11), lepsza obsługa aktualizacji na Linuksie przy braku narzędzia rsync, poprawki działania schowka dla użytkowników pakietu Office na Windowsie oraz usprawnienia w interakcjach z modelami AI podczas sesji kolaboracyjnych.

    Podsumowanie: skupienie na pracy zespołowej i ekosystemie Linux

    Wydanie Zed 0.220.2 jasno pokazuje kierunek rozwoju tego edytora: pogłębiona integracja, współpraca w czasie rzeczywistym i wsparcie dla różnych ekosystemów deweloperskich. Rozwiązanie problemów związanych z protokołem Wayland to sygnał dla społeczności, że jej głos jest brany pod uwagę.

    Ulepszenie integracji z Gitem czy wprowadzenie wieloliniowego wyszukiwania to z kolei odpowiedź na codzienne potrzeby efektywnego kodowania. Te zmiany, choć mogą wydawać się ewolucyjne, w połączeniu z setkami poprawek błędów realnie przekładają się na komfort użytkowania Zeda. To solidna aktualizacja, która utwierdza pozycję Zeda jako poważnego narzędzia w warsztacie nowoczesnego programisty.


    Źródła