Kategoria: Technologie

  • Google uwalnia potencjał sztucznej inteligencji na Macu. Gemini for Mac już oficjalnie dostępne

    Google uwalnia potencjał sztucznej inteligencji na Macu. Gemini for Mac już oficjalnie dostępne

    Google udostępniło natywną aplikację Gemini na komputery Mac. Program nie jest jedynie kopią wersji przeglądarkowej, ale został napisany od podstaw w języku Swift, co pozwala na integrację z systemem macOS. Użytkownicy mogą korzystać z darmowej wersji z limitami lub wybrać płatne pakiety, takie jak AI Plus, AI Pro czy AI Ultra.

    Aplikacja jest dostępna do pobrania na stronie gemini.google/mac/. Google zdecydowało się ominąć App Store, co pozwala firmie wydawać aktualizacje bez czekania na weryfikację Apple. Do działania wymagany jest komputer z procesorem Apple Silicon oraz system macOS 15 (Sequoia) lub nowszy. Osoby korzystające ze starszych wersji systemu lub komputerów z procesorami Intel nie mogą zainstalować tej wersji.

    Szybkość i analiza treści na ekranie

    Główną zaletą aplikacji jest łatwy dostęp, przypominający działanie systemowej wyszukiwarki Spotlight. Program można wywołać skrótem klawiaturowym Option + Spacja, co otwiera małe okno do szybkich pytań. Pełny czat uruchamia się kombinacją Option + Shift + Spacja. Ikona Gemini jest widoczna w Docku oraz na górnym pasku menu.

    Aplikacja potrafi analizować to, co aktualnie wyświetla się na monitorze. Po włączeniu odpowiednich uprawnień w ustawieniach prywatności i dostępności, Gemini widzi otwarte dokumenty PDF, arkusze kalkulacyjne czy kod w edytorze. Dzięki temu asystent może streścić tekst, wyjaśnić skomplikowane fragmenty danych lub zasugerować poprawki w projekcie graficznym bez konieczności ręcznego kopiowania treści.

    Narzędzia dla twórców i programistów

    Gemini na Maca oferuje te same funkcje, co wersja mobilna i przeglądarkowa. Użytkownicy mogą korzystać z modelu Imagen 3 do generowania obrazów oraz narzędzia Veo do tworzenia krótkich materiałów wideo. Program ułatwia pracę nad projektami kreatywnymi i technicznymi.

    Programiści i osoby pracujące z dużą ilością danych mogą przesyłać pliki bezpośrednio do aplikacji. Gemini pomaga w pisaniu kodu, tłumaczeniu tekstów i planowaniu zadań. Dzięki temu, że aplikacja działa lokalnie jako natywny program, reaguje szybciej niż interfejs w przeglądarce internetowej.

    Konkurencja na rynku

    Wprowadzenie tej aplikacji to ruch wymierzony w ChatGPT Desktop oraz Microsoft Copilot. Google postawiło na ścisłe połączenie asystenta z systemem operacyjnym, co ma przyciągnąć osoby na co dzień korzystające z komputerów Apple.

    Oficjalna premiera odbyła się 16 kwietnia 2024 roku, kończąc okres zamkniętych testów. Od pierwszych zapowiedzi aplikacja została rozbudowana o stabilną analizę ekranu i obsługę plików. Google regularnie dodaje nowe funkcje, dostosowując narzędzie do aktualnych możliwości modeli językowych.

    Dostępność i wymagania

    Gemini na Maca jest skierowane do osób, które chcą mieć dostęp do sztucznej inteligencji bez przełączania się między kartami przeglądarki. Choć wymóg posiadania najnowszego systemu i procesora Apple Silicon ogranicza grono odbiorców, zapewnia to płynne działanie programu.

    Aplikacja obsługuje język polski oraz wszystkie inne języki dostępne wcześniej w wersji mobilnej. Wybór między instalacją aplikacji a korzystaniem z przeglądarki zależy od tego, jak bardzo asystent ma być zintegrowany z codziennymi zadaniami. Google promuje rozwiązanie systemowe jako szybszy i wygodniejszy sposób pracy na Macu.

  • Claude Code 2.0: Przebudowa narzędzia do kodowania z AI, nowy design i automatyzacja rutyn

    Claude Code 2.0: Przebudowa narzędzia do kodowania z AI, nowy design i automatyzacja rutyn

    Claude Code 2.0 to kolejna wersja narzędzia od Anthropic, która wprowadza funkcje automatyzujące powtarzalne zadania w pracy programisty. Zmiany te sprawiają, że AI staje się stałym elementem procesu tworzenia oprogramowania, a nie tylko dodatkiem.

    Do najważniejszych nowości należy funkcja By the Way. Pozwala ona Claude’owi pracować nad wieloma zadaniami jednocześnie – model może kontynuować przerwane wątki w czasie, gdy czeka na reakcję użytkownika. Twórcy dodali także integrację z Telegramem oraz poprawili zarządzanie pamięcią kontekstową. Bardziej zaawansowani użytkownicy mogą korzystać z hooków worktree, interfejsu CLI do zarządzania agentami oraz bezpośredniego połączenia z VS Code. Dzięki temu narzędzie rzadziej czeka na polecenia, a częściej samodzielnie wspiera bieżący proces pracy.

    Aplikacja i integracje: centrum pracy programisty

    Zmiany w organizacji pracy opierają się na obsłudze równoległych instancji i agentów. Wykorzystanie funkcji multi-worktree w systemie Git sprawia, że deweloper może rozwijać kilka funkcji w tym samym czasie w osobnych, odizolowanych środowiskach.

    Kluczowa jest też natywna integracja z VS Code. Claude łączy się bezpośrednio z edytorem, co daje dostęp do modelu bez wychodzenia z IDE. Jest to pomocne podczas pisania i poprawiania kodu, ponieważ pozwala zachować ciągłość pracy w jednym oknie.

    Dostępność i kierunki rozwoju

    Pełny dostęp do nowych funkcji wymaga subskrypcji w planach Claude Pro, Max, Team lub Enterprise. Użytkownik musi posiadać zainstalowaną najnowszą wersję oprogramowania, co potwierdza, że Anthropic kieruje ten produkt głównie do sektora profesjonalnego.

    Jednocześnie firma rozwija system tzw. skills. Są to konkretne umiejętności, które można aktywować wewnątrz modelu. Choć jest to osobny projekt, pokazuje on dążenie do stworzenia uniwersalnego asystenta, w którym Claude Code 2.0 odpowiada za zadania techniczne.

    Podsumowanie

    Aktualizacje Claude Code 2.0 zmieniają sposób korzystania z tego narzędzia. Program nie jest już tylko chatbotem generującym fragmenty tekstu, ale staje się częścią środowiska programistycznego. Wielozadaniowość, integracja z VS Code oraz obsługa wielu instancji Git to funkcje, które realnie wpływają na szybkość i porządek w projektach. Rozwój tych technologii pokazuje, że w narzędziach AI dla programistów liczy się obecnie przede wszystkim ścisłe dopasowanie do codziennych nawyków pracy i istniejących ekosystemów.

  • GPT-5.4-Cyber – plotka czy nowy front w defensywnym AI?

    GPT-5.4-Cyber – plotka czy nowy front w defensywnym AI?

    Pojawiające się w sieci doniesienia o modelu GPT-5.4-Cyber budzą spore zainteresowanie, ale też sporo wątpliwości. Według krążących informacji miałaby to być specjalistyczna wersja systemu skupiona na defensywnym cyberbezpieczeństwie, dostępna tylko dla zweryfikowanych firm i badaczy. Dostępne fakty nie potwierdzają jednak, by OpenAI wydało taki osobny produkt. Prawdopodobnie mamy do czynienia z połączeniem kilku różnych inicjatyw firmy.

    Skąd wzięły się te informacje?

    Zamieszanie wynika najpewniej z premiery modelu GPT-5.4, którą OpenAI ogłosiło w marcu 2026 roku. Jest to system przeznaczony do najbardziej złożonych zadań profesjonalnych. Ma on funkcje sterowania systemami operacyjnymi i przeglądarkami, co potwierdzają wyniki w testach OSWorld-Verified i WebArena-Verified. Dodatkowo model posiada okno kontekstowe o wielkości miliona tokenów oraz architekturę typu "Thinking". Te parametry sprawiają, że system nadaje się do zaawansowanej analityki, w tym do zadań związanych z bezpieczeństwem cyfrowym.

    Nazwa "GPT-5.4-Cyber" jest więc najpewniej potocznym określeniem na użycie standardowego modelu GPT-5.4 w kontrolowanych scenariuszach obronnych. Nie jest to nowa, osobna architektura, lecz wykorzystanie istniejącej technologii w konkretnym, wrażliwym celu.

    Przyczyny ograniczonego dostępu

    Wprowadzenie restrykcji w dostępie do zaawansowanych modeli wynika z kwestii bezpieczeństwa. Sztuczna inteligencja w rękach ekspertów od zabezpieczeń pozwala szybciej analizować logi systemowe, wykrywać nietypowe zachowania sieci, zarządzać ryzykiem czy przygotowywać materiały szkoleniowe chroniące przed phishingiem.

    Jednocześnie te same funkcje mogą zostać wykorzystane do automatyzacji ataków, generowania złośliwego oprogramowania lub prowadzenia kampanii socjotechnicznych. Ograniczenie dostępu do sprawdzonych organizacji ma na celu wsparcie obrony przy jednoczesnym utrudnieniu działań przestępczych. Takie działania wpisują się w ramy prawne, takie jak unijny AI Act oraz Cyber Resilience Act, które nakładają na producentów wymóg odpowiedzialnego wdrażania technologii.

    Rynek i rola AI w ochronie danych

    Niezależnie od tego, czy powstanie dedykowana wersja "Cyber", zapotrzebowanie na AI w sektorze bezpieczeństwa rośnie. Firmy zmagają się z brakiem specjalistów, a straty finansowe powodowane przez ataki hakerskie są coraz wyższe.

    W Polsce brakuje przede wszystkim analityków SOC, testerów penetracyjnych i ekspertów od chmury. Model GPT-5.4 generuje o 18% mniej błędów i o 33% rzadziej zmyśla informacje (halucynuje) w porównaniu do wersji GPT-5.2. Dzięki możliwości przetwarzania dużych zbiorów danych system ten może odciążyć zespoły techniczne, działając jako asystent przy codziennych operacjach.

    Podsumowanie

    Informacje o GPT-5.4-Cyber to prawdopodobnie interpretacja możliwości modelu GPT-5.4 połączona z zapowiedziami o selektywnym udostępnianiu narzędzi AI branży cyberbezpieczeństwa. Obecnie nie ma dowodów na istnienie oddzielnego produktu o tej nazwie.

    Widać jednak wyraźny kierunek rozwoju branży. Skuteczna ochrona cyfrowa będzie wymagała korzystania z AI, ale w sposób kontrolowany. Zamiast szukać jednego, dedykowanego narzędzia, firmy i regulatorzy skupiają się na tworzeniu bezpiecznych zasad i ekosystemów, które pozwolą wykorzystać ogólne modele językowe do wzmocnienia systemów obronnych.

  • Google łączy siły: NotebookLM teraz głęboko zintegrowany z aplikacją Gemini

    Google łączy siły: NotebookLM teraz głęboko zintegrowany z aplikacją Gemini

    Google wprowadziło zmianę w sposobie korzystania ze swoich narzędzi AI, łącząc NotebookLM bezpośrednio z aplikacją Gemini. NotebookLM, który do tej pory był osobnym programem do analizy dokumentów, jest teraz dostępny z poziomu głównego czatu Gemini. Dzięki temu użytkownicy nie muszą już przełączać się między różnymi kartami przeglądarki, aby pracować na swoich materiałach.

    Obsługa tej funkcji jest prosta. W oknie czatu Gemini, obok ikony dodawania plików, znajduje się przycisk NotebookLM. Po jego kliknięciu można wybrać konkretny notatnik zawierający pliki PDF, artykuły czy transkrypcje z YouTube. Od tego momentu Gemini wykorzystuje te dokumenty jako bazę do udzielania odpowiedzi. AI automatycznie uwzględnia treść źródeł przy tworzeniu streszczeń czy analiz, bez konieczności każdorazowego wklejania tekstu do czatu.

    Jak to działa w praktyce

    Główną korzyścią jest wygoda. Użytkownik rozmawia z Gemini, korzystając z możliwości modelu, a jednocześnie ma pewność, że odpowiedzi opierają się na jego własnych plikach. Aby sprawdzić konkretne źródło lub dodać nowy dokument, wystarczy kliknąć przycisk "źródła". Wszystkie dane i zmiany w notatnikach są aktualizowane na bieżąco.

    Integracja pozwala też na zarządzanie bazą wiedzy bezpośrednio z poziomu Gemini. Można tam dodawać nowe linki i pliki, a także zapisywać fragmenty rozmów bezpośrednio w strukturze notatnika.

    Różnica w sposobie działania

    To połączenie zmienia sposób, w jaki AI przetwarza informacje. Standardowy NotebookLM jest systemem zamkniętym, co oznacza, że odpowiada tylko na podstawie wgranych dokumentów. Wersja wbudowana w Gemini daje większy wybór.

    Użytkownik może zdecydować, czy AI ma trzymać się wyłącznie dostarczonych materiałów, czy może uzupełnić odpowiedź o informacje z internetu. Pozwala to na łączenie precyzyjnej analizy własnych danych z szeroką wiedzą dostępną w sieci.

    Zastosowanie w nauce i pracy

    Połączenie bazy wiedzy NotebookLM z funkcjami konwersacyjnymi Gemini ułatwia pracę osobom zajmującym się analizą danych, studentom i badaczom. Rozwiązuje to problem wyboru między narzędziem do pracy na źródłach a wszechstronnym asystentem AI.

    W edukacji rozwiązanie to wykorzystuje model Gemini z komponentami LearnLM, które są dostosowane do celów dydaktycznych. Nauczyciele mogą dzięki temu sprawniej przygotowywać materiały na podstawie konkretnych podręczników, a studenci mogą analizować literaturę przedmiotu w jednym oknie.

    Nowe możliwości dla użytkowników

    Wprowadzenie NotebookLM do Gemini upraszcza proces badania i gromadzenia informacji. Zamiast korzystać z kilku osobnych narzędzi, użytkownik otrzymuje jedno środowisko, w którym porządkuje źródła i od razu o nie pyta.

    Obecnie funkcja ta jest wdrażana stopniowo, głównie dla użytkowników korzystających z komputerów. Google dąży do ściślejszego powiązania swoich usług AI, co w praktyce oznacza mniej kopiowania danych i szybszy dostęp do własnych notatek podczas rozmowy z botem. Dla osób pracujących z dużą ilością tekstu jest to ułatwienie, które realnie przyspiesza codzienną pracę.

  • Claude Code Wprowadza Interaktywne Lekcje i Optymalizuje Wydajność w Wersji 2.1.90

    Claude Code Wprowadza Interaktywne Lekcje i Optymalizuje Wydajność w Wersji 2.1.90

    Nowa aktualizacja Claude Code, oznaczona numerem 2.1.90, przynosi znaczące usprawnienia zarówno dla nowych użytkowników, jak i zaawansowanych deweloperów. Wydanie skupia się na stabilności, naprawia uciążliwe błędy i wzmacnia bezpieczeństwo, szczególnie w środowiskach DevOps, a także wprowadza kluczowe funkcjonalności, takie jak asynchroniczne agenty i pamięć sesji.

    Nowe możliwości: asynchroniczne agenty i pamięć sesji

    Flagową funkcją tej aktualizacji jest wprowadzenie zaawansowanych, asynchronicznych agentów. Pozwalają one na bardziej złożoną i długotrwałą automatyzację zadań programistycznych, działając w tle i zarządzając wieloma wątkami pracy. To ogromny krok naprzód w kwestii efektywności, zwłaszcza w kontekście „vibe coding” – płynnego, intuicyjnego programowania wspomaganego przez AI.

    Dodano również ulepszoną pamięć sesji, która pozwala Claude Code lepiej śledzić kontekst i stan długich, złożonych zadań. Dzięki temu narzędzie może płynniej współpracować z programistą przez cały cykl rozwoju funkcji – od planowania po wdrożenie – zachowując spójność i unikając powtarzania instrukcji.

    Znaczące usprawnienia wydajności i stabilności

    Pod maską wersji 2.1.90 kryje się solidna porcja optymalizacji. Inżynierowie skupili się na poprawie działania długotrwałych sesji, które są kluczowe dla zaawansowanych agentów AI i złożonych workflow hostingowych.

    Przeprojektowano architekturę, aby lepiej obsługiwać warstwowy system uprawnień, integracje MCP (Model Context Protocol) i podagenty. Te zmiany zwiększają ogólną niezawodność systemu, szczególnie podczas wykonywania rozbudowanych, zautomatyzowanych zadań.

    Krytyczne poprawki błędów dla płynnej automatyzacji

    Aktualizacja usuwa kilka uciążliwych problemów, które mogły zakłócać pracę, szczególnie w zautomatyzowanych pipeline'ach. Rozwiązano konflikty edycji plików, w tym irytujący błąd „File content has changed”, który często pojawiał się przy hookach typu format-on-save, oraz wyeliminowano fałszywe pozytywy przy kolejnych edycjach. Działanie narzędzia zostało zoptymalizowane, aby zapewnić płynniejszą i bardziej przewidywalną automatyzację.

    Wzmacnianie bezpieczeństwa i kontroli środowiskowej

    W kwestii bezpieczeństwa wersja 2.1.90 wprowadza wzmocnienia sandboxa, niezbędne w środowiskach produkcyjnych DevOps. Architektura z warstwowym systemem uprawnień i hookami zapewnia lepszą kontrolę nad wykonywanymi działaniami.

    Dodano także nowe zmienne środowiskowe, które dają administratorom większą swobodę w konfiguracji środowisk offline lub wyspecjalizowanych. Ulepszono tryb Auto, który teraz ściślej przestrzega jawnych instrukcji, takich jak „don't push”, oraz wprowadzono inteligentniejsze bramki workflow.

    Podsumowanie: krok naprzód dla profesjonalnych inżynierów

    Wydanie Claude Code 2.1.90 to dowód na skupienie się na potrzebach profesjonalnych inżynierów oprogramowania. Łączy ono zaawansowane możliwości automatyzacji (asynchroniczne agenty i pamięć sesji) z głębokimi usprawnieniami technicznymi, które wspierają wymagające, zautomatyzowane workflow.

    Te zmiany, będące częścią szybkiego cyklu iteracyjnego projektu, bezpośrednio wspierają nowoczesne praktyki web developmentu i AI. Dzięki nim długotrwałe sesje agentów są stabilniejsze, automatyzacja mniej podatna na błędy, a możliwości narzędzia – znacznie szersze. To kompleksowa aktualizacja, która podnosi poprzeczkę w kategorii inteligentnych asystentów programistycznych.


    Źródła

  • Codex 0.118.0: Wzmocnione Zabezpieczenia Sieciowe, Nowy Flow Logowania i Poprawki Interfejsu

    Codex 0.118.0: Wzmocnione Zabezpieczenia Sieciowe, Nowy Flow Logowania i Poprawki Interfejsu

    OpenAI wydało kolejną aktualizację swojego narzędzia CLI dla deweloperów. Codex 0.118.0 przynosi ulepszenia w obszarach bezpieczeństwa, autoryzacji i interfejsu użytkownika, skupiając się na stabilizacji i usprawnieniu codziennych workflowów programistów. Ta wersja jest dostępna na platformie Chocolatey i kontynuuje trend wzmacniania sandboxów oraz integracji z zewnętrznymi dostawcami modeli AI.

    Aktualizacja skupia się na naprawie błędów i dostarczeniu funkcji, które bezpośrednio przekładają się na komfort pracy. To nie są rewolucyjne zmiany, lecz konkretne usprawnienia, które eliminują irytujące problemy i otwierają nowe możliwości, szczególnie dla zespołów korzystających z własnej infrastruktury AI.

    Główne ulepszenia w sieci i sandboxach

    Kluczową zmianą w tej wersji są prace nad poprawą niezawodności sandboxów. Zmiany te wpisują się w szerszą strategię Codexa: oferowanie potężnych, a zarazem bezpiecznych środowisk izolowanych, które pozwalają AI na wykonywanie poleceń systemowych, instalację zależności czy operacje na plikach bez ryzyka dla głównego systemu.

    Nowe możliwości autoryzacji i logowania

    Codex 0.118.0 wprowadza ulepszenia w sposobie uwierzytelniania. To ważne ułatwienie dla firm, które integrują Codexa z własnymi lub zewnętrznymi modelami językowymi, gdzie konieczne jest sprawne zarządzanie kluczami API.

    Praktyczne usprawnienia CLI i interfejsu TUI

    W codziennej pracy w terminalu ta wersja wprowadza istotne poprawki. Interfejs tekstowy użytkownika (TUI) również otrzymał zestaw poprawek. Usunięto także przestarzałe elementy, oczyszczając kod i interfejs.

    Dlaczego to ważne dla deweloperów webowych i DevOps?

    Codex ewoluuje w kierunku kompleksowego narzędzia do vibe codingu i rozwoju oprogramowania wspomaganego przez AI. Możliwość bezpiecznego uruchamiania poleceń shell, operacji git czy instalacji zależności w sandboxie, sterowana językiem naturalnym, idealnie wpisuje się w workflow nowoczesnego dewelopera. Dla zespołów DevOps łatwa integracja z niestandardowymi modelami to klucz do włączenia wewnętrznych narzędzi AI do procesu.

    Aktualizacja 0.118.0 ma przede wszystkim charakter stabilizacyjny. To solidny krok, który przygotowuje grunt pod przyszłe, bardziej eksperymentalne funkcje.

    Podsumowanie i wnioski

    Codex 0.118.0 może nie jest najbardziej spektakularną aktualizacją, ale z pewnością należy do tych najbardziej praktycznych. Koncentruje się na tym, co istotne w zastosowaniach produkcyjnych: bezpieczeństwie sieci, niezawodnym logowaniu, wygodzie pracy w terminalu i stabilności. Naprawa bugów w TUI to zmiana, która realnie przyspiesza codzienną pracę.

    Ogólny kierunek jest jasny: Codex staje się coraz dojrzalszym, bardziej konfigurowalnym i bezpiecznym środowiskiem do programowania wspomaganego sztuczną inteligencją. Każdemu, kto już korzysta z tego narzędzia, zaleca się aktualizację do wersji 0.118.0, choć – jak zawsze – warto najpierw przetestować ją w środowisku testowym.


    Źródła

  • Claude Code Wchodzi na Nowy Poziom: Wydanie 2.1.89 z Ulepszeniami Bezpieczeństwa, Przyjacielem i Ogromem Poprawek

    Claude Code Wchodzi na Nowy Poziom: Wydanie 2.1.89 z Ulepszeniami Bezpieczeństwa, Przyjacielem i Ogromem Poprawek

    Anthropic wypuściło właśnie nową wersję swojego narzędzia dla programistów – Claude Code. To nie jest zwykła aktualizacja z drobnymi poprawkami. Wydanie 2.1.89, które trafiło do użytkowników 31 marca 2026 roku, przynosi istotne ulepszenia w zarządzaniu sesjami, kluczowe poprawki stabilności oraz… zabawnego „towarzysza”. To solidna aktualizacja, która pokazuje, jak dojrzała staje się ta platforma.

    Kluczowe ulepszenia w kontroli dostępu i sesjach

    Jednym z filarów tej aktualizacji jest znacznie lepsza kontrola nad tym, co Claude Code 2.1.89 może robić. Wprowadzono nową opcję uprawnień „defer” dla hooków PreToolUse. W praktyce oznacza to, że sesje bez interfejsu użytkownika (headless) mogą teraz wstrzymać działanie w momencie wywołania narzędzia, a następnie wznowić pracę z określonymi flagami. Daje to administratorom i twórcom zautomatyzowanych workflow znacznie większą precyzję.

    Poza tym reguły zezwoleń (allow rules) zostały udoskonalone tak, aby mogły sprawdzać cel docelowy rozwiązanego dowiązania symbolicznego (symlink), a nie tylko żądaną ścieżkę. To ważne wzmocnienie zabezpieczeń, które utrudnia obejście kontroli dostępu poprzez manipulację dowiązaniami.

    Stabilność i wydajność: koniec z wyciekami pamięci i crashami

    Dla użytkowników pracujących nad długimi, złożonymi projektami wersja 2.1.89 to prawdziwy zastrzyk stabilności. Zespół naprawił kilka krytycznych problemów, które potrafiły uprzykrzyć życie.

    Wyeliminowano wyciek pamięci, w którym duże wejścia JSON były przetrzymywane w pamięci jako klucze cache LRU w długo działających sesjach. Mogło to stopniowo prowadzić do spadku wydajności. Dodatkowo rozwiązano problem crashowania aplikacji podczas usuwania wiadomości z bardzo dużych plików sesji przekraczających 50 MB. Jest to szczególnie ważne dla zespołów, które korzystają z Claude Code 2.1.89 przez wiele dni bez restartu.

    Usprawniono też działanie serwera LSP (Language Server Protocol). Wcześniej po awarii wpadał on w stan „zombie” i odmawiał współpracy aż do restartu całej sesji. Teraz po prostu uruchamia się ponownie przy kolejnym żądaniu.

    Poprawki dla systemów Windows i macOS

    Wydanie 2.1.89 przynosi też wiele poprawek specyficznych dla poszczególnych systemów operacyjnych, co świadczy o dbałości o doświadczenia wszystkich użytkowników.

    W systemie Windows naprawiono irytujący błąd, w którym narzędzia Edit/Write podwajały znaki CRLF, jednocześnie usuwając twarde podziały wierszy w Markdown (dwie spacje na końcu linii). Dodatkowo rozwiązano problem z trybem głosowym, który na Windowsie kończył się błędem z komunikatem „WebSocket upgrade rejected with HTTP 101”.

    Użytkownicy macOS docenią z kolei naprawę deep linków, które wcześniej czasami nie chciały się otwierać.

    Nowa funkcja: „Buddy” i ulepszenia dla deweloperów

    Nie samą pracą człowiek żyje. Wydanie 2.1.89 zawiera też żartobliwą funkcję „buddy” – małego towarzysza w terminalu. To miły, lekki akcent w narzędziu, które zwykle kojarzy się z intensywnym kodowaniem.

    Poza tym wprowadzono mnóstwo usprawnień w codziennej pracy dewelopera. Ulepszono ostrzeżenia w narzędziu Bash, które teraz informują, gdy polecenie formatera lub lintera modyfikuje pliki, które zostały już wcześniej odczytane. Pomaga to uniknąć błędów typu „stale-edit”. Poprawiono też komunikaty o niedostępności narzędzi – teraz wyjaśniają one, dlaczego dane narzędzie jest niedostępne i co zrobić, aby je uruchomić.

    Wprowadzono również wsparcie dla podpisów manifestów w wydaniach, co zwiększa bezpieczeństwo procesu aktualizacji. Użytkownicy mogą teraz skonfigurować kanał aktualizacji: "latest" dla natychmiastowego dostępu do nowości lub "stable" dla wersji przetestowanej przez tydzień, co pozwala uniknąć wydań z poważnymi regresjami.

    Podsumowanie: dojrzałość i precyzja

    To wydanie Claude Code 2.1.89 jest przykładem świetnie zbalansowanej aktualizacji. Nie wprowadza rewolucyjnych zmian w interfejsie, ale za to skupia się na fundamentach: bezpieczeństwie, stabilności i wydajności. Poprawki dotyczące wycieków pamięci, crashy przy dużych plikach, lepsza kontrola uprawnień i dziesiątki mniejszych usprawnień sprawiają, że na narzędziu można po prostu bardziej polegać.

    Dodatkowo wprowadzenie konfigurowalnych kanałów aktualizacji i podpisów manifestów pokazuje dbałość o zaawansowanych użytkowników i administratorów. A lekki, żartobliwy akcent w postaci „buddy’ego” przypomina, że narzędzia dla programistów, nawet tak zaawansowane, mogą mieć odrobinę ludzkiej twarzy. To solidny krok naprzód dla całej platformy.


    Źródła

  • Codex Wdraża Nową Strategię Bezpieczeństwa: Wersja 0.119.0-Alpha.1 Chroni Pliki i Rozbudowuje Workflow

    Codex Wdraża Nową Strategię Bezpieczeństwa: Wersja 0.119.0-Alpha.1 Chroni Pliki i Rozbudowuje Workflow

    Najnowsza wersja alfa Codex, oznaczona jako 0.119.0-Alpha.1, nie wprowadza rewolucyjnych funkcji, ale konsekwentnie buduje fundamenty bezpieczeństwa i stabilności. To właśnie takie wydania często mają największy wpływ na codzienną pracę deweloperów, eliminując subtelne, lecz dokuczliwe problemy oraz wzmacniając ochronę projektu.

    Zaostrzenie polityki sandboxa i sieci

    Kluczowym obszarem poprawy w tej wersji alfa jest sandbox – izolowane środowisko, w którym Codex wykonuje operacje. Wprowadzone zmiany obejmują szereg uściśleń dotyczących sieci oraz obsługi przypadków brzegowych na różnych platformach. Na przykład polityka proxy sieciowego jest teraz odświeżana automatycznie po zmianach w sandboxie, co zapewnia ciągłość bezpiecznych połączeń.

    Co ważne dla użytkowników Windows, poprawiono obsługę adresów w firewallu, co jest kluczowe dla reguł egress (ruch wychodzący) działających wyłącznie przez proxy. Bezpośrednio wpływa to na bezpieczny rozwój aplikacji wymagających kontrolowanej komunikacji sieciowej.

    Naprawiono też błąd krytyczny (panic) klienta HTTP w sandboxie na macOS oraz wyciszono nieistotne ostrzeżenia bubblewrap, co przekłada się na stabilniejszą pracę. Drobna, lecz znacząca poprawka dotyczy też błędów apply_patch w trybie read-only – teraz są one prezentowane w sposób bardziej czytelny.

    Bezpieczeństwo plików projektowych od pierwszej linii

    Jedna z najistotniejszych zmian w zakresie bezpieczeństwa dotyczy ochrony plików .codex w lokalnym projekcie. Dotychczas istniała luka: pierwsze utworzenie takich plików mogło ominąć mechanizm wymagający zatwierdzenia przez użytkownika (approval checks). W tej wersji alfa ta luka została zamknięta. Oznacza to, że nawet inicjalne zapisy do tych kluczowych plików konfiguracyjnych są teraz chronione, co stanowi kolejną barierę przed przypadkowym lub celowym nadpisaniem krytycznych danych projektu.

    Poprawki dotyczą także bardziej zaawansowanych scenariuszy. Naprawiono obsługę uprawnień sandboxa dla symlinkowanych writable roots i carveouts. Bez tej poprawki pewne operacje w powłoce (shell) czy workflow apply_patch mogły kończyć się niepowodzeniem, utrudniając pracę.

    Stabilność TUI, MCP i połączeń sieciowych

    Wydanie przynosi także szereg poprawek zwiększających ogólną stabilność i niezawodność środowiska pracy. Wyeliminowano błędy typu panic przy komendzie codex --remote wss://... poprzez poprawne instalowanie providera kryptograficznego Rustls przed nawiązywaniem połączeń TLS przez WebSocket. Rozwiązuje to problem, który mógł uniemożliwiać korzystanie z funkcji remote.

    W obszarze Model Context Protocol (MCP), dzięki aktualizacji do rmcp 0.8.3, zwiększono niezawodność uruchamiania serwerów MCP. Guardian – system odpowiedzialny za analizę i zatwierdzanie działań – stał się bardziej efektywny dzięki wysyłaniu delt (różnic) w transcriptach zamiast pełnej historii za każdym razem. Dodano też stabilne ID dla recenzji w Guardianie, co ułatwia śledzenie procesów.

    W Tool UI (TUI) zachowano oryginalną kolejność wyników wyszukiwania narzędzi, co jest istotne dla ergonomii pracy – algorytmiczne zmienianie kolejności wyników często dezorientuje użytkowników. Usprawniono też rejestrowanie (recording) dla rolloutów poprzez implementację mechanizmu retry dla nieudanych operacji flush, zmniejszając ryzyko utraty danych diagnostycznych.

    Rozbudowa workflow: autentykacja i komenda exec

    Choć główny nacisk w tym wydaniu położono na bezpieczeństwo i stabilność, nie zabrakło praktycznych usprawnień w workflow. Dodano nowy proces autentykacji dla ChatGPT poprzez device code. To alternatywna, często bezpieczniejsza lub wygodniejsza metoda logowania, szczególnie w środowiskach z ograniczonym dostępem.

    Rozbudowano także możliwości komendy codex exec, która teraz obsługuje piped input. To prosta, lecz bardzo użyteczna zmiana, która pozwala płynniej integrować Codex z istniejącymi potokami (pipelines) deweloperskimi, umożliwiając przekazywanie danych bezpośrednio z innych procesów.

    Podsumowanie: Fundamenty dla Vibe Coding

    Wersja 0.119.0-Alpha.1 Codex to przykład systematycznej pracy nad podstawami. Nie znajdziemy tu spektakularnych nowych modeli AI czy przełomowych interfejsów, ale otrzymujemy solidne wzmocnienie sandboxa, uszczelnienie ochrony lokalnych plików projektu oraz szereg poprawek zwiększających stabilność TUI, MCP i połączeń sieciowych.

    Dla deweloperów pracujących w trybie vibe coding, gdzie płynność i bezpieczeństwo są kluczowe, takie wydania są bezcenne. Eliminują mikroproblemy zakłócające flow i budują środowisko, w którym można skupić się na tworzeniu bez obaw o przypadkowe naruszenie bezpieczeństwa projektu czy nieoczekiwane awarie. To krok w stronę rozwoju Codex nie tylko jako potężnego narzędzia AI, ale także stabilnej i bezpiecznej platformy programistycznej.


    Źródła

  • Google Gemma 4: Nowa Era Otwartych Modeli AI z Ogromną Mocą

    Google Gemma 4: Nowa Era Otwartych Modeli AI z Ogromną Mocą

    Google właśnie pokazał światu nową generację swoich flagowych, otwartych modeli AI. Gemma 4 to nie zwykła iteracja, lecz zasadniczy skok, który stawia te lekkie konstrukcje w ścisłej czołówce globalnych rankingów, pozwalając im konkurować z modelami wielokrotnie większymi. To wydanie kładzie duży nacisk na zaawansowane rozumowanie i tzw. zdolności agentowe (agentic workflows), czyli umiejętność samodzielnego planowania i wykonywania wieloetapowych zadań przez AI.

    Wydajność nowej rodziny modeli jest imponująca. Wersja 26B typu Mixture of Experts (MoE) plasuje się na 6. miejscu na światowej liście liderów LMSYS Chatbot Arena wśród modeli otwartych. Co najważniejsze, Gemma 4 potrafi wygrywać w benchmarkach z modelami aż 20 razy większymi, co ma kluczowe znaczenie dla praktycznych wdrożeń.

    Rodzina modeli i ich kluczowe możliwości

    Google oferuje Gemmę 4 w czterech precyzyjnie dopasowanych rozmiarach. Są to: Effective 2B (E2B) dla maksymalnej oszczędności pamięci, Effective 4B (E4B) jako kompromis między możliwościami a zasobami na urządzeniach brzegowych (edge devices), oraz 26B MoE (A4B), charakteryzujący się niesamowitą szybkością dzięki aktywacji tylko około 4 miliardów parametrów jednocześnie. Modele E2B i E4B mają odpowiednio około 2,3 mld i 4,5 mld aktywnych parametrów.

    Prawdziwa siła Gemmy 4 leży w jej uniwersalności. Wszystkie modele są natywnie multimodalne – przetwarzają zarówno tekst, jak i obrazy o zmiennym formacie. Każdy z nich radzi sobie także z wideo, a architektura wspiera również dźwięk, co otwiera drogę do zaawansowanej analizy multimodalnej.

    Kluczową nowością jest nacisk na rozumowanie i działania agentowe. Gemma 4 została zaprojektowana od podstaw jako świetny „myśliciel”, potrafiący prowadzić wieloetapowe rozumowanie i planowanie. To właśnie ta cecha, zwykle zarezerwowana dla największych, zamkniętych modeli, jest tu dostępna w lekkiej formie. Dodano też natywne wsparcie dla promptów systemowych (system prompts), co pozwala na bardziej kontrolowane i ustrukturyzowane interakcje z AI.

    Przełom w wydajności i dostępności

    Gemma 4 dokonuje prawdziwej rewolucji w zakresie wydajności na urządzeniach brzegowych. Dzięki ulepszeniom architektonicznym, takim jak Grouped Query Attention (GQA) czy przycięte osadzenia pozycyjne Rotary (p-RoPE), modele działają niezwykle sprawnie. Testy wykazują, że osiągają one wysoką wydajność nawet na ograniczonym sprzęcie. Z kolei przy wykorzystaniu akceleracji dedykowanych jednostek NPU szybkość generowania tekstu wzrasta do tysięcy tokenów na sekundę.

    Rozszerzone okna kontekstowe (context window) – do 128K dla małych modeli i 256K dla średnich – pozwalają na dynamiczną pracę z długimi dokumentami. Inżynierowie odnotowali znaczące przyspieszenie fazy przetwarzania wstępnego (prefills) w modelu E2B. Wszystko to przekłada się na realne korzyści: osiąganie poziomu modeli klasy „frontier” przy ułamku kosztów sprzętowych, możliwość pracy offline, lepszą prywatność i mniejsze opóźnienia.

    Dla programistów Gemma 4 przynosi znaczący postęp w generowaniu kodu i obsłudze wywołań funkcji (function calling), umożliwiając lokalną asystę programistyczną wysokiej jakości. Model wspiera od razu ponad 35 języków, będąc trenowanym na korpusie obejmującym ponad 140 języków, co czyni go narzędziem globalnym.

    Co to oznacza dla rynku AI?

    Wydanie Gemmy 4 na liberalnej licencji Apache 2.0 to jasny sygnał dotyczący strategii Google. Od debiutu pierwszej wersji, modele te cieszą się ogromną popularnością w społeczności, która stworzyła dziesiątki tysięcy ich wariantów. Teraz Google nie tylko dostarcza otwarte alternatywy, ale sprawia, że są one w pełni konkurencyjne pod względem możliwości.

    To posunięcie przyspiesza demokratyzację zaawansowanej sztucznej inteligencji. Firmy i deweloperzy, którzy potrzebowali mocy największych modeli, ale obawiali się kosztów, uzależnienia od chmury (vendor lock-in) lub wymogów prywatności, otrzymują potężne narzędzie do wdrożeń lokalnych i brzegowych. Gemma 4 jest już dostępna wieloma kanałami, w tym przez Hugging Face, Google AI Edge, a także w systemie Android w ramach wersji zapoznawczej AICore dla deweloperów.

    Podsumowanie

    Gemma 4 to coś więcej niż aktualizacja. To dowód na to, że era zaawansowanej sztucznej inteligencji nie musi być zarezerwowana wyłącznie dla gigantycznych, zamkniętych modeli chmurowych. Google, łącząc najnowocześniejsze techniki architektoniczne z filozofią otwartości, stworzył rodzinę modeli, które są jednocześnie potężne, wszechstronne i niezwykle efektywne. Może to zmienić reguły gry, przyspieszając innowacje i pozwalając na budowę inteligentnych aplikacji bezpośrednio na naszych urządzeniach.

  • Google Gemma 4 oficjalnie: cztery nowe modele, rekordowa wydajność i wolna licencja

    Google Gemma 4 oficjalnie: cztery nowe modele, rekordowa wydajność i wolna licencja

    Google właśnie zaktualizował swoją rodzinę lekkich modeli językowych, wypuszczając Gemmę 4. To nie pojedynczy model, a cała gama czterech architektur dopasowanych do różnych zastosowań – od smartfonów po serwery deweloperskie. Najważniejsze zmiany? Ogromne okna kontekstowe, multimodalność i, po raz pierwszy w historii Gemmy 4, w pełni otwarta licencja Apache 2.0.

    Szczegóły techniczne i architektura

    Rodzina Gemma 4 to cztery odrębne modele, każdy o unikalnym przeznaczeniu. Dwa z nich, E2B (efektywnie 2,3 mld parametrów) i E4B (efektywnie 4,5 mld z embeddings), są zoptymalizowane pod kątem działania na urządzeniach brzegowych (edge). Oferują okno kontekstowe do 128 tysięcy tokenów i obsługują tekst, obrazy oraz audio – to ostatnie natywnie dzięki dedykowanemu enkoderowi. Oznacza to, że mogą działać offline, nawet na Raspberry Pi 5 czy smartfonie, zużywając przy 4-bitowej kwantyzacji mniej niż 1,5 GB pamięci RAM.

    Do bardziej wymagających zadań Google przygotował dwa większe modele. 26B A4B to architektura typu Mixture-of-Experts (MoE), znakomicie sprawdzająca się w zadaniach wymagających rozbudowanego rozumowania i workflowów agentowych. Najpotężniejszym modelem jest w pełni gęsty (dense) 31B. Oba dysponują imponującym oknem kontekstu wynoszącym 256K i przetwarzają tekst, obrazy oraz wideo. Wszystkie modele płynnie operują w ponad 140 językach i obsługują natywne system prompty oraz function calling.

    Wydajność, która zadziwia w benchmarkach

    Tutaj Gemma 4 robi prawdziwe wrażenie. W publicznym rankingu Arena AI Leaderboard, który ocenia jakość odpowiedzi w konwersacji, model 31B zajął 3. miejsce, a 26B – 6. miejsce wśród wszystkich otwartych modeli na świecie (stan na 1 kwietnia 2026). Co najbardziej znaczące, model 31B potrafi prześcignąć w tych testach modele aż 20 razy większe od siebie. To potwierdzony wynik benchmarku, który pokazuje ogromną efektywność nowej architektury.

    Wydajność na urządzeniach brzegowych również jest imponująca. E4B na Raspberry Pi 5, korzystając wyłącznie z CPU, osiąga niską latencję podczas dekodowania. Na dedykowanych akceleratorach NPU, we współpracy z partnerami takimi jak Qualcomm, prędkość generowania znacząco wzrasta. Dzięki technologii LiteRT-LM przetworzenie 4000 tokenów w złożonym, dwuetapowym zadaniu może zająć mniej niż 3 sekundy.

    Przełomowe licencjonowanie Apache 2.0

    Przełomowe licencjonowanie Apache 2.0

    Być może najważniejszą wiadomością dla społeczności deweloperskiej i firm jest zmiana licencji. Gemma 4 to pierwsza iteracja tej rodziny wydana na w pełni otwartej i permisywnej licencji Apache 2.0. W praktyce oznacza to brak jakichkolwiek restrykcji komercyjnych. Można ją swobodnie integrować, modyfikować, wdrażać w produktach i oferować jako usługę, bez konieczności udostępniania kodu źródłowego czy dzielenia się wprowadzonymi zmianami.

    To otwiera zupełnie nowe możliwości. Deweloperzy mogą teraz bez obaw wbudowywać zaawansowane AI lokalnie w narzędzia do web developmentu, systemy DevOps czy aplikacje typu "vibe coding". Modele brzegowe idealnie nadają się do integracji z przeglądarkami przez WebGPU, a większe modele można hostować w chmurze na pojedynczych kartach graficznych klasy konsumenckiej. Google podkreśla, że to "najbardziej wydajna rodzina otwartych modeli", która ma przyspieszyć innowacje w obszarze rozwiązań agentowych i IoT.

    Podsumowanie

    Premiera Gemmy 4 to strategiczny ruch Google, który stawia na efektywność i dostępność. Zamiast brać udział w wyścigu na liczbę parametrów, firma oferuje starannie zaprojektowaną rodzinę modeli, z których każdy ma jasne zastosowanie. Połączenie najwyższej klasy wydajności w benchmarkach, multimodalności i – przede wszystkim – wolnej licencji czyni z Gemmy 4 niezwykle atrakcyjną platformę do budowy przyszłych aplikacji AI. Dostępna od ręki dla deweloperów, może stać się fundamentem nowej fali innowacji, tym razem rozgrywającej się poza centrami danych, bliżej użytkownika.