Tag: gemini

  • Gemini CLI v0.37.0-preview.2: Rozszerzone Statystyki i Ulepszenia Interfejsu

    Gemini CLI v0.37.0-preview.2: Rozszerzone Statystyki i Ulepszenia Interfejsu

    Google udostępniło nową wersję preview swojego terminalowego agenta AI opartego na otwartym kodzie źródłowym. Gemini CLI v0.37.0-preview.2 skupia się na stabilności, nowych metrykach i poprawkach w obsłudze programu. Wydanie to wprowadza funkcje przydatne w pracy programistów, specjalistów DevOps oraz osób zajmujących się sztuczną inteligencją.

    Wersja ta powstała poprzez przeniesienie wybranych zmian (cherry-pick) i zastosowanie łatek do kodu źródłowego. Taka metoda pozwoliła na szybkie wdrożenie konkretnych poprawek bez konieczności przebudowy głównej gałęzi projektu.

    Nowe dane w sekcji /stats

    Główną zmianą jest rozbudowa polecenia /stats. Wyświetla ono teraz dodatkowe dane, które pozwalają monitorować wpływ poszczególnych umiejętności agenta (agent skills) i ustawień na pracę systemu. Jest to pomocne przy wieloetapowych zadaniach, gdzie agent wykonuje skomplikowane operacje.

    Dzięki tym zmianom można precyzyjniej analizować wydajność narzędzia. Dane te ułatwiają optymalizację czasu i zasobów potrzebnych do realizacji zautomatyzowanych procesów.

    Zmiany w interfejsie użytkownika

    W interfejsie wprowadzono funkcję rozwijania wklejanego tekstu (expandable text pastes). Rozwiązuje to problem nadmiaru informacji w oknie konsoli – zamiast wyświetlać długie bloki danych, CLI pokazuje teraz zwinięty, bardziej czytelny widok.

    Ułatwia to pracę z logami, skryptami oraz planami wykonania w trybie plan mode. Użytkownik może skupić się na konkretnych fragmentach bez przewijania setek linii tekstu, co poprawia ergonomię pracy w terminalu.

    Stabilność na systemach Windows i Linux

    Wydanie naprawia błędy występujące na systemach Windows i Linux. Z dokumentacji wynika, że twórcy skupili się także na rozwoju izolacji procesów (sandboxing) oraz zarządzaniu sesjami agenta przeglądarkowego.

    Dla osób pracujących na różnych systemach operacyjnych poprawa stabilności ma duże znaczenie. Błędy w tym obszarze mogą utrudniać automatyzację testów czy procesów wdrożeniowych CI/CD.

    Dopracowanie działania programu

    Program działa teraz stabilniej, a błędy w renderowaniu tekstu zostały ograniczone. Choć są to zmiany techniczne, wpływają one na płynność pracy, szczególnie gdy agent na bieżąco generuje kolejne kroki planu w oknie terminala. Przewidywalne zachowanie interfejsu ułatwia codzienne korzystanie z narzędzia.

    Bezpieczeństwo i telemetria

    Tryb planu otrzymał ulepszenia w zakresie izolowania narzędzi. Projekt kładzie nacisk na bezpieczeństwo, starając się oddzielać uruchamiane skrypty od systemu operacyjnego gospodarza, aby zminimalizować ryzyko niepożądanych zmian.

    W zakresie telemetrii dodano nowe metryki dla agenta przeglądarkowego. Pozwalają one zbierać informacje o wydajności tego modułu, co ułatwia jego dalszy rozwój.

    Zarządzanie konfiguracją

    Twórcy pracują nad bezpieczniejszą obsługą zmiennych środowiskowych i ustawień. Mechanizmy kontroli dostępu mają chronić klucze i hasła przekazywane do agentów działających w piaskownicy. Prawidłowe działanie tych funkcji ogranicza ryzyko wycieku danych.

    Gemini CLI jest dostępne w trzech kanałach: nightly, preview oraz stable. Wersje preview służą do testowania nowych funkcji, takich jak eksperymentalne umiejętności agenta. Narzędzie można zainstalować za pomocą npm lub npx z repozytorium google-gemini/gemini-cli.

    Rozwój agenta CLI

    Wersja v0.37.0-preview.2 pokazuje kierunek rozwoju projektu, stawiając na analitykę, stabilność i bezpieczeństwo. Zmiany te sprawiają, że narzędzie staje się bardziej przewidywalne w zastosowaniach deweloperskich. Kolejne aktualizacje dostarczają więcej danych do analizy i poprawiają komfort pracy z agentem AI w linii komend.


    Źródła

  • Google uwalnia potencjał sztucznej inteligencji na Macu. Gemini for Mac już oficjalnie dostępne

    Google uwalnia potencjał sztucznej inteligencji na Macu. Gemini for Mac już oficjalnie dostępne

    Google udostępniło natywną aplikację Gemini na komputery Mac. Program nie jest jedynie kopią wersji przeglądarkowej, ale został napisany od podstaw w języku Swift, co pozwala na integrację z systemem macOS. Użytkownicy mogą korzystać z darmowej wersji z limitami lub wybrać płatne pakiety, takie jak AI Plus, AI Pro czy AI Ultra.

    Aplikacja jest dostępna do pobrania na stronie gemini.google/mac/. Google zdecydowało się ominąć App Store, co pozwala firmie wydawać aktualizacje bez czekania na weryfikację Apple. Do działania wymagany jest komputer z procesorem Apple Silicon oraz system macOS 15 (Sequoia) lub nowszy. Osoby korzystające ze starszych wersji systemu lub komputerów z procesorami Intel nie mogą zainstalować tej wersji.

    Szybkość i analiza treści na ekranie

    Główną zaletą aplikacji jest łatwy dostęp, przypominający działanie systemowej wyszukiwarki Spotlight. Program można wywołać skrótem klawiaturowym Option + Spacja, co otwiera małe okno do szybkich pytań. Pełny czat uruchamia się kombinacją Option + Shift + Spacja. Ikona Gemini jest widoczna w Docku oraz na górnym pasku menu.

    Aplikacja potrafi analizować to, co aktualnie wyświetla się na monitorze. Po włączeniu odpowiednich uprawnień w ustawieniach prywatności i dostępności, Gemini widzi otwarte dokumenty PDF, arkusze kalkulacyjne czy kod w edytorze. Dzięki temu asystent może streścić tekst, wyjaśnić skomplikowane fragmenty danych lub zasugerować poprawki w projekcie graficznym bez konieczności ręcznego kopiowania treści.

    Narzędzia dla twórców i programistów

    Gemini na Maca oferuje te same funkcje, co wersja mobilna i przeglądarkowa. Użytkownicy mogą korzystać z modelu Imagen 3 do generowania obrazów oraz narzędzia Veo do tworzenia krótkich materiałów wideo. Program ułatwia pracę nad projektami kreatywnymi i technicznymi.

    Programiści i osoby pracujące z dużą ilością danych mogą przesyłać pliki bezpośrednio do aplikacji. Gemini pomaga w pisaniu kodu, tłumaczeniu tekstów i planowaniu zadań. Dzięki temu, że aplikacja działa lokalnie jako natywny program, reaguje szybciej niż interfejs w przeglądarce internetowej.

    Konkurencja na rynku

    Wprowadzenie tej aplikacji to ruch wymierzony w ChatGPT Desktop oraz Microsoft Copilot. Google postawiło na ścisłe połączenie asystenta z systemem operacyjnym, co ma przyciągnąć osoby na co dzień korzystające z komputerów Apple.

    Oficjalna premiera odbyła się 16 kwietnia 2024 roku, kończąc okres zamkniętych testów. Od pierwszych zapowiedzi aplikacja została rozbudowana o stabilną analizę ekranu i obsługę plików. Google regularnie dodaje nowe funkcje, dostosowując narzędzie do aktualnych możliwości modeli językowych.

    Dostępność i wymagania

    Gemini na Maca jest skierowane do osób, które chcą mieć dostęp do sztucznej inteligencji bez przełączania się między kartami przeglądarki. Choć wymóg posiadania najnowszego systemu i procesora Apple Silicon ogranicza grono odbiorców, zapewnia to płynne działanie programu.

    Aplikacja obsługuje język polski oraz wszystkie inne języki dostępne wcześniej w wersji mobilnej. Wybór między instalacją aplikacji a korzystaniem z przeglądarki zależy od tego, jak bardzo asystent ma być zintegrowany z codziennymi zadaniami. Google promuje rozwiązanie systemowe jako szybszy i wygodniejszy sposób pracy na Macu.

  • Google łączy siły: NotebookLM teraz głęboko zintegrowany z aplikacją Gemini

    Google łączy siły: NotebookLM teraz głęboko zintegrowany z aplikacją Gemini

    Google wprowadziło zmianę w sposobie korzystania ze swoich narzędzi AI, łącząc NotebookLM bezpośrednio z aplikacją Gemini. NotebookLM, który do tej pory był osobnym programem do analizy dokumentów, jest teraz dostępny z poziomu głównego czatu Gemini. Dzięki temu użytkownicy nie muszą już przełączać się między różnymi kartami przeglądarki, aby pracować na swoich materiałach.

    Obsługa tej funkcji jest prosta. W oknie czatu Gemini, obok ikony dodawania plików, znajduje się przycisk NotebookLM. Po jego kliknięciu można wybrać konkretny notatnik zawierający pliki PDF, artykuły czy transkrypcje z YouTube. Od tego momentu Gemini wykorzystuje te dokumenty jako bazę do udzielania odpowiedzi. AI automatycznie uwzględnia treść źródeł przy tworzeniu streszczeń czy analiz, bez konieczności każdorazowego wklejania tekstu do czatu.

    Jak to działa w praktyce

    Główną korzyścią jest wygoda. Użytkownik rozmawia z Gemini, korzystając z możliwości modelu, a jednocześnie ma pewność, że odpowiedzi opierają się na jego własnych plikach. Aby sprawdzić konkretne źródło lub dodać nowy dokument, wystarczy kliknąć przycisk "źródła". Wszystkie dane i zmiany w notatnikach są aktualizowane na bieżąco.

    Integracja pozwala też na zarządzanie bazą wiedzy bezpośrednio z poziomu Gemini. Można tam dodawać nowe linki i pliki, a także zapisywać fragmenty rozmów bezpośrednio w strukturze notatnika.

    Różnica w sposobie działania

    To połączenie zmienia sposób, w jaki AI przetwarza informacje. Standardowy NotebookLM jest systemem zamkniętym, co oznacza, że odpowiada tylko na podstawie wgranych dokumentów. Wersja wbudowana w Gemini daje większy wybór.

    Użytkownik może zdecydować, czy AI ma trzymać się wyłącznie dostarczonych materiałów, czy może uzupełnić odpowiedź o informacje z internetu. Pozwala to na łączenie precyzyjnej analizy własnych danych z szeroką wiedzą dostępną w sieci.

    Zastosowanie w nauce i pracy

    Połączenie bazy wiedzy NotebookLM z funkcjami konwersacyjnymi Gemini ułatwia pracę osobom zajmującym się analizą danych, studentom i badaczom. Rozwiązuje to problem wyboru między narzędziem do pracy na źródłach a wszechstronnym asystentem AI.

    W edukacji rozwiązanie to wykorzystuje model Gemini z komponentami LearnLM, które są dostosowane do celów dydaktycznych. Nauczyciele mogą dzięki temu sprawniej przygotowywać materiały na podstawie konkretnych podręczników, a studenci mogą analizować literaturę przedmiotu w jednym oknie.

    Nowe możliwości dla użytkowników

    Wprowadzenie NotebookLM do Gemini upraszcza proces badania i gromadzenia informacji. Zamiast korzystać z kilku osobnych narzędzi, użytkownik otrzymuje jedno środowisko, w którym porządkuje źródła i od razu o nie pyta.

    Obecnie funkcja ta jest wdrażana stopniowo, głównie dla użytkowników korzystających z komputerów. Google dąży do ściślejszego powiązania swoich usług AI, co w praktyce oznacza mniej kopiowania danych i szybszy dostęp do własnych notatek podczas rozmowy z botem. Dla osób pracujących z dużą ilością tekstu jest to ułatwienie, które realnie przyspiesza codzienną pracę.

  • Google Podnosi Stawkę: Gemini 3.1 Flash Live z Lepszą Pamięcią i Szybszym Głosem

    Google Podnosi Stawkę: Gemini 3.1 Flash Live z Lepszą Pamięcią i Szybszym Głosem

    Google właśnie odświeżyło swoje narzędzia do rozmów ze sztuczną inteligencją w czasie rzeczywistym. Premiera ulepszonego modelu Gemini 1.5 Flash ma sprawić, że interakcje głosowe w usługach takich jak aplikacja Gemini czy wyszukiwarka staną się płynniejsze, bardziej naturalne i skuteczniejsze. To nie rewolucja, lecz seria konkretnych usprawnień, które mogą zmienić codzienne doświadczenia użytkowników.

    Najważniejsze zmiany dotyczą trzech kluczowych obszarów: pamięci konwersacji, szybkości odpowiedzi i rozumienia kontekstu.

    Dłuższe rozmowy i mniej niezręcznej ciszy

    Jedną z wyraźnych bolączek wcześniejszych asystentów głosowych było gubienie wątku w dłuższej rozmowie. Gemini 1.5 Flash rozwiązuje ten problem, oferując ulepszoną pamięć konwersacji. Oznacza to, że model może śledzić tok dyskusji przez znacznie dłuższy czas, co jest kluczowe na przykład podczas burzy mózgów czy rozwiązywania złożonego problemu krok po kroku. Użytkownik nie musi już co chwilę przypominać AI, o czym wcześniej wspomniał.

    Równolegle Google pracowało nad redukcją opóźnień (latency). Nowy model generuje odpowiedzi szybciej, a twórcy chwalą się „mniejszą liczbą niezręcznych przerw”. Choć brzmi to niepozornie, to właśnie te mikro-cisze często psują wrażenie naturalności rozmowy. Szybsze reakcje mają sprawić, że dialog z AI będzie przebiegał bardziej jak rozmowa z człowiekiem.

    Lepsze słyszenie i rozumienie niuansów

    Prawdziwe życie to nie studio nagraniowe. Do rozmów dołączają odgłosy ulicy, telewizor w tle czy szum wentylatora. Gemini 1.5 Flash został wytrenowany, by lepiej filtrować takie zakłócenia i skupiać się na mowie użytkownika. To techniczne usprawnienie bezpośrednio przekłada się na niezawodność w codziennym użytkowaniu.

    Co jednak ciekawsze, model lepiej rozpoznaje niuanse akustyczne, takie jak tempo mówienia, zmiany tonu czy nawet wahanie w głosie. Pozwala mu to nie tylko lepiej rozumieć co mówisz, ale też częściowo jak to mówisz. W efekcie może dynamicznie dostosowywać ton i długość swojej odpowiedzi, wykrywając na przykład frustrację i reagując bardziej empatycznie lub zwięźlej.

    Globalny zasięg i większa niezawodność

    Aktualizacja to nie tylko poprawki „pod maską”, ale też ekspansja terytorialna. Wielojęzyczność modelu umożliwiła Google dalsze rozszerzenie usługi wyszukiwania z Gemini na kolejne rynki. Użytkownicy na całym świecie mogą teraz prowadzić multimodalne rozmowy głosowe z wyszukiwarką w swoim rodzimym języku, uzyskując pomoc w czasie rzeczywistym.

    Dla programistów i firm kluczowa jest też poprawiona niezawodność w wykonywaniu zadań. Model lepiej przestrzega złożonych instrukcji i pewniej obsługuje zewnętrzne narzędzia (function calling) w trakcie konwersacji. Nawet gdy rozmowa zejdzie na nieoczekiwane tory, AI trzyma się ustalonych zabezpieczeń (guardrails). To wszystko zwiększa skuteczność realizacji poleceń w rzeczywistych, często hałaśliwych warunkach.

    Jak te zmiany wpłyną na doświadczenie użytkownika?

    Dla przeciętnej osoby korzystającej z Gemini na smartfonie różnica będzie odczuwalna. Szybsze, bardziej kontekstowe odpowiedzi sprawią, że korzystanie z asystenta głosowego stanie się po prostu wygodniejsze. Rozwiązywanie problemów, planowanie czy zdobywanie informacji poprzez rozmowę będzie wymagało mniej wysiłku i rzadszego powtarzania komend.

    W przypadku wyszukiwarki Gemini potencjał jest jeszcze większy. Wyobraź sobie, że naprawiasz zepsuty sprzęt AGD i głosowo otrzymujesz instrukcje krok po kroku, dostosowane do tego, co już zrobiłeś. Albo że podczas gotowania prosisz o wyjaśnienie przepisu, a AI pamięta, jakie składniki wcześniej wymieniłeś. Ulepszenia w pamięci i rozumieniu kontekstu otwierają drogę do takich właśnie zastosowań.

    Gemini 1.5 Flash nie definiuje kategorii na nowo, ale stanowi istotny krok naprzód w dążeniu do w pełni naturalnych interakcji człowiek-maszyna. Google konsekwentnie szlifuje technologię, skupiając się na usuwaniu konkretnych, zauważalnych barier – od ciszy w rozmowie po gubienie wątku. Efektem ma być AI, która po prostu lepiej słucha, rozumie i odpowiada.

  • Gemini CLI zapowiada głęboką przebudowę architektury subagentów i wprowadza ulepszenia dla użytkowników

    Gemini CLI zapowiada głęboką przebudowę architektury subagentów i wprowadza ulepszenia dla użytkowników

    W najnowszym wydaniu narzędzie Gemini API otrzymuje szereg istotnych aktualizacji skupionych na udostępnieniu nowych modeli i zwiększeniu ich możliwości. Sercem zmian jest wprowadzenie modeli z rozszerzonym oknem kontekstowym, które mają na celu przezwyciężenie kluczowych ograniczeń wcześniejszych wersji. Jednocześnie pojawiają się usprawnienia w aplikacjach i interfejsach korzystających z tych modeli, nastawione na poprawę doświadczeń użytkownika (user experience).

    Rozszerzone możliwości modeli: większy kontekst i specjalizacja

    Dotychczasowe modele Gemini, choć potężne, miały ograniczenia związane z pojemnością okna kontekstowego. Najnowsze aktualizacje wprowadzają modele z oknem kontekstowym sięgającym 1 miliona tokenów, co pozwala na pracę z bardzo obszernymi fragmentami kodu i dokumentacji. Ta zmiana ma bezpośredni wpływ na wydajność wykonywania złożonych, wieloetapowych zadań bez utraty kontekstu.

    Kluczowe elementy tych aktualizacji to:

    • Modele z rozszerzonym kontekstem: Udostępnienie modeli takich jak Gemini 1.5 Pro i Flash z oknem 1M tokenów umożliwia analizę długich dokumentów, dużych baz kodu lub prowadzenie rozbudowanych konwersacji bez potrzeby częstego podsumowywania treści.
    • Specjalizacja zadań: Twórcy promują wykorzystanie różnych modeli do konkretnych typów zadań – szybszych i tańszych (np. Flash) do prostszych operacji, a bardziej zaawansowanych (np. Pro) do złożonego rozumowania i planowania.
    • Integracje i protokoły: Rozwój ekosystemu wokół API, w tym eksperymentalne wsparcie dla protokołów takich jak MCP (Model Context Protocol), może w przyszłości otworzyć drogę do tworzenia zaawansowanych procesów agentowych, łączących różne źródła danych i narzędzia.

    Co to oznacza dla programistów? Praktyczny wpływ na workflow

    Co to oznacza dla programistów? Praktyczny wpływ na workflow

    Ewolucja modeli ma konkretne przełożenie na codzienną pracę, szczególnie w obszarach takich jak web development, AI czy analiza danych. Dzięki rozszerzonemu kontekstowi aplikacje oparte na Gemini API mogą teraz efektywniej obsługiwać skomplikowane, wieloetapowe zadania.

    Wyobraźmy sobie zadanie, w którym asystent analizuje całe repozytorium kodu w poszukiwaniu określonego wzorca, przetwarza długą dokumentację techniczną, a następnie generuje na tej podstawie plan refaktoryzacji – wszystko w ramach jednej, spójnej sesji. Praca z tak dużym kontekstem minimalizuje potrzebę ręcznego dzielenia problemów na mniejsze części.

    Rozwój ekosystemu i integracje z popularnymi narzędziami zwiększają użyteczność API, umożliwiając automatyzację zadań związanych z analizą kodu czy generowaniem treści. Ponadto dostępność różnych modeli pozwala na optymalizację kosztów i wydajności w zależności od potrzeb projektu.

    Ulepszenia aplikacji: lepsza kontrola i interakcja

    Równolegle do rozwoju samych modeli aplikacje i interfejsy korzystające z Gemini otrzymują pakiet usprawnień skupionych na użytkowniku. Kluczową koncepcją, która zyskuje na znaczeniu, jest idea planowania przed działaniem.

    Coraz więcej narzędzi promuje tryb pracy pozwalający najpierw bezpiecznie przeanalizować kod i wygenerować plany działania, zanim użytkownik zatwierdzi jakiekolwiek modyfikacje. Asystent może zadawać pytania doprecyzowujące i tworzyć szczegółowe plany, na przykład dla migracji całej aplikacji, dając programiście pełną kontrolę i wgląd w proponowane zmiany. To ważny krok w stronę zwiększenia bezpieczeństwa i zaufania do narzędzi AI.

    Poza tym odświeżane są interfejsy użytkownika, wprowadzane są ulepszenia w komunikacji z modelem oraz lepsza integracja ze środowiskiem programistycznym (IDE). Personalizacja doświadczeń wynika z ogólnych ulepszeń aplikacji, które obejmują też bardziej przejrzyste komunikaty i trwałość stanu sesji.

    Podsumowanie: kierunek ewolucji narzędzi deweloperskich

    Ewolucja modeli Gemini i ich ekosystemu to fundamentalna zmiana w możliwościach asystentów programistycznych. Przejście w stronę modeli o ogromnej pojemności kontekstu bezpośrednio rozwiązuje problemy deweloperów przy automatyzacji złożonych procesów (workflow) wymagających szerokiego spojrzenia na projekt.

    Połączenie technicznej głębi z praktycznymi ulepszeniami w interakcji, takimi jak nacisk na planowanie i kontrolę, pokazuje zrównoważone podejście do rozwoju. Narzędzia oparte na Gemini nie tylko stają się potężniejsze pod maską, ale także dążą do większej przewidywalności i bezpieczeństwa. Te zmiany wyraźnie wyznaczają trend w ewolucji asystentów: w stronę większej zdolności rozumienia złożonych kontekstów, lepszej współpracy z człowiekiem i integracji w ramach wieloetapowych procesów.

  • Gemini wychodzi z cienia: jak Google chce, żeby jego AI była wszędzie

    Gemini wychodzi z cienia: jak Google chce, żeby jego AI była wszędzie

    Jeśli korzystasz z produktów Google, to pewnie zauważyłeś, że sztuczna inteligencja przestała być czymś, czego szukasz, a zaczęła być czymś, co po prostu tam jest. I to właśnie jest główny cel najnowszych ruchów firmy z Mountain View. Ich flaga sztandarowa, Gemini, przestaje być po prostu chatbotem. Staje się czymś w rodzaju cyfrowego asystenta, który działa w tle, poznając twoje zwyczaje.

    Na przykład, Google wprowadza coś, co nazywa Personal Intelligence. Brzmi trochę górnolotnie, ale chodzi o coś bardzo praktycznego. „Ta funkcja, dostępna dla subskrybentów Google AI Pro i Ultra”, ma uczyć się z twoich aktywności w Gmailu, Zdjęciach, Wyszukiwaniu i YouTube. Wyobraź sobie, że szukasz przepisu na ciasto, a potem otwierasz Gmaila i widzisz podpowiedź związaną z zakupem składników. Albo przeglądasz stare zdjęcia z wakacji, a Gemini sugeruje stworzenie albumu. To nie jest już tylko odpowiadanie na pytania. To proaktywne dostosowywanie się do ciebie.

    A co z samą aplikacją Gemini? Też się zmienia. Google regularnie publikuje informacje o aktualizacjach. Ostatnie poprawki dotyczą na przykład możliwości przesyłania plików – teraz możesz wysłać do Gemini więcej typów plików jednocześnie, co jest sporym ułatwieniem. Poprawiono też obsługę wyszukiwania obrazów i ogólną wydajność. To może brzmieć jak drobiazgi, ale w codziennym użytkowaniu właśnie takie rzeczy mają znaczenie.

    Co ciekawe, Google mocno stawia na to, żeby Gemini było dostępne. Na ich stronie z najnowszymi wiadomościami wyraźnie podkreślają, że Gemini jest darmowe dla studentów. To sprytny ruch – przyzwyczajają przyszłych profesjonalistów do swojego ekosystemu AI od samego początku.

    A gdzie jeszcze znajdziemy Geminiego? No właśnie, wszędzie. „Weźmy Gmaila. Dla subskrybentów wersji Pro i Ultra, w skrzynce odbiorczej pojawiają się narzędzia oparte na modelu Gemini (np. Gemini 2.0).” Mowa o funkcjach takich jak 'Help Me Write’, która pomaga w redagowaniu maili, czy konwersacyjne wyszukiwanie w skrzynce. Zamiast precyzyjnie formułować zapytania, możesz po prostu porozmawiać z AI, żeby znaleźć ten ważny załącznik sprzed miesięcy.

    Pojawia się też coraz więcej plotek i zapowiedzi integracji z urządzeniami innych firm. „Apple ogłosiło wersję Siri zasilaną przez Geminiego, planowaną na luty.” (jeśli ogłoszenie potwierdzone; w przeciwnym razie: usunąć lub zaznaczyć jako niepotwierdzone). To byłaby ogromna zmiana i pokazuje, jak poważnie rynek traktuje technologię Google. Jeśli te doniesienia się potwierdzą, Gemini mogłoby stać się domyślną AI na setkach milionów iPhone’ów. To zmieniałoby całkowicie układ sił.

    Co to wszystko oznacza dla nas, zwykłych użytkowników? Przede wszystkim to, że granica między 'korzystaniem z AI’ a 'korzystaniem z internetu’ powoli zanika. Gemini nie jest już osobną aplikacją, którą otwierasz, żeby zadać pytanie. Staje się warstwą inteligencji rozsianą po wszystkich usługach, z których i tak korzystasz. Personalizuje, podpowiada, pomaga pisać i szukać.

    Oczywiście, rodzi to pytania o prywatność. Google zapewnia, że użytkownicy mają kontrolę nad tym, czego Personal Intelligence się uczy i jakie dane wykorzystuje. To kluczowy aspekt, o którym warto pamiętać, aktywując nowe funkcje.

    Podsumowując, najnowsze wieści o Gemini pokazują wyraźny kierunek. Google nie chce rywalizować tylko o to, kto ma lepszego chatbota. Chce zbudować AI, która jest płynnie wpleciona w naszą codzienność, ucząc się naszych przyzwyczajeń i działając z wyprzedzeniem. Czy to się uda? Czas pokaże. Ale jedno jest pewne – wyścig o to, czyja sztuczna inteligencja będzie nam najbliżej, właśnie wszedł w nową, znacznie bardziej osobistą fazę.

    Źródła