Chiński gigant Alibaba właśnie postawił nową, ważną kartę na stole wyścigu modeli językowych. Zespół Qwen wypuścił serię modeli oznaczoną jako „Medium”, która ma jeden, jasny cel: dać porównywalną z czołowymi, zamkniętymi modelami wydajność na Twoim własnym komputerze. To nie są ogromne, nie do udźwignięcia potwory, a raczej precyzyjnie dostrojone narzędzia optymalizowane pod kątem lokalnego działania. W kręgach technicznych mówi się, że wydajnością potrafią dorównać Claude'owi Opus, a w benchmarkach dla swojej wielkości osiągają wyniki porównywalne z innymi modelami o podobnej skali. Czy to oznacza prawdziwą demokratyzację zaawansowanej AI?
Co kryje się pod nazwą „Medium”?
Seria Qwen3.5-Medium to nie jeden model, a cała rodzina, zaprojektowana z myślą o różnych poziomach sprzętu. Kluczem jest architektura Mixture-of-Experts (MoE), czyli mieszanka ekspertów. Wyobraź to sobie tak: dla każdego zapytania model aktywuje tylko niewielką, najodpowiedniejszą część swojej całej wiedzy. Dzięki temu całkowita liczba parametrów może być ogromna, ale aktywnie wykorzystywana i obciążająca komputer – znacznie mniejsza.
To właśnie tłumaczy nazwy modeli, które na pierwszy rzut oka mogą przyprawić o zawrót głowy. Weźmy flagowy model tej serii: Qwen3.5-35B-A3B. Liczba 35B to całkowita liczba parametrów, ale te „A3B” oznaczają, że na token aktywuje się jedynie około 3 miliardów. To właśnie ten drugi, mniejszy rozmiar ma realny wpływ na zapotrzebowanie na pamięć.
Dla kogo jest który model? Przewodnik po wymaganiach
Największą zaletą tej serii jest jej pragmatyzm. Zamiast mówić „potrzebujesz farmy serwerów”, twórcy precyzyjnie wskazują, na jakim sprzęcie co uruchomisz.
- Qwen3.5-35B-A3B: To gwiazda dla zwykłych śmiertelników. W skwantowanej wersji (np. format GGUF) potrzebuje około 17-21 GB pamięci RAM lub VRAM. To oznacza, że śmiało odpalisz go na komputerze z 24 GB RAM, a nawet na Macu M3 z 21 GB pamięci unifikowanej. To model, który najczęściej porównuje się do Claude Opus pod kątem jakości odpowiedzi.
- Qwen3.5-122B-A10B: Trochę inna konfiguracja, potrzebująca około 30 GB. Celuje w nieco lepiej wyposażone stacje robocze lub komputery z dedykowaną kartą graficzną o większej pamięci.
- Modele większe: Qwen3.5-122B-A10B (~54-70 GB) i kolos Qwen3.5-397B-A17B (~132-245 GB) to już propozycja dla zaawansowanych użytkowników, małych firm lub developerskich playgroundów z bardzo wysokiej półki sprzętowej. Ich siła tkwi w zadaniach wymagających głębokiego rozumowania.
Wszystkie modele dostępne są na platformie Hugging Face w przyjaznych formatach, głównie GGUF, co oznacza pełną kompatybilność z popularnymi narzędziami do lokalnego działania, jak llama.cpp czy Ollama. Można też łatwo odciążyć część obliczeń na GPU, jeśli je posiadasz.
Jak wypada w testach? Obiecujące benchmarki
Tutaj robi się najciekawiej, choć warto zachować zdrowy rozsądek. Oficjalne komunikaty i analizy użytkowników wskazują, że seria Medium została zaprojektowana, by osiągać „najsilniejsze wyniki dla swoich rozmiarów”. Co to znaczy w praktyce?
Porównania często stawiają flagowego Qwena-35B-A3B w trybie rozumowania (Reasoning) naprzeciwko innych modeli o podobnej skali. Chwalą go za inteligencję, szybkość i – co kluczowe – niski koszt (zerowy, jeśli puszczasz lokalnie). Obsługuje też imponujące 256 tysięcy tokenów kontekstu, co wystarczy na analizę naprawdę długich dokumentów.
Czy bezpośrednio „biją” inne modele o podobnej skali? Pełne, oficjalne tabele benchmarków nie są w materiałach źródłowych pokazane w detalach. Informacje krążące w społeczności sugerują jednak, że w wielu testach, szczególnie tych mierzących rozumowanie wieloetapowe (agentic tasks), kodowanie czy pracę z długim kontekstem, modele z serii Medium plasują się niebezpiecznie blisko, a czasem nawet przed wspomnianymi, płatnymi konkurentami – ale tylko gdy porównujemy modele o podobnej, aktywnej liczbie parametrów.
To ważne zastrzeżenie. Porównanie 3-miliardowego aktywnego Qwena do pełnego Claude'a Sonnet nie byłoby fair. Sedno tkwi w tym, że Qwen oferuje zbliżoną jakość, zużywając przy tym ułamek zasobów, co jest jego ogromną przewagą w scenariuszu lokalnym.
Do czego się nadaje? Moc tkwi w specjalizacji
Seria Qwen3.5-Medium nie próbuje być mistrzem we wszystkim, choć jej zakres jest szeroki. Jej architektura jest wręcz stworzona pod konkretne, zaawansowane zastosowania:
- Agenckie kodowanie i planowanie: To ich mocna strona. Model potrafi nie tylko pisać kod, ale też go planować, dzielić zadania na kroki i wykonywać złożone, wieloetapowe instrukcje.
- Natywne rozumowanie multimodalne: Choć w materiałach mowa głównie o modelach tekstowych, cała linia Qwen3.5 ma fundamenty do rozumienia zarówno tekstu, jak i obrazu w jednej, spójnej architekturze.
- Długi kontekst i wielojęzyczność: Obsługa 256K tokenów i 201 języków czyni go niezwykle uniwersalnym narzędziem do analizy dokumentów, researchu czy pracy w międzynarodowym środowisku.
Jak piszą sami twórcy na blogu: „Qwen3.5 zapewnia solidne fundamenty dla uniwersalnych agentów cyfrowych dzięki wydajnej architekturze hybrydowej i natywnemu, multimodalnemu rozumowaniu.”
Jak zacząć? Ścieżka wdrożenia
Jeśli masz odpowiedni sprzęt, start jest stosunkowo prosty. Wszystkie potrzebne pliki znajdziesz na GitHubie zespołu Qwen (repozytorium ma już 625 gwiazdek) oraz na Hugging Face. Model jest objęty licencją Apache-2.0, czyli możesz go używać swobodnie, także komercyjnie.
Dla typowego użytkownika domowego najprostszą drogą będzie pobranie skwantowanej wersji GGUF i uruchomienie jej przez llama.cpp lub przyjazną nakładkę jak Ollama czy LM Studio. Dla bardziej zaawansowanych scenariuszy, np. wystawienia własnego, lokalnego API, twórcy polecają narzędzia w rodzaju llama-server.
Podsumowanie
Wypuszczenie serii Qwen3.5-Medium to jasny sygnał, że wyścig w AI toczy się nie tylko w chmurach najbogatszych korporacji. Alibaba, przez swoją grupę Qwen, konsekwentnie buduje pozycję lidera w świecie otwartej, a jednocześnie niezwykle zaawansowanej sztucznej inteligencji.
Ich najnowsza propozycja nie obiecuje, że będzie bezwzględnie lepsza od GPT-4 czy Claude'a w każdym teście. Obiecuje coś innego: porównywalną jakość tam, gdzie to się liczy – na Twoim własnym komputerze, bez miesięcznych opłat, z pełną kontrolą nad danymi. To oferta skierowana do developerów, badaczy, małych firm i technologicznych pasjonatów, którzy potrzebują mocy wielkich modeli, ale na swoich warunkach.
Czy udało im się osiągnąć ten cel? Wstępne testy i architektura wskazują, że są na najlepszej drodze. Qwen3.5-Medium to nie tyle "zabójca GPT", ile potężne, otwarte narzędzie, które realnie zmienia układ sił, dając każdemu szansę na posiadanie zaawansowanej AI we własnym garażu. A w świecie technologii taka demokratyzacja zawsze jest dobrą wiadomością.

