Anysphere, firma stojąca za popularnym środowiskiem programistycznym Cursor, ogłosiła wydanie nowej, autorskiej wersji modelu AI do kodowania – Composer 2. To znacząca aktualizacja modelu Composer, która w ciągu zaledwie pięciu miesięcy przynosi duży skok jakościowy. Najważniejsze przesłanie? Frontierowa inteligencja w zakresie kodowania, ale w znacznie niższej cenie niż u konkurencji.
Composer 2 jest już dostępny bezpośrednio w środowisku Cursor, co oznacza, że użytkownicy mogą z niego korzystać w ramach codziennej pracy z kodem. Firma mocno stawia na integrację modelu z własnym ekosystemem, podkreślając, że jest on specjalnie dostrojony do agentowego workflow, użycia narzędzi, edycji plików i operacji terminalowych oferowanych przez Cursor.
Znacząca poprawa wyników benchmarków
Cursor opublikował zestawienie wyników, które pokazuje wyraźny postęp w stosunku do poprzednich modeli z rodziny Composer. Nowa wersja osiąga lepsze wyniki w wewnętrznym CursorBench, Terminal-Bench 2.0 oraz SWE-bench Multilingual.
Dla porównania, oryginalny model Composer osiągał znacznie słabsze rezultaty. To pokazuje solidny skok jakościowy w każdym z mierzonych obszarów. Szczególnie istotny jest przyrost w Terminal-Bench 2.0, który mierzy, jak dobrze agent AI radzi sobie z zadaniami w terminalu, czyli kluczowym elementem pracy programisty.
Co ciekawe, firma nie twierdzi, że jej model jest bezkonkurencyjny. W Terminal-Bench 2.0 prowadzą modele konkurencji, jednak Composer 2 plasuje się przed innymi rozwiązaniami i własnym poprzednikiem. Taka szczerość buduje wiarygodność – Cursor nie obiecuje cudów, lecz konkretny, wymierny postęp.
Przełom w ekonomii użytkowania: znacznie taniej
Jeśli wyniki benchmarków mogą być postrzegane jako względne, to obniżka cen jest już absolutnie namacalna. To prawdopodobnie najsilniejszy atut marketingowy tego wydania. Composer 2 Standard kosztuje 0,50 USD za milion tokenów wejściowych i 2,50 USD za milion tokenów wyjściowych.
To ogromna zmiana w porównaniu do poprzednich stawek. Firma wprowadza też wariant szybszy, Composer 2 Fast, który oferuje identyczny poziom inteligencji, ale wyższą przepustowość. Kosztuje on 1,50 USD za wejście i 7,50 USD za wyjście, co i tak stanowi znaczną obniżkę względem poprzedniej generacji.
Cursor idzie o krok dalej i czyni szybszy wariant domyślnym dla użytkowników. To odważny ruch, który sugeruje, że priorytetem jest płynność pracy, a firma może zapewnić ją w konkurencyjnej cenie. Dla użytkowników planów indywidualnych zużycie Composer jest częścią osobnej puli z ogólnym limitem, co ułatwia kontrolę kosztów.
Skupienie na zadaniach długofalowych
Cursor nie oferuje po prostu lepszego autouzupełniania kodu. Kluczowym przesłaniem technicznym jest to, że Composer 2 został wytrenowany specjalnie pod kątem długofalowego kodowania agentowego.
W praktyce chodzi o to, by model nie tylko napisał pojedynczą funkcję, ale potrafił prowadzić złożony, wieloetapowy proces: analizę repozytorium, podejmowanie decyzji o koniecznych zmianach, edycję wielu plików, uruchamianie poleceń, interpretację błędów i kontynuowanie pracy aż do osiągnięcia celu. To właśnie te "setki akcji", o których wspomina firma.
Postęp w tej dziedzinie jest kluczowy, ponieważ wiele modeli świetnie radzi sobie z izolowanymi zadaniami, ale "gubi wątek" w dłuższych, sekwencyjnych procesach programistycznych.
Kompresja w pętli uczenia: techniczny sekret modelu
Aby rozwiązać problem długiego horyzontu planowania, zespół Cursor zastosował innowacyjną technikę treningu zwaną compaction-in-the-loop reinforcement learning. W dużym uproszczeniu: zamiast traktować podsumowanie kontekstu (gdy okno kontekstowe się kończy) jako zewnętrzny, odrębny krok, wbudowano tę funkcję bezpośrednio w proces uczenia się modelu.
Jak to działa? Podczas treningu model jest celowo wypychany do limitu swojego okna kontekstowego. Następnie, za pomocą uczenia ze wzmocnieniem (RL), jest nagradzany za wygenerowanie "skompresowanej" wersji własnej historii, która pozwala mu pomyślnie dokończyć zadanie.
Jeśli model przygotuje złe podsumowanie – na przykład pominie kluczową nazwę zmiennej czy informację o poprzednio naprawionym błędzie – zawiedzie w zadaniu i otrzyma ujemną nagrodę. Dzięki temu uczy się, które elementy historii są naprawdę istotne dla kontynuowania pracy.
Według danych Cursor, to podejście znacząco redukuje błędy związane z kompresją kontekstu w porównaniu do wcześniejszych metod. Generowane podsumowania są też dużo wydajniejsze pod względem zużycia tokenów niż standardowe streszczenia tworzone na podstawie promptów. Pozwala to agentowi na pracę nad refaktoryzacją całego projektu bez utraty głównego celu.
Cursor: mały gigant na rynku AI dla deweloperów
Kontekst tego wydania jest nie mniej ciekawy niż sam model. Anysphere rozwija się dynamicznie. Firma zatrudnia około 400 osób, co w porównaniu do gigantów takich jak OpenAI, Anthropic czy Google, czyni ją stosunkowo małym graczem. Mimo to udaje jej się nie tylko rozwijać zaawansowane środowisko programistyczne, ale także tworzyć i szybko iterować własne, konkurencyjne modele. Wydanie Composer 2 w tak krótkim czasie pokazuje niezwykłe tempo innowacji.
Podsumowanie: praktyczny krok naprzód
Wydanie Composer 2 nie jest ogłoszeniem "zabójcy" modeli konkurencji. To pragmatyczna i prawdopodobnie bardziej użyteczna dla programistów propozycja. Cursor mówi: nasz model wszedł do wyższej ligi jakościowej, oferuje atrakcyjną ekonomię i jest głęboko zintegrowany z narzędziem, z którego i tak korzystasz.
Dla deweloperów już pracujących w Cursorze aktualizacja do Composer 2 wydaje się oczywistym wyborem – oferuje lepszą wydajność za ułamek wcześniejszych kosztów. Dla osób rozważających zmianę środowiska to kolejny mocny argument. Firma pokazuje, że potrafi szybko dostarczać realną wartość, łącząc badania nad AI z praktycznymi potrzebami programistów. W świecie AI, gdzie wielkie, ogólne modele często kradną uwagę, Cursor konsekwentnie udowadnia, że głęboka specjalizacja i dopasowanie do konkretnego workflow użytkownika to potężna strategia.


Dodaj komentarz