Andrej Karpathy, współtwórca OpenAI, dołącza do Anthropic i buduje zespół, który będzie używał Claude do przyspieszania pre-trainingu

Andrej Karpathy, współtwórca OpenAI, dołącza do Anthropic i buduje zespół, który będzie używał Claude do przyspieszania pre-trainingu

Andrej Karpathy, współtwórca OpenAI i były dyrektor AI w Tesli, ogłosił 19 maja 2026 roku, że dołącza do Anthropic, firmy odpowiedzialnej za model Claude. W swoim wpisie na X wyraził radość z powrotu do badań i rozwoju, podkreślając, że nadchodzące lata będą kluczowe dla rozwoju dużych modeli językowych (LLM). Karpathy rozpoczął pracę w Anthropic w tym samym tygodniu, dołączając do zespołu zajmującego się pre-trainingiem, który jest kluczowym i kosztownym etapem trenowania modeli językowych.

Karpathy otrzymał ważne zadanie. Będzie prowadzić nową grupę badawczą, która skupi się na wykorzystaniu modelu Claude do przyspieszania i automatyzacji badań nad procesem pre-trainingu kolejnych modeli. Oznacza to, że sztuczna inteligencja opracowana przez Anthropic będzie wspierać rozwój bardziej zaawansowanych systemów AI, co może wpłynąć na konkurencję w tej dziedzinie.

Kluczowe fakty o przejściu Karpathy’ego

  • Andrej Karpathy ogłosił dołączenie do Anthropic 19 maja 2026 roku, a pracę rozpoczął natychmiast, w tym samym tygodniu.
  • Dołącza do zespołu pre-trainingu, który odpowiada za podstawowy, wielkoskalowy trening modeli takich jak Claude.
  • Będzie prowadzić nową grupę, której celem jest użycie modelu Claude do usprawnienia badań nad pre-trainingiem – czyli AI pomagająca w rozwoju AI.
  • Ten ruch wzmacnia pozycję Anthropic w konkurencji o talenty badawcze w dziedzinie AI.
  • Karpathy ma unikalne doświadczenie jako współtwórca OpenAI i były dyrektor AI w Tesli, gdzie prowadził zespoły zajmujące się wizją komputerową dla Autopilota.

Znaczenie przejścia dla rywalizacji w świecie AI

Transfer Karpathy’ego to nie tylko zmiana pracy, ale także istotny sygnał dla branży. Anthropic, znany z modelu Claude, często był postrzegany jako firma z filozoficznym podejściem do bezpieczeństwa AI. Pozyskanie jednego z oryginalnych twórców OpenAI, który ma doświadczenie w skalowaniu systemów, pokazuje determinację Anthropic w dążeniu do technologicznej doskonałości.

Skupienie się na pre-trainingu odpowiada na aktualne wyzwania. Budowa nowoczesnych modeli wymaga ogromnych zasobów obliczeniowych i finansowych. Każda optymalizacja, która pozwala na uzyskanie lepszego modelu w krótszym czasie, staje się strategiczną przewagą. Właśnie w tym obszarze Karpathy będzie działać.

Claude jako narzędzie do budowy kolejnych Claude

Ciekawym aspektem tej sytuacji jest misja nowego zespołu. Wykorzystanie obecnego modelu Claude do przyspieszenia badań nad treningiem jego następców to przykład automatyzacji na wysokim poziomie. Firma planuje włączyć swoją AI w proces badawczy, co może oznaczać analizę danych treningowych, generowanie lub ocenę kodów związanych z infrastrukturą treningową, symulację wyników zmian hiperparametrów oraz pomoc w odkrywaniu nowych architektur. Taki kierunek rozwoju AI może prowadzić do szybkiej ewolucji w tej dziedzinie.

Wpływ na przyszłość rozwoju LLM

Decyzja Karpathy’ego wskazuje, gdzie koncentrują się wysiłki największych graczy. Nie chodzi tylko o finetuning czy specjalizację modeli, ale o fundamentalny proces pre-trainingu. Jeśli jego zespół zdoła znacząco zautomatyzować lub zoptymalizować tę fazę, może to przyspieszyć cykle wydawania nowych, potężniejszych modeli przez Anthropic.

Dla środowiska developerskiego i osób zainteresowanych AI, takie ruchy są istotnymi wskazówkami. Obszary takie jak dev ops dla AI, infrastruktura treningowa i automatyzacja badań nad modelami będą prawdopodobnie kluczowymi specjalizacjami. Sukces lub porażka tego podejścia w Anthropic będzie praktycznym testem idei, że zaawansowane LLM mogą być nie tylko produktem końcowym, ale także fundamentalnym narzędziem w ciągłym rozwoju AI.

Komentarze

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *