Giganci technologiczni stawiają na nowy kierunek w sztucznej inteligencji – modele świata. Amazon, Nvidia i AMD wspólnie zainwestowały 310 milionów dolarów w startup Odyssey ML, który tworzy trójwymiarowe symulacje rzeczywistości fizycznej. To wyraźny sygnał, że po dominacji modeli językowych (LLM) branża intensywnie szuka kolejnego przełomu.
Czym są modele świata 3D i jak różnią się od LLM-ów?
Modele świata (ang. world models) to systemy AI zaprojektowane nie do przewidywania kolejnych słów, ale do odtwarzania i rozumienia fizycznych reguł rządzących rzeczywistością. Odyssey ML opracowuje takie modele w trzech wymiarach – odwzorowują one przestrzeń, dynamikę obiektów oraz relacje między nimi. Zwykłe modele językowe operują wyłącznie na tekście, przez co nie potrafią uchwycić tego, co nazywamy „zdrowym rozsądkiem fizycznym”.
Od przewidywania tekstu do symulacji fizyki
Jak tłumaczy Oliver Cameron, współzałożyciel Odyssey ML, ich modele rozumieją fizykę, mowę ciała oraz dynamikę sytuacji – wszystko to, czego modele czysto językowe nie są w stanie uchwycić. Zamiast generować odpowiedzi tekstowe, systemy te tworzą realistyczne, interaktywne reprezentacje przestrzeni i obiektów. To kluczowa różnica: LLM‑y opisują świat, modele świata próbują go symulować.
Modele świata potrafią odwzorować fizykę, dynamikę i relacje przestrzenne – rzeczy, których modele językowe nie są w stanie uchwycić.
Oliver Cameron, współzałożyciel Odyssey ML
Kto stoi za Odyssey ML i jakie ma zaplecze?
Założyciele startupu, Oliver Cameron i Jeff Hawke, wywodzą się z branży pojazdów autonomicznych. To doświadczenie przełożyli na wizję modeli świata zdolnych przewidywać zachowania fizyczne w przestrzeni 3D. Firma zatrudnia 55 osób, które pracują w biurach w Londynie, Zurychu i Palo Alto.
Lista inwestorów nie ogranicza się do trzech głównych graczy. W rundzie udział wzięły również: IQT (fundusz powiązany z CIA), GV (dawniej Google Ventures), główny naukowiec Google Jeff Dean oraz investor Elad Gil. Odyssey ML wykorzystuje chmurę AWS jako preferowanego dostawcę i działa na autorskich układach Trainium od Amazonu. Wycena startupu po tej inwestycji wynosi 1,45 miliarda dolarów.
Dlaczego modele świata to kolejny wielki krok w AI?
Środowisko badawcze od dawna wskazuje, że same modele językowe nie wystarczą do osiągnięcia ogólnej sztucznej inteligencji (AGI). Yann LeCun, szef działu AI w Meta, wielokrotnie podkreślał, że systemy oparte wyłącznie na tekście nie są w stanie dorównać ludzkiemu rozumieniu świata. Z kolei Demis Hassabis, dyrektor generalny Google DeepMind, uważa modele świata za kluczowy element na drodze do AGI.
Modele świata to niezbędny krok w kierunku sztucznej inteligencji o ludzkim poziomie rozumienia.
Demis Hassabis, CEO Google DeepMind
Nie jest to odosobniony głos. Pionierka AI Fei‑Fei Li założyła startup World Labs, który realizuje bardzo podobną koncepcję. Inwestycja gigantów takich jak Amazon, Nvidia i AMD potwierdza, że rynek widzi w modelach świata realny potencjał komercyjny – od robotyki i automatyzacji, przez symulacje przemysłowe, po rozszerzoną rzeczywistość.
Odyssey ML dopiero zaczyna swoją drogę, ale kapitał i wsparcie technologiczne, które otrzymał, stawiają go w ścisłej czołówce wyścigu o następną generację systemów AI. Jeszcze nie wiemy, czy modele świata faktycznie zastąpią LLM‑y, czy raczej staną się ich naturalnym uzupełnieniem. Jedno jest pewne – branża AI po latach dominacji tekstu zaczyna myśleć przestrzenią.

