Google prezentuje Gemini 2.5 – najpotężniejszy model AI w historii

Gemini 2.5 to model myślący, zaprojektowany do rozwiązywania coraz bardziej złożonych problemów. Pierwsza wersja – Gemini 2.5 Pro Experimental – prowadzi w popularnych testach porównawczych z zauważalną przewagą, demonstrując zaawansowane możliwości rozumowania i programowania.

Najbardziej inteligentny model AI od Google

Google przedstawia dziś Gemini 2.5, swój najbardziej inteligentny model AI. Pierwsza wersja 2.5 Pro Experimental zajmuje pierwsze miejsce w rankingu LMArena ze znaczącą przewagą nad konkurencją. Modele Gemini 2.5 to modele myślące, zdolne do analizowania swoich myśli przed udzieleniem odpowiedzi, co przekłada się na zwiększoną wydajność i dokładność.

W dziedzinie sztucznej inteligencji „rozumowanie” systemu oznacza więcej niż tylko klasyfikację i przewidywanie. Odnosi się do zdolności analizowania informacji, wyciągania logicznych wniosków, uwzględniania kontekstu i niuansów oraz podejmowania świadomych decyzji.

Ewolucja możliwości myślenia

Od dłuższego czasu Google pracował nad ulepszeniem zdolności rozumowania AI poprzez techniki takie jak uczenie ze wzmocnieniem i prompting łańcuchowy. Niedawno wprowadzono pierwszy model myślący – Gemini 2.0 Flash Thinking. Teraz, wraz z Gemini 2.5, osiągnięto nowy poziom wydajności, łącząc znacznie ulepszony model bazowy z udoskonalonym procesem post-treningu. W przyszłości te możliwości myślenia będą wbudowane bezpośrednio we wszystkie modele.

Możliwości Gemini 2.5 Pro

Gemini 2.5 Pro Experimental to najbardziej zaawansowany model do złożonych zadań. Zajmuje pierwsze miejsce w rankingu LMArena, który mierzy preferencje użytkowników. Model wykazuje się również silnymi zdolnościami rozumowania i programowania, prowadząc w popularnych testach z zakresu kodowania, matematyki i nauk ścisłych.

Model jest już dostępny w Google AI Studio i aplikacji Gemini dla użytkowników Gemini Advanced, a wkrótce pojawi się również w Vertex AI. Google planuje wprowadzić cennik w najbliższych tygodniach, umożliwiając użytkownikom korzystanie z 2.5 Pro z wyższymi limitami dla zastosowań produkcyjnych.

Zaawansowane rozumowanie i programowanie

Gemini 2.5 Pro ustanawia nowe standardy w testach wymagających zaawansowanego rozumowania. Bez dodatkowych technik testowych model prowadzi w benchmarkach matematycznych i naukowych, takich jak GPQA i AIME 2025. Osiąga również najlepszy wynik 18,8% w teście Humanity’s Last Exam, opracowanym przez setki ekspertów.

W zakresie programowania Gemini 2.5 dokonał znaczącego postępu w porównaniu z wersją 2.0. Model doskonale radzi sobie z tworzeniem atrakcyjnych wizualnie aplikacji webowych i aplikacji agentowych, a także z transformacją i edycją kodu. W teście SWE-Bench Verified model osiąga wynik 63,8% przy użyciu niestandardowej konfiguracji agenta.

Rozbudowane możliwości kontekstowe

Gemini 2.5 bazuje na najlepszych cechach poprzednich modeli, oferując natywną multimodalność i szeroki kontekst. Model 2.5 Pro obsługuje okno kontekstowe o wielkości 1 miliona tokenów (wkrótce 2 miliony) i wykazuje lepszą wydajność niż poprzednie generacje. Może analizować obszerne zbiory danych i obsługiwać złożone problemy z różnych źródeł informacji, w tym tekstu, audio, obrazów, wideo i całych repozytoriów kodu.

Źródło Google