Google prezentuje Gemini 2.5 – najpotężniejszy model AI w historii
Gemini 2.5 to model myślący, zaprojektowany do rozwiązywania coraz bardziej złożonych problemów. Pierwsza wersja – Gemini 2.5 Pro Experimental – prowadzi w popularnych testach porównawczych z zauważalną przewagą, demonstrując zaawansowane możliwości rozumowania i programowania.
Najbardziej inteligentny model AI od Google
Google przedstawia dziś Gemini 2.5, swój najbardziej inteligentny model AI. Pierwsza wersja 2.5 Pro Experimental zajmuje pierwsze miejsce w rankingu LMArena ze znaczącą przewagą nad konkurencją. Modele Gemini 2.5 to modele myślące, zdolne do analizowania swoich myśli przed udzieleniem odpowiedzi, co przekłada się na zwiększoną wydajność i dokładność.

W dziedzinie sztucznej inteligencji „rozumowanie” systemu oznacza więcej niż tylko klasyfikację i przewidywanie. Odnosi się do zdolności analizowania informacji, wyciągania logicznych wniosków, uwzględniania kontekstu i niuansów oraz podejmowania świadomych decyzji.
Ewolucja możliwości myślenia
Od dłuższego czasu Google pracował nad ulepszeniem zdolności rozumowania AI poprzez techniki takie jak uczenie ze wzmocnieniem i prompting łańcuchowy. Niedawno wprowadzono pierwszy model myślący – Gemini 2.0 Flash Thinking. Teraz, wraz z Gemini 2.5, osiągnięto nowy poziom wydajności, łącząc znacznie ulepszony model bazowy z udoskonalonym procesem post-treningu. W przyszłości te możliwości myślenia będą wbudowane bezpośrednio we wszystkie modele.
Możliwości Gemini 2.5 Pro
Gemini 2.5 Pro Experimental to najbardziej zaawansowany model do złożonych zadań. Zajmuje pierwsze miejsce w rankingu LMArena, który mierzy preferencje użytkowników. Model wykazuje się również silnymi zdolnościami rozumowania i programowania, prowadząc w popularnych testach z zakresu kodowania, matematyki i nauk ścisłych.
Model jest już dostępny w Google AI Studio i aplikacji Gemini dla użytkowników Gemini Advanced, a wkrótce pojawi się również w Vertex AI. Google planuje wprowadzić cennik w najbliższych tygodniach, umożliwiając użytkownikom korzystanie z 2.5 Pro z wyższymi limitami dla zastosowań produkcyjnych.
Zaawansowane rozumowanie i programowanie
Gemini 2.5 Pro ustanawia nowe standardy w testach wymagających zaawansowanego rozumowania. Bez dodatkowych technik testowych model prowadzi w benchmarkach matematycznych i naukowych, takich jak GPQA i AIME 2025. Osiąga również najlepszy wynik 18,8% w teście Humanity’s Last Exam, opracowanym przez setki ekspertów.
W zakresie programowania Gemini 2.5 dokonał znaczącego postępu w porównaniu z wersją 2.0. Model doskonale radzi sobie z tworzeniem atrakcyjnych wizualnie aplikacji webowych i aplikacji agentowych, a także z transformacją i edycją kodu. W teście SWE-Bench Verified model osiąga wynik 63,8% przy użyciu niestandardowej konfiguracji agenta.
Rozbudowane możliwości kontekstowe
Gemini 2.5 bazuje na najlepszych cechach poprzednich modeli, oferując natywną multimodalność i szeroki kontekst. Model 2.5 Pro obsługuje okno kontekstowe o wielkości 1 miliona tokenów (wkrótce 2 miliony) i wykazuje lepszą wydajność niż poprzednie generacje. Może analizować obszerne zbiory danych i obsługiwać złożone problemy z różnych źródeł informacji, w tym tekstu, audio, obrazów, wideo i całych repozytoriów kodu.