Nowa analiza przeprowadzona przez badacza Igora Chirikova ujawnia niepokojący trend: po wejściu ChatGPT na rynek w listopadzie 2022 roku, odsetek ocen A na amerykańskich uniwersytetach skoczył o 13 punktów procentowych. To wzrost o około 30% w porównaniu z rokiem 2022. Średnia GPA podniosła się o 0,12 punktu, a rozkład ocen się zawęził – oceny A-minus i B-plus są „przepychane” w górę, do pełnych piątek. Czy to dowód na to, że studenci uczą się lepiej z pomocą AI, czy raczej sygnał, że sztuczna inteligencja przejmuje ich zadania?
Jak AI zmienia rozkład ocen na uczelniach
Chirikov przeanalizował trendy w ocenach przez osiem semestrów jesiennych (od 2018 do 2025), obejmując 319 kursów z 84 różnych wydziałów. Kluczowym elementem badania było zmierzenie, jak bardzo dany kurs jest narażony na wpływ AI. W tym celu badacz posłużył się sylabusami z jesieni 2022 roku – czyli z okresu, zanim ChatGPT w ogóle istniał. Sprawdził, jaki udział w danym kursie mają zadania pisemne i programistyczne, czyli obszary, w których generatywna sztuczna inteligencja radzi sobie najlepiej.
Prace domowe jako główny motor wzrostu ocen
Wyniki są jednoznaczne: to oceny z prac domowych napędzają cały wzrost, a nie wyniki egzaminów nadzorowanych. Aby sprawdzić, czy wyższe oceny faktycznie odzwierciedlają lepsze uczenie się, Chirikov porównał kursy o różnej wadze prac domowych w końcowej ocenie. Gdyby AI faktycznie poprawiało proces uczenia, wzrost ocen powinien być widoczny niezależnie od tego, czy kurs opiera się na pracach domowych, czy na egzaminach. Tymczasem dane mówią coś innego: w kursach, gdzie prace domowe stanowiły więcej niż medianową wagę, odsetek ocen A wzrósł o dodatkowe 16 punktów procentowych w porównaniu z kursami o mniejszej wadze prac domowych, przy tym samym poziomie ekspozycji na AI. W tych drugich efekt był niewielki i statystycznie nieistotny.
Test placebo potwierdza tę tezę. W przypadku zadań z prezentacji ustnych – gdzie AI jest znacznie mniej przydatna – oceny w ogóle się nie zmieniły.
Dlaczego to nie jest efekt lepszego uczenia się
Wynik jest, jak pisze Chirikov, „trudny do pogodzenia z szerokimi korzyściami edukacyjnymi lub samym efektem sortowania”. Inflacja ocen nie jest nowym zjawiskiem na amerykańskich uczelniach. Na Harvardzie odsetek ocen A wzrósł z 24 procent w 2005 roku do 60,2 procent w 2025 roku, co badanie dokumentuje. Wcześniejsze analizy wskazywały na takie przyczyny jak ankiety studenckie nagradzające pobłażliwość wykładowców, konkurencję między uczelniami czy instytucjonalne polityki oceniania. Jednak zdaniem Chirikova, AI działa w zupełnie inny sposób.
Każdy z wcześniejszych czynników wchodził w grę na etapie wystawiania oceny, po tym jak student oddał swoją pracę. Tymczasem AI zmienia proces powstawania samej pracy – jeszcze zanim nauczyciel w ogóle spojrzy na zadanie. Jeśli oceny w kursach obfitujących w pisanie i kodowanie coraz częściej odzwierciedlają treści wygenerowane przez sztuczną inteligencję, a nie rzeczywiste umiejętności studentów, może to prowadzić do poważnych konsekwencji.
Nawet Sam Altman, CEO OpenAI, przyznaje w niedawnym wywiadzie, że trzy i pół roku po premierze ChatGPT system edukacji prawie nie zareagował na AI. Spodziewał się roku oszukiwania, a potem systemowej reformy. Zamiast tego nie widzi żadnej znaczącej zmiany systemowej. Bez niej, ostrzega, umiejętności krytycznego myślenia mogą ulec „znaczącej atrofii”.
Altman wierzy jednak, że edukacja może się dostosować, tak jak radziła sobie z wcześniejszymi technologicznymi skokami. Podkreśla, że niektóre umiejętności – jak pisanie i kodowanie – powinny być nadal nauczane, bo trenują sam umysł. „Jestem kimś, kto myśli przez pisanie, i piszę wiele rzeczy, których nikomu nie pokazuję, ale to dla mnie wciąż ważne, żeby cokolwiek zrozumieć. Dlatego jestem wdzięczny, że nauczyłem się pisać. Ludzie mówią to samo o programowaniu” – wyjaśnia Altman.
Konsekwencje dla rynku pracy i pomysły na rozwiązania
Jeśli oceny w kursach pisemnych i programistycznych coraz bardziej odzwierciedlają output AI, a nie realne kompetencje, pracodawcy i programy studiów magisterskich mogą podejmować gorsze decyzje rekrutacyjne – ostrzega badanie. Chirikov wskazuje również na pętlę zwrotną: jeśli AI przejmuje zadania budujące umiejętności w trakcie studiów, absolwenci mogą wyjść na rynek słabsi dokładnie w tych obszarach, w których AI jest najmocniejsze. To może przyspieszyć automatyzację i poszerzyć luki kompetencyjne na rynku pracy.
Nie wystarczy przenieść wszystko na egzaminy nadzorowane
Jako remedium badanie sugeruje przemyślenie formatów egzaminacyjnych. Proste przeniesienie wszystkich zadań na egzaminy nadzorowane nie jest rozwiązaniem – jest ani wystarczające, ani łatwe do wdrożenia. Lepszym pomysłem jest projektowanie zadań, które albo ograniczają użycie AI, albo celowo włączają je w proces, na przykład poprzez wymaganie dokumentacji procesu pracy czy rozmów weryfikujących zrozumienie tematu.
Norwegia poszła w tym kierunku najdalej – niedawno w dużej mierze zakazała narzędzi AI w szkołach podstawowych i mocno ograniczyła ich użycie w szkołach średnich. Premier Jonas Gahr Stoere argumentował, że bezkrytyczne korzystanie z AI kusi uczniów do pomijania ważnych etapów uczenia się.
Pytanie brzmi: czy polskie uczelnie wyciągną wnioski z tych danych, zanim oceny stracą całkowicie swoją wartość jako sygnał o rzeczywistych umiejętnościach? Presja na zmiany rośnie, ale – jak pokazuje przykład Altmana – systemowa reakcja wciąż pozostaje w sferze postulatów.

