Meta czyta myśli bez implantu? Przełom w AI i MEG

Naukowcy z Meta AI (FAIR) opublikowali właśnie wyniki eksperymentu, który przybliża nas do interfejsu mózg-komputer bez konieczności wszczepiania elektrod. Nowa wersja modelu Brain2Qwerty wykorzystuje magnetoencefalografię (MEG) – technikę rejestrującą pola magnetyczne wytwarzane przez aktywność neuronów, mierzone poza czaszką.

W badaniu wzięło udział dziewięć zdrowych ochotników. Każda osoba spędziła dziesięć godzin na nagrywaniu – łącznie przepisano 22 tysiące zdań. Schemat był prosty: uczestnik słyszał zdanie, robił krótką pauzę, a następnie wpisywał je na klawiaturze, nie widząc tekstu na ekranie. Model rekonstruował treść właśnie na podstawie sygnałów mózgowych zarejestrowanych w fazie pisania.

Jak działa nowa architektura Brain2Qwerty

Wersja druga różni się od poprzedniczki w kilku kluczowych aspektach. Podstawową zmianą jest przejście z synchronizacji na przetwarzanie asynchroniczne – wersja pierwsza (Brain2Qwerty v1) potrzebowała dokładnego znacznika czasu dla każdego naciśnięcia klawisza, by dopasować go do sygnału. Nowy model działa na strumieniu ciągłym i samodzielnie przypisuje do niego poszczególne znaki, bez żadnych danych o tym, kiedy dokładnie nastąpiło uderzenie w klawisz.

Dziesięciokrotnie więcej danych to podstawa

Zespół badawczy podkreśla, że bardziej wymagające zadanie asynchroniczne działa tylko dlatego, że nowy zestaw nagrań zawiera dziesięć razy więcej danych na osobę oraz znacznie bardziej zróżnicowane zdania niż oryginalny zbiór. To przełożyło się bezpośrednio na skuteczność modelu.

Trzy poziomy przetwarzania i uczenie głębokie

Brain2Qwerty v2 opiera się na trzech głównych elementach sztucznej inteligencji. Po pierwsze, głębokie uczenie (deep learning) zastąpiło ręcznie tworzone etapy rozpoznawania stosowane poprzednio. Po drugie, system analizuje sygnały na trzech poziomach: znaków, słów i całych zdań. Po trzecie, zespół wykorzystał agentów AI do samodzielnego pisania kodu optymalizacyjnego.

Na poziomie zdań zastosowano model językowy Qwen3, poddany fine-tuningowi, który przekształca zaszumione sygnały mózgowe w spójne wypowiedzi. Bez tej warstwy – gdy działamy tylko na surowym enkoderze – wskaźnik błędów słów (WER, word error rate) wynosi 55%. Z językowym modelem spada do 39%.

Wyniki: dobre słowa, gorsze litery

Naukowcy porównali nowy model z dwoma prostszymi metodami. Pierwsza to sam enkoder, odczytujący znaki bezpośrednio z sygnału, bez wygładzania przez model językowy. Druga to podejście z wersji pierwszej, gdzie model N-gram korygował wyjście enkodera – znał statystyczne prawdopodobieństwo ciągów liter z dużych zbiorów tekstów i łat wypaczał pojedyncze znaki, ale nie tworzył pełnych zdań.

Pomiary prowadzono na trzech poziomach. Wskaźnik błędów znaków (CER, character error rate) liczy nieprawidłowe litery. Wskaźnik błędów słów (WER) liczy nieprawidłowe wyrazy. Natomiast wskaźnik błędów semantycznych mierzy, jak bardzo znaczenie oddaliło się od docelowego zdania.

Zwycięstwo w słowach i znaczeniu

Pod względem słów i znaczenia Brain2Qwerty v2 wyraźnie wygrywa. WER spadł do 39%, podczas gdy surowy enkoder osiąga 55%, a model N-gram z v1 – 43%. Co więcej, u najlepszego badanego 28% zdań zostało odtworzonych perfekcyjnie, a 47% zawierało co najwyżej jeden błędny wyraz.

Gdy model językowy wymyśla

Na poziomie znaków obraz się odwraca. Wersja v2 osiąga 31% błędów – gorzej niż surowy enkoder (28%) i model N-gram (26%). Przyczyna tkwi w samym modelu językowym: został wytrenowany, by produkować płynne zdania, nawet gdy sygnał mózgowy ich nie potwierdza. W razie wątpliwości wymyśla gramatycznie poprawną, ale całkowicie błędną wypowiedź. Dla najsłabszego uczestnika model zinterpretował zdanie „samochody nie są dozwolone na tej drodze” jako „nie spadła ze schodów”.

Zespół badawczy uznaje jednak lepsze wyniki w słowach i semantyce za bardziej miarodajny postęp – skuteczna komunikacja zależy od znaczenia, nie od dokładnego dopasowania liter. Dla porównania: wcześniejsze badanie oparte na fMRI osiągało 92–94% błędów słów.

Gdy sztuczna inteligencja optymalizuje własne badania

Ciekawostką jest autorska część eksperymentu. Zespół postawił przed trzema niezależnymi agentami AI (opartymi na Claude Opus 4.6) zadanie samodzielnego obniżenia wskaźnika błędów. Agenci mieli modyfikować kod i przeprowadzać eksperymenty.

Udało im się znaleźć techniki takie jak wygładzanie etykiet (label smoothing), dropout modalności i krótsze prompty, które sprawdziły się u wszystkich badanych – przewyższając standardową metodę optymalizacji wyraźną różnicą. Jednak gdy agenci otrzymali zadanie otwarte, bez konkretnych wytycznych, ponieśli klęskę. Ich rozległe modyfikacje kodu powodowały awarie większości obliczeń. Badacze podsumowują, że na razie rola człowieka pozostaje krytyczna.

Dystans do implantów i przyszłość kliniczna

Różnica między nieinwazyjnym Brain2Qwerty v2 a systemami wszczepianymi wciąż jest ogromna. Inwazyjne interfejsy osiągają poniżej 2% błędu słów przy pisaniu. Jednak dokładność nowego modelu stale rośnie wraz z ilością danych i – jak twierdzą autorzy – nie widać jeszcze górnej granicy. Zbieranie kolejnych nagrań to najprostsza dźwignia poprawy.

Pozostają też istotne pytania otwarte. Istnieją znaczne różnice między poszczególnymi uczestnikami, badanie ograniczono do zdrowych ochotników wykonujących rzeczywiste ruchy podczas pisania, a system wciąż nie działa w czasie rzeczywistym. Drogę do zastosowań klinicznych zespół widzi w przenośnych czujnikach MEG pracujących w temperaturze pokojowej. Testy wykazały, że nawet połowa sensorów zapewnia niemal pełną skuteczność.

„AI dziś uświadamia nam, że niektóre koncepcje, które bierzemy za pewnik – jak rozumowanie czy myślenie – mogą wymagać ponownej oceny w świetle tego, co potrafią algorytmy głębokiego uczenia.”
Jean-Rémi King, neurobiolog kierujący grupą badawczą w FAIR Meta

Okno na mózg, nie tylko narzędzie medyczne

Brain2Qwerty to element szerszego programu badawczego, którym kieruje neurobiolog Jean-Rémi King. Jego zespół wcześniej dekodował mowę z danych MEG i EEG (2022), generował obrazy z aktywności mózgu w milisekundach (2023), a także stworzył model TRIBE v2 przewidujący aktywność mózgu zamiast ją mierzyć.

Dla Kinga modele tłumaczące aktywność mózgu na tekst to nie tylko urządzenia medyczne. „To okno na to, jak działa sam mózg” – zauważa. Jego zdaniem neuronauka i sztuczna inteligencja od początku są ze sobą ściśle powiązane, a obecne możliwości algorytmów głębokiego uczenia mogą zmusić nas do przewartościowania podstawowych pojęć, takich jak rozumowanie czy myślenie.

Bezpośrednia poprzedniczka wersji drugiej, Brain2Qwerty v1, która rekonstruowała pisane zdania z dokładnością do 80% na poziomie znaków i osiągała 29% błędu znaków dla MEG (oraz 65% dla EEG) u 35 uczestników, została już opublikowana w prestiżowym czasopiśmie Nature Neuroscience. Następne wersje – wyposażone w więcej danych i lepsze modele językowe – mogą stopniowo zacierać granicę między tym, co wymaga rozcięcia czaszki, a tym, co da się odczytać z zewnątrz.