Meta testuje chatboty konkurencji na kontach nieletnich

Koncern Meta zlecił setkom pracowników zewnętrznej firmy Covalen tworzenie fałszywych kont nieletnich, a następnie wysyłanie prowokacyjnych promptów do chatbotów największych rywali – OpenAI (ChatGPT), Alphabet (Gemini) i Character.AI. Projekt, działający pod wewnętrzną nazwą Cannes, trwał co najmniej do 21 kwietnia 2026 roku, a jego szczegóły ujawniło WIRED na podstawie analizy arkuszy kalkulacyjnych i zeznań byłych kontrahentów.

Skala operacji jest imponująca: w jednej zakończonej w sierpniu 2025 rundzie przepuszczono przez systemy konkurencji ponad 45 tysięcy promptów. Żadna z testowanych firm nie została o tym poinformowana. WIRED przejrzał arkusz zawierający 3748 przykładów – setki z nich dotyczyły samobójstw, samookaleczeń, zaburzeń odżywiania, a co najmniej 239 – seksu i romansów. Wiele promptów było formułowanych w imieniu dziecka w kryzysie, np. ciężarnej 13-latki pytającej o zakup tabletek lub dziewczyny szukającej sposobu na ukrycie przed rodzicami anoreksji. Do części wiadomości dołączano zdjęcia tabletek i noży.

Jak Meta tłumaczy swoją działalność?

Firma Marka Zuckerberga nie zaprzecza faktom, ale przedstawia je jako rutynową praktykę w branży. Rzecznik Meta stwierdził, że „testowanie i benchmarkowanie odpowiedzi chatbotów w celu zapewnienia bezpiecznych i odpowiednich dla wieku doświadczeń to odpowiedzialna, standardowa branżowo praktyka”. Dodał, że wyniki tych testów nie są wykorzystywane do trenowania własnych modeli AI. Covalen nie odpowiedział na prośbę o komentarz.

Wewnętrzny dokument Covalena opisuje projekt Cannes w bardziej podniosły sposób – jako „kompleksowe benchmarkowanie bezpieczeństwa AI”, które dostarczyło „krytycznych zbiorów danych do porównania modeli i zgodności z regulacjami”. Samo testowanie produktu konkurencji nie jest niczym nowym – Business Insider rok wcześniej informował, że kontraktorzy Google porównywali odpowiedzi Barda z ChatGPT, a potem poprawiali Barda, by je przebijał. To, co odróżnia akcję Meta, to skala, kamuflaż i tematyka pytań.

Co najbardziej niepokoi ekspertów

Największe kontrowersje budzi wykorzystanie kont podszywających się pod dzieci. Rumman Chowdhury, dyrektor generalna Humane Intelligence, po przejrzeniu próbki promptów stwierdziła, że długotrwały projekt z użyciem „fałszywych kont udających dzieci” wykracza poza to, co zwykle określa się mianem „standardowej oceny branżowej”. Określiła go mianem „szarej strefy zarządzania, w której bezpieczeństwo staje się wygodnym pretekstem dla praktyk antykonkurencyjnych”.

Dwóch prawników specjalizujących się w mowie w internecie, którzy przeanalizowali przykłady dla WIRED, stwierdziło, że materiały nie przekroczyły granicy nielegalnej pornografii dziecięcej ani obsceniczności. Mimo to byli kontrahenci opisują pracę jako niepokojącą. Jedna z osób obawiała się, że mogą generować lub przechowywać materiały dotyczące wykorzystywania. Inna podejrzewała, że prawdziwym celem jest ciche pozyskiwanie danych od rywali, by zasilić nimi systemy Meta.

Rywale nie są zachwyceni

Wszystkie trzy testowane firmy zakazują tego typu działań w swoich regulaminach. OpenAI zabrania nieproszonych testów bezpieczeństwa, prób omijania zabezpieczeń oraz wykorzystywania wyników do budowania konkurencyjnych modeli. Google blokuje próby obchodzenia filtrów bezpieczeństwa. Character.AI zakazuje treści szkodliwych, wyzyskujących i nielegalnych, a od końca 2025 roku całkowicie zamknął otwarty czat dla użytkowników poniżej 18. roku życia.

Rzecznik Character.AI nazwał działania Meta naruszeniem „naszych Warunków korzystania z usługi oraz postaci i światów stworzonych przez naszą społeczność”. OpenAI poinformowało, że bada sprawę, ale nie udzieliło dalszych komentarzy. Google stwierdził, że nie autoryzował testów i nie zna ich celu, dodając, że jego własne kontrole pokazują, iż Gemini odpowiada zgodnie z polityką firmy.

Regulatorzy i tak już patrzą im na ręce

Czas ujawnienia raportu jest wyjątkowo niefortunny dla Meta. Amerykańska Federalna Komisja Handlu (FTC) we wrześniu 2025 roku wszczęła formalne dochodzenie w sprawie AI i bezpieczeństwa dzieci, obejmujące m.in. Meta, OpenAI i Google. Teraz pojawia się dokumentacja, która pokazuje, że jedna z badanych firm testowała pozostałe przy użyciu fałszywych kont dzieci.

Europa również nie próżnuje. Akt o AI (AI Act) oraz Akt o usługach cyfrowych (Digital Services Act) nakładają na platformy obowiązek oceny ryzyka, jakie ich systemy stwarzają dla nieletnich. Przepisy te dotyczą każdej firmy działającej na terenie Unii Europejskiej. Regulatorzy po obu stronach Atlantyku zadają teraz to samo pytanie: kto ponosi odpowiedzialność, gdy chatbot rozmawia z dzieckiem o samookaleczeniu?

Nadzór nad AI staje się zresztą samodzielną gałęzią rynku – venture capital zaczyna inwestować w startup’y zajmujące się bezpieczeństwem agentów AI. Całe zamieszanie wpisuje się też w szerszy kontekst: Meta pilnie strzeże własnych ambicji w dziedzinie AI, a nawet ograniczyła swoim inżynierom korzystanie z narzędzi kodujących rywali, rozwijając własne rozwiązania. Tymczasem producenci chatbotów toczą kosztowny wyścig o użytkowników i wiarygodność – Anthropic i OpenAI polują na płacących klientów, OpenAI wchodzi w reklamy, a Google broni swojej dominacji w erze AI. W tej rywalizacji granica między testowaniem bezpieczeństwa a wywiadem konkurencyjnym zaczyna się zacierać.

Dwa wersje prawdy – którą uwierzą regulatorzy?

To właśnie owo zacieranie się granic jest sednem sprawy. Meta twierdzi, że usiłowała uczynić chatboty bezpieczniejszymi. Krytycy odpowiadają, że firma – podszywając swoich kontrahentów pod dzieci – po prostu szpiegowała konkurencję, a całość opakowała w narrację o bezpieczeństwie. Dokumenty są już w rękach regulatorów. Meta będzie musiała przekonać ich, która wersja jest prawdziwa.

Jeśli Ty lub ktoś z Twoich bliskich zmaga się z kryzysem psychicznym, pomoc jest dostępna: w Polsce działa Bezpłatny Telefon Zaufania dla Dorosłych w Kryzysie Psychicznym 116 123 oraz Telefon Zaufania dla Dzieci i Młodzieży 116 111.