Nowy Jork zmusza boty AI do ujawnienia się – ustawa zmienia reguły gry

Nowy Jork postanowił zakończyć epokę anonimowych botów AI. Władze stanowe uchwaliły ustawę, która zmusza wszystkie oprogramowania automatycznie przeszukujące strony wydawców do ujawnienia swojej tożsamości i celu działania. To pierwsze tak precyzyjne regulacje w USA – kary mogą sięgać 15 tysięcy dolarów dziennie, a wydawcy zyskują narzędzia prawne do identyfikacji ukrytych skanerów. Co dokładnie zmienia się dla firm AI i polskich czytelników śledzących temat?

Jakie wymogi nakłada nowojorska ustawa o ukrytych botach?

Ustawa A11292, znana jako New York Stealth Crawler Prohibition Act, trafiła do gubernator Kathy Hochul 5 czerwca 2026 roku. Jej droga przez legislaturę była rekordowo szybka – od złożenia 8 maja do przyjęcia w obu izbach minęły niespełna cztery tygodnie. Jeśli dokument wejdzie w życie, po 90 dniach od podpisu zacznie obowiązywać wszystkich operatorów botów, którzy korzystają z treści nowojorskich źródeł informacji.

User-agent z prawdziwego zdarzenia

Każdy crawler (program automatycznie odwiedzający strony) musi przekazać serwerowi wydawcy poprawny user-agent string. Nie wystarczy byle jakie oznaczenie – wymagane są trzy elementy: nazwa oprogramowania, jego wersja oraz nazwa firmy stojącej za botem. Wcześniej wiele firm AI stosowało niejasne identyfikatory, podmieniało je lub całkowicie pomijało. Badania z początku 2026 roku ujawniły, że niektórzy agenci podszywali się pod ludzkie przeglądarki, zmieniając tożsamość przy każdym żądaniu.

Obowiązek ujawnienia celu – także przyszłych zastosowań

Druga, znacznie bardziej rygorystyczna część regulacji wymaga od operatorów ujawnienia „wszystkich zastosowań i celów, do których treść może zostać użyta”. To nie tylko bieżące przeznaczenie, ale każde możliwe wykorzystanie w przyszłości. Firma skanująca artykuły w celu trenowania modelu językowego musi to wyraźnie wskazać. Podobnie bot zbierający dane do generowania podsumowań czy indeksowania wyszukiwarki. Ustawa nie precyzuje formatu tego oświadczenia – pozostawia otwartą furtkę dla dalszych rozporządzeń lub sporów sądowych.

Definicja stealth crawlera i kary

Bot, który nie spełnia któregokolwiek z tych dwóch obowiązków, automatycznie staje się „ukrytym skanerem” (stealth crawler). Jego użycie w sposób przynoszący szkodę ekonomiczną wydawcy jest zakazane. Egzekucję prawa powierza się prokuratorowi generalnemu Nowego Jorku, a kary sięgają 15 tysięcy dolarów za każdy dzień naruszenia. Co istotne, do stwierdzenia winy nie trzeba udowadniać konkretnej szkody – wystarczy samo działanie.

Kogo dokładnie chroni nowa regulacja?

Ustawa definiuje „objęte źródło informacji” (covered news source) jako wszelkie platformy internetowe należące do prasy drukowanej, telewizji, radia, kabla, satelity lub wydawców cyfrowych, które spełniają cztery warunki. Po pierwsze: muszą pełnić funkcję informacyjną porównywalną z tradycyjnym dziennikarstwem. Po drugie: inwestować znaczące środki w tworzenie oryginalnych treści. Po trzecie: publikować nowe materiały co najmniej raz w miesiącu i utrzymywać procedurę korekty błędów. Po czwarte: mieć co najmniej 1000 aktywnych miesięcznie użytkowników lub subskrybentów w stanie Nowy Jork.

Ten ostatni próg jest celowo niski – obejmuje nie tylko gigantów medialnych, ale też małe lokalne blogi czy niszowe serwisy. Autorzy ustawy, członek Zgromadzenia Otis oraz współsponsor Alex Bores, najwyraźniej chcieli chronić długi ogon wydawców, którzy najbardziej odczuwają presję masowego skanowania bez zgody.

Co więcej, wydawcy zyskują prawo do składania wniosków o przedprocesową subpoenę wobec dostawców usług (np. hostingodawców) w celu identyfikacji anonimowych naruszycieli. To oznacza, że nie muszą czekać na działania rządowe – sami mogą wszcząć procedurę ustalenia tożsamości ukrytego bota.

Dlaczego to prawo powstało w tym momencie?

Nowojorska ustawa nie pojawiła się w próżni. Od 2023 roku relacje między firmami AI a wydawcami prasy stają się coraz bardziej napięte. Dane z PPC Land pokazują, że w sierpniu 2024 roku aż 35,7% z tysiąca największych stron internetowych blokowało bota GPTBota od OpenAI – to siedmiokrotny wzrost w porównaniu z debiutem w 2023 roku. Problem polega na tym, że techniczne blokady (robots.txt) są dobrowolne i wiele botów je ignoruje bez żadnych konsekwencji.

Badania z stycznia 2026 roku udokumentowały agresywne taktyki stosowane przez skanery AI: podszywanie się pod ludzi, rotację dziesiątek adresów IP, wykonywanie setek równoległych żądań. Jedno zapytanie do modelu Grok wywołało aż 16 żądań z 12 różnych IP, udających ludzką przeglądarkę. Jak ujęli to analitycy, doszło do upadku „gentleman’s agreement” – nieformalnej umowy, że „grzeczne” boty się ujawniają.

Z kolei badanie z 2025 roku wykazało, że wydawcy blokujący boty tracili średnio 7% tygodniowego ruchu w ciągu sześciu tygodni. Paradoksalnie AI może też generować ruch zwrotny do źródeł – ostre blokady niosą realne straty finansowe. Nowojorska ustawa proponuje trzecie wyjście: zamiast blokować lub płacić, wymaga transparentności. Dopiero po ujawnieniu się bota wydawca może negocjować warunki licencji lub żądać usunięcia treści.

Co oznacza obowiązek ujawnienia „wszystkich zastosowań”?

To najbardziej nowatorski i jednocześnie najbardziej kontrowersyjny element ustawy. Operator skanera musi przewidzieć i wymienić każde możliwe użycie pozyskanych danych – nie tylko te bieżące, ale i przyszłe. W praktyce firma zbierająca artykuły do trenowania modelu językowego musi to wyraźnie zaznaczyć, a także wskazać, jeśli te same dane posłużą później do generowania odpowiedzi w czacie, analizy trendów czy monetyzacji poprzez reklamy.

Ustawa nie precyzuje, gdzie i w jakiej formie takie oświadczenie ma być złożone – mówi jedynie o „formacie dostępnym dla wydawcy”. To celowa nieostrość, która może prowadzić do sporów i konieczności uzupełniających regulacji. Dla firm AI oznacza to konieczność gruntownego audytu swoich crawlerów i przygotowania infrastruktury do dynamicznego generowania deklaracji celów – w terminie zaledwie 90 dni od ewentualnego podpisania ustawy.

Eksperci zwracają uwagę, że wymóg ten może być kwestionowany na drodze sądowej jako nieproporcjonalny lub niejasny. Jednak klauzula separowalności w ustawie chroni pozostałe przepisy przed unieważnieniem – nawet jeśli wymóg „wszystkich zastosowań” padnie, reszta regulacji pozostaje w mocy.

Jakie są szersze konsekwencje dla rynku AI?

Nowojorska ustawa to jeden z elementów szerszej układanki. Na poziomie federalnym Biały Dom w marcu 2026 roku opublikował ramy polityki AI, wzywając Kongres do wyprzedzenia regulacji stanowych. Równolegle Kongres pracuje nad ustawą TRAIN, która dałaby posiadaczom praw autorskich prawo do żądania informacji o tym, czy ich utwory znajdują się w zbiorach treningowych AI. Kalifornia już w 2025 roku wprowadziła obowiązek informowania użytkowników o interakcji z systemem AI.

Jeśli gubernator Hochul podpisze ustawę, Nowy Jork stanie się wzorem dla innych stanów. Mechanizm transparentności – a nie blokady czy opłaty – może okazać się bardziej skutecznym narzędziem niż dotychczasowe rozwiązania. Firmy AI będą musiały dostosować swoje crawlowanie nie tylko do wymogów technicznych, ale też do nowych obowiązków prawnych. Dla polskich obserwatorów to sygnał, że walka o kontrolę nad danymi publikacji prasowych wkracza w nową fazę – regulacyjną, a nie tylko techniczną.

Niezależnie od losów konkretnej ustawy, jedno jest pewne: czasy anonimowego zbierania treści bez zgody wydawców dobiegają końca. Pytanie tylko, czy inne jurysdykcje pójdą śladem Nowego Jorku, czy wybiorą własną ścieżkę – i jak szybko firmy AI nauczą się działać w nowej rzeczywistości pełnej jawności.