Wojna o dane w erze AI nabiera rumieńców. Najnowszy pozew The New York Times przeciwko Perplexity to nie tylko kolejna batalia prawna, to sygnal prawdziwej rewolucji w walce o wartość dziennikarstwa w świecie, gdzie algorytmy domagają się darmowego paliwa. Czy startupy AI w końcu zapłacą za kradzież treści, czy też obrona „dozwolonego użytku” (fair use) okaże się zbyt silną tarczą?

Czy Perplexity traktuje treści jak darmową spiżarnię dla AI? Pozew NYT wchodzi do gry
Wielka medialna machina ruszyła z zębem. The New York Times, filar amerykańskiego dziennikarstwa, złożył w piątek pozew przeciwko startupowi AI do wyszukiwania informacji, Perplexity, zarzucając mu naruszenie praw autorskich. Co ciekawe, nie jest to pierwsza taka akcja – dołączyły do niego już inne redakcje, w tym Chicago Tribune, co sugeruje, że to nie odosobniony przypadek, ale skoordynowana strategia branży.
Sprawa jest fundamentalna: The Times twierdzi, że Perplexity dostarcza komercyjne produkty, które są bezpośrednim substytutem dla ich własnych treści, serwując je użytkownikom „bez zgody i wynagrodzenia”. Ten ruch procesowy, choć następuje w czasie, gdy część wydawców negocjuje już umowy licencyjne z gigantami AI, jest wyraźną próbą wymuszenia formalnego uznania wartości oryginalnego dziennikarstwa. Wydawcy rozumieją, że AI nadchodzi i zamiast machać szabelką, używają sądów jako potężnego narzędzia negocjacyjnego.
Graham James, rzecznik The Times, nie owijał w bawełnę: „Podczas gdy wierzymy w etyczne i odpowiedzialne wykorzystanie oraz rozwój AI, stanowczo sprzeciwiamy się nieautoryzowanemu wykorzystywaniu naszych treści przez Perplexity do rozwijania i promowania ich produktów. Będziemy nadal dążyć do pociągnięcia do odpowiedzialności firm, które odmawiają uznania wartości naszej pracy”. To mocny statement w debacie o przyszłości modeli językowych.
RAG, kradzież i naruszenie paywalla – sedno sporu
Sedno sporu, podobnie jak w przypadku pozwu Tribune, dotyczy metody generowania odpowiedzi przez Perplexity, czyli Retrieval-Augmented Generation (RAG). Ta technologia pozwala chatbotom i asystentom (jak Comet AI browser) na zbieranie danych z Internetu i bazie danych, a następnie syntetyzowanie odpowiedzi. Niestety dla wydawców, proces ten bywa nadmiernie dosłowny.
Jak czytamy w pozwie: „Perplexity następnie przepakowuje oryginalne treści w formie pisemnych odpowiedzi dla użytkowników. Te odpowiedzi, lub wyniki, często są dosłownymi lub niemal dosłownymi reprodukcjami, streszczeniami lub skrótami oryginalnych treści, w tym chronionych prawem autorskim dzieł The Times”.
Przekładając to na język mniej prawniczy: systemy RAG potrafią „zassysać” treści, bywają zaawansowanymi maszynami do kradzieży. Jak ujął to James: „RAG pozwala Perplexity na indeksowanie Internetu i kradzież treści za naszym paywallem, dostarczając je klientom w czasie rzeczywistym. Te treści powinny być dostępne wyłącznie dla naszych płacących subskrybentów”. To jest sedno tarcia ekonomicznego – dlaczego ktoś miałby płacić za subskrypcję, skoro darmowy (lub tańszy) asystent AI dostarcza mu tę samą wiedzę?
Dodatkowo, The Times wskazuje na szkody wizerunkowe. Twierdzą, że wyszukiwarka Perplexity ma tendencję do „halucynowania” informacji i fałszywego przypisywania ich do gazety, co niszczy reputację marki.
Czy AI nauczy się płacić za lekcje? Strategia nacisku przez pozwy
Warto zauważyć, że The Times nie tylko pozywa, ale także negocjuje. To klasyczna taktyka — użyj potęgi sądu, aby wywalczyć lepsze warunki przy stole rozmów. Media widzą, że AI to fala, której nie zatrzymają, ale chcą, by ta fala niosła ze sobą rekompensatę finansową, zapewniając przyszłość oryginalnej, rzetelnej pracy dziennikarskiej.
Wcześniej The Times wysłał do Perplexity list ostrzegawczy (cease and desist) przeszło rok temu, domagając się zaprzestania używania ich treści do podsumowań, jeśli warunki licencyjne nie zostaną wypracowane. W ciągu ostatnich 18 miesięcy podejmowano wielokrotne próby mediacji.
Perplexity stara się łagodzić nastroje, oferując rozwiązania. Uruchomili program dla wydawców, który oferuje np. podział przychodów z reklam. Pojawiła się też opcja Comet Plus, gdzie 80% miesięcznej opłaty trafia do współpracujących wydawców. Ponadto, startup podpisał niedawno umowę licencyjną z Getty Images. Jednak dla czołowych wydawnictw, takich jak The Times, te propozycje mogą być postrzegane jako za małe lub niewystarczające.
To nie jest odosobniona walka The Times. Są już w sporze z OpenAI i Microsoftem, twierdząc, że ich modele szkolono na milionach artykułów bez wynagrodzenia. W tej sprawie OpenAI broniło się argumentem „dozwolonego użytku” (fair use) dla danych szkoleniowych, a nawet oskarżało The Times o manipulowanie ChatGPT, by uzyskać dowody!
Choć sprawa z OpenAI wciąż się toczy, precedens może zostać ustanowiony przez nierozstrzygnięty pozew przeciwko Anthropic. Tam sąd orzekł, że choć użycie legalnie pozyskanych książek do trenowania AI może być uznane za dozwolony użytek, to przypadku materiałów kradzionych – co stanowi naruszenie praw autorskich. Ostatecznie Anthropic zgodził się na ugodę opiewającą na 1,5 miliarda dolarów. Czy ta gigantyczna kwota nie jest kuszącym celem dla kolejnych pozwów przeciwko Perplexity?
Na Perplexity ciąży coraz większa presja. Wcześniej podobne roszczenia wysunęły News Corp (wydawca m.in. Wall Street Journal), Encyclopedia Britannica, Merriam-Webster, a także Reddit. Co więcej, inne serwisy, jak Wired i Forbes, oskarżały Perplexity o jawny plagiat i nieetyczne „web scrapingowanie” stron, nawet tych, które wyraźnie zablokowały dostęp dla botów AI — co niedawno potwierdził dostawca infrastruktury internetowej, Cloudflare.
The Times żąda od sądów nie tylko finansowego zadośćuczynienia za poniesione szkody, ale także sądowego zakazu dalszego wykorzystywania ich treści. Jednocześnie, Nowy Jork nie jest obcy zawieraniu układów – niedawno podpisali wieloletnią umowę licencyjną z Amazonem, aby udostępnić swoje treści do trenowania ich modeli AI. W tym samym czasie OpenAI również zabezpiecza treści, podpisując umowy z Associated Press, Axel Springer czy Vox Media. Pytanie brzmi, która wizja – licencjonowanie za opłatą czy sądowe zmuszanie do płacenia – zdominuje krajobraz mediów cyfrowych?