Generative AI & Copyright

Poniżej znajduje się podsumowanie projektu raportu „Generative AI & Copyright”, opracowanego na zlecenie Komisji Prawnej Parlamentu Europejskiego (JURI) z czerwca 2025 r. Dokument ten stanowi kompleksową analizę skutków rozwoju generatywnej sztucznej inteligencji dla prawa autorskiego Unii Europejskiej. Autorzy raportu poddają krytycznej ocenie obowiązujące ramy regulacyjne – w szczególności dyrektywę 2019/790 (CDSM) – wskazując na ich całkowitą nieprzystawalność do wyzwań wynikających z masowego i komercyjnego wykorzystania utworów chronionych w procesie trenowania modeli genAI. Poniższe podsumowanie koncentruje się na kluczowych tezach raportu, jego wnioskach normatywnych oraz postulatach.

Opracowanie wskazuje jednoznacznie wskazuje, że kluczowa dla uzasadnienia korzystania z cudzych utworów dyrektywa 2019/790 (CDSM) nie została zaprojektowana z myślą o skali, złożoności i technologicznej specyfice systemów genAI („The TDM exceptions were enacted before the emergence of generative AI and may not cover all aspects of AI model development and operation”, s. 24). Wedle autorów raportu modele AI są trenowane na ogromnych zbiorach danych, często zawierających utwory chronione prawem autorskim, przy czym trenowanie odbywa się co do zasady bez wiedzy, zgody podmiotów uprawnionych, nie mówiąc już o ich wynagrodzeniu („(…) frequently without rightsholder consent or compensation”, s. 11). W przypadku trenowania modeli AI mamy do czynienia nie tylko z sytuacją, w której twórcy są wykluczani z kręgu podmiotów korzystających z technologii generatywnej AI, ponieważ to właśnie treści generowane przez AI, powstające na podstawie ich utworów, wypierają ich z rynku. Ledwie kilkanaście miesięcy obecności w publicznym użyciu tego rodzaju narzędzi doprowadziło już wiele kreatywnych profesji na skraj istnienia („ AI-generated outputs resulting from automated processing raise significant economic challenges: they introduce market displacement risks, undermine traditional licensing structures, and risk concentrating value in the hands of a few dominant platforms, thereby destabilising incentives for professional creators, s. 22).

Z technicznego punktu widzenia trenowanie genAI wymaga uprzedniego skopiowania i przetworzenia oryginalnych utworów (tekstów literackich, obrazów, nagrań dźwiękowych), co autorzy uznają za formę zwielokrotnienia w rozumieniu prawa autorskiego („AI training entails systematic reproduction of protected works […] raising clear copyright concerns under EU and international law”, s. 29). W przekonaniu autorów modele AI nie ograniczają się wyłącznie do informacyjnej zawartości przetwarzanych danych (knowledge discovery). Wskazuje się, że już po etapie trenowania dochodzi do zakodowania w modelach AI treści utworów („(…) encode and simulate the expressive dimensions of creative works […] They internalise and model stylistic and structural elements”, s. 43). Tym samym sposób trenowania modeli AI daleko wykracza poza ramy analizy danych (TDM) na etapie trenowania. Wedle autorów wkracza on w sferę ekspresji utworu, która stanowi rdzeń ochrony prawa autorskiego. Ten wniosek jest szczególnie ważny: autorzy uznają wyjątek komercyjnej eksploracji tekstów i danych (art. 4 dyrektywy CDSM) za niewystarczającą podstawę do trenowania modeli AI („Article 4 of the CDSM Directive was never designed for the ingestion and recombination of expressive content at scale”, s. 117). Wyjątek TDM może obejmować obejmuje typowe zastosowania badawcze, lecz nie powinien dotyczyć praktyk komercyjnego wykorzystania utworów w celach ich syntetycznego odwzorowywania. Autorzy jednoznacznie krytykują próbę rozszerzającej wykładni tego wyjątku, podkreślając dewastujące dla sektora kreatywnego skutki bezumownego korzystania z zasobów cudzych utworów („Generative AI training fails each step of the [InfoSoc] three-step test: it is industrial in scale; it substitutes for normal exploitation; and it undermines rightsholders’ legitimate interests”, s. 43).

Autorzy raportu zajmują stanowisko także wobec mechanizmu opt-out, stanowiącego warunek zastosowania wyjątku z art. 4 CDSM. Jego skuteczność została osłabiona przez brak wypracowania wspólnego standardu technicznego i trudności w egzekwowaniu sprzeciwu wobec przetwarzania utworów („Existing opt-out tools like metadata or robots.txt are ineffective for large-scale web scraping and training corpora construction”, s. 11). W praktyce, jak stwierdza raport, system facto zawodzi obie strony – deweloperzy nie mają pewności prawnej, a twórcy nie mają kontroli nad swoją twórczością” („In practice, the current legal framework risks failing both sides: developers lack clarity, and rightsholders lack effective control”, s. 36).

W konsekwencji raport formułuje tezę o istnieniu systemowej „luki wartości” (value gap), czyli sytuacji, w której ogromna wartość ekonomiczna generowana przez modele AI na podstawie cudzej twórczości nie staje się w żaden sposób udziałem twórców lub podmiotów uprawnionych („There is no remuneration mechanism for authors whose works are used in training—deepening the ‘value gap”, s. 29; „(…) the economic benefits generated by AI training are not currently accompanied by clear mechanisms for compensating rightsholders”, s. 8). Brak wynagrodzenia wysiłku autorów oraz podmiotów uprawnionych (rightsholders) uderza tymczasem w zasadniczy cel prawa autorskiego jako systemu wspierania twórczości („This undermines the incentive structure on which copyright is based”, s. 8).

W ramach proponowanych zmian autorzy proponują stworzenie dedykowanej jednostki „AI & Copyright Unit” w strukturze EU AI Office, odpowiedzialnej za kontrolę zgodności, audyty zbiorów treningowych i egzekwowanie od dostawców narzędzi AI obowiązków sprawozdawczych (s. 9). Z technicznego punktu widzenia rekomenduje się także stosowanie narzędzi takich jak watermarking i fingerprinting dla zapewnienia identyfikowalności treści objętych ochroną.

Na koniec autorzy formułują ostrzeżenie, że brak systemowej reformy zagrozi przede wszystkim dalszym pogłębieniem koncentracji na rynku podmiotów dysponujących technologią generatywnej AI oraz dalszą marginalizacją zawodów twórczych („Without timely reform, the EU risks legal uncertainty, market concentration, and cultural homogenisation”, s. 7).

Pełny raport ma się ukazać wkrótce. Natomiast TUTAJ znajdziecie interesujące materiały z workshopu Generative AI & Copyright.