Artystka oskarża sztuczną inteligencję. Mówi o złamaniu prawa autorskiego
Artystka komediowa Sarah Silverman wspierana przez dwóch innych autorów wnosi pozew o naruszenie praw autorskich przeciwko firmom Meta Platforms oraz OpenAI. Stworzone przez nich dzieła miały rzekomo zostać wykorzystane bez zgody do szkolenia sztucznych inteligencji tworzących modele językowe.
Zarzuty zamieszczone w pozwie sugerują, że ChatGPT firmy OpenAI oraz LLaMA firmy Meta były szkolone na nielegalnie pozyskanych zbiorach danych zawierających książki, które (zdaniem powodów) zostały pozyskane z pirackich stron internetowych takich jak Bibliotik, Library Genesis, Z-Library i innych. Książki te są dostępne masowo za pośrednictwem systemów torrentowych.
Pozew zbiorowy złożono w federalnym sądzie w San Francisco w piątek. Oprócz Silverman, wymieniono dwóch innych poszkodowanych autorów - Richarda Kadreya i Christophera Goldena. Jednak z informacji pozyskanych przez The Verge wynika, że krzywda spotkała tysiące twórców.
W pozwie przeciwko OpenAI trio przedstawia materiały dowodzące, że po uzyskaniu odpowiedniego polecenia, ChatGPT streszcza ich książki, naruszając prawa autorskie.
W odrębnej skardze przeciwko Meta Platforms, zarzuca się, że książki autorów były dostępne w zestawach danych, z których Meta korzystała do szkolenia swoich modeli LLaMA, czterech modeli AI udostępnionych przez firmę w lutym.
W pozwie szczegółowo wyjaśnia się, dlaczego powodowie uważają, że zbiory danych mają nielegalne pochodzenie. W publikacji Meta opisującej LLaMA, firma wskazuje źródła swoich zestawów danych szkoleniowych - jednym z nich jest ThePile, który został opracowany przez firmę o nazwie EleutherAI. Pozew zauważa, że ThePile został opisany w publikacji EleutherAI jako zbiór danych "skopiowany z zawartości prywatnego tracker'a Bibliotik". Bibliotik i pozostałe wymienione pirackie biblioteki, jak stwierdzono w pozwie, łamie prawo "w sposób rażący".
Autorzy stoją na stanowisku, że nie wyrazili zgody na wykorzystanie swoich prawami autorskimi chronionych książek jako materiału szkoleniowego dla modeli AI. Ich pozwy obejmują sześć zarzutów różnego rodzaju naruszeń praw autorskich, zaniedbań, nieuzasadnionego wzbogacenia się i nieuczciwej konkurencji. Nie wymieniono jednak, jaka jest wysokość odszkodowań, których poszkodowani domagają się od firm IT.
Adwokaci Joseph Saveri i Matthew Butterick, którzy reprezentują trzech autorów, twierdzą natomiast, że otrzymali informacje od wielu pisarzy, autorów i wydawców, którzy obawiają się zdolności ChatGPT do generowania tekstów podobnych do tych znajdujących się w chronionych prawami autorskimi materiałach tekstowych, w tym tysiącach książek.
Saveri wniósł odrębną sprawę przeciwko firmom zajmującym się AI w imieniu programistów i artystów. Firma Getty Images złożyła z kolei pozew dotyczący AI, zarzucając, że Stability AI, twórca narzędzia do generowania obrazów Stable Diffusion, szkolił swój model na milionach obrazów chronionych prawami autorskimi. Saveri i Butterick reprezentują wreszcie dwoje autorów - Monę Awad i Paula Tremblaya - w podobnej sprawie dotyczącej chatbota firmy.
Krzysztof Maciejewski