Nauka
Zjawiska astronomiczne w 2025. Będzie można zobaczyć je gołym okiem
03 stycznia 2025
Zdaniem autorów pozwu przeciwko spółce Alphabet, która jest właścicielem Google’a, wyszukiwarka „kradnie wszystko, co zostało udostępnione w internecie”. Dane mają służyć treningowi sztucznej inteligencji (AI).
Sprawę rozpatrzy sąd okręgowy w Północnej Kalifornii. Google ma pobierać pliki bez wiedzy i zgody osób, które je udostępniają. Kancelaria Clarkson Law Firm niedawno złożyła podobny pozew przeciwko firmie OpenAI, która opracowała ChatGPT.
„Google przez lata w tajemnicy kradł wszystkie nasze dane osobowe i zawodowe, prace twórcze, zdjęcia i nawet e-maile”
– czytamy w uzasadnieniu oskarżycieli.
Informacje miały pochodzić z prywatnych stron internetowych oraz pirackich serwisów, które udostępniały m.in. książki i filmy.
Skarga nawiązuje również do aktualizacji polityki prywatności Google’a, która nastąpiła pierwszego lipca. W swoim regulaminie firma zastrzega teraz, że może gromadzić informacje, które są „publicznie dostępne online”, aby trenować modele sztucznej inteligencji i doskonalić produkty, takie jak Google Translate, chatbot Bard i Cloud AI.
„Spółka Alphabet musi raz na zawsze zrozumieć, że internet nie jest jej własnością i nie ma praw do naszej twórczości, ani udostępnianych zdjęć”
– czytamy w pozwie.
Wnioskodawcy przekonują, że Google powinien płacić za dostęp do publicznych zbiorów danych.
Firma uznaje roszczenia za „bezpodstawne”. Główny radca prawny Google, Halimah DeLaine Prado, przekonuje, że polityka gromadzenia danych przez wyszukiwarkę „była jasna od lat”.
„Amerykańskie prawo wspiera opracowywanie informacji publicznych. Dzięki temu poprawiamy jakość naszych usług. Nie możemy się doczekać obalenia tych bezpodstawnych zarzutów”
– mówi DeLaine Prado.
Pozew trafił do sądu dwa tygodnie po tym, jak prawnicy z Clarksona złożyli podobną skargę przeciwko OpenAI. Ich zdaniem firma ukradła „ogromne ilości danych osobowych” (w tym dokumentacji medycznej) i szkoliła na nich ChatGPT.
W obu pozwach powodowie zostali zidentyfikowani jedynie na podstawie inicjałów i zawodów. Według prawników miało na celu „uniknięcie natrętnej kontroli” ze strony dostawców usług internetowych.
Jedna z wnioskodawczyń oznaczona inicjałami „J.L.” i opisana jako najlepiej sprzedająca się autorka „New York Timesa”, twierdzi, że Google ukradł plik z jej książką i szkolił na nim Barda. Teraz chatbot za darmo streszcza i udostępnia fragmenty publikacji.
Podobne pozwy złożyli niedawno satyryczka i pisarka Sarah Silverman, a także autorzy Christopher Golden i Richard Kadrey. Twierdzą oni, że szkolenia ChatGPT firmy OpenAI i LLaMA firmy Meta odbywały się na nielegalnie pozyskanych zbiorach danych, zawierających ich publikacje. Według powodów książki zostały pozyskane ze stron internetowych tzw. ukrytych bibliotek, takich jak Bibliotik, Library Genesis, Z-Library i innych.
Dowiedz się więcej:
Wnioskodawcy twierdzą, że po wpisaniu odpowiedniej podpowiedzi, ChatGPT streszcza ich książki. Jako przykład podano „Bedwetter” Silverman, a także „Golden Ararat” i „Sandman Slim” autorstwa Goldena i Kadreya. W pozwie zaznaczono, że programiści nie podjęli wysiłku, aby chatbot „uwzględnił jakiekolwiek informacje dotyczące zarządzania prawami autorskimi”.
Mecie zarzuca się, że książki autorów były umieszczane w zbiorach danych używanych przez firmę do trenowania modeli LLaMA. Są to cztery otwartoźródłowe modele sztucznej inteligencji, które wprowadzono w lutym tego roku. Miały się one szkolić na publikacjach pozyskanych z ukrytych bibliotek.
Getty Images również wniósł pozew w podobnej sprawie. Firma twierdzi, że Stability AI, która opracowała narzędzie do generowania obrazów, szkoliła swój model na milionach zdjęć chronionych prawem autorskim.
Amerykański Sąd Najwyższy oddalił niedawno pozew, w którym zarzucono Google’owi, że w wynikach wyszukiwania bezprawnie publikuje teksty piosenek.
Skargę wniosła firma z branży muzycznej Genius Media Group. Na jej stronach można publikować autorskie utwory (piosenki, poezję), ich interpretacje i przypisy.
Zdaniem Geniusa, Google powinien płacić za wyświetlanie tekstów w wynikach wyszukiwania. Amerykański Sąd Najwyższy nie zgodził się z tą opinią. Orzeczenie zapadło 26 czerwca.
Zobacz też:
Prawa autorskie i ochrona danych w internecie to skomplikowany problem, nad którym od lat debatują eksperci. Możemy spodziewać się, że niedługo powstaną nowe pozwy i będą zapadać kolejne orzeczenia.
Sztuczna inteligencja operuje na wielkich zbiorach danych. Powstaje pytanie: skąd je pozyskiwać? Każdego dnia w sieci pojawiają się miliony tekstów, fotografii i nagrań, które są dostępne publicznie. Na zasobach tych uczą się algorytmy AI. Czy to jednak etyczne, aby produkty i usługi wielkich korporacji bazowały na czyjejś twórczości i to bez zgody tej osoby?
Nagła zmiana zasad polityki prywatności przez Google’a pokazuje, że giganci internetowizdają sobie sprawę z problemu. Może też być dowodem na to, że obawiają się pozwów i tego, w jaki sposób oraz skąd pobierają dane do szkolenia AI.
Wiele pytań pozostaje otwartych. Głos zabierać będą teraz sądy i media, co zwiększy świadomość problemu w społeczeństwie.
Więcej interesujących informacji znajdziesz na stronie holistic.news.
Zobacz też:
Źródła: CNN, Business Insider