Skandal w świecie AI: Perplexity oskarżone o naruszenie praw autorskich

Ostatnie doniesienia rzucają nowe światło na praktyki zbierania danych przez Perplexity AI, wywołując burzę w świecie technologii.Wygląda na to, że Perplexity AI, twórca innowacyjnego „silnika odpowiedzi” łączącego wyszukiwarkę z generatywną sztuczną inteligencją, znalazł się w ogniu krytyki. Firma oskarżana jest o nielegalne skrobanie treści z wielu stron internetowych, które wyraźnie tego zabraniają. Afera wybuchła 11 czerwca, kiedy to Forbes doniósł, że Perplexity bezczelnie skopiowało cały artykuł z ich strony, włącznie z autorskimi ilustracjami, i użyło go z minimalnym odniesieniem do źródła.

Niebawem po tym, WIRED przeprowadziło własne śledztwo, które ujawniło dowody na to, że Perplexity skrobie treści ze stron internetowych, które za pomocą pliku „robots.txt” zabraniają takich działań. Plik „robots.txt” to prosty tekstowy plik umieszczony na serwerze strony, który określa, które strony lub sekcje witryny nie powinny być dostępne lub skrobane przez automatyczne narzędzia. Choć nie jest to wiążące prawnie, od dawna uznaje się za najlepszą praktykę, aby web crawlery przestrzegały instrukcji zawartych w pliku robots.txt danej witryny.

Wśród kluczowych punktów skandalu znajdujemy zarzuty Forbes o całkowite skopiowanie jednego z ich artykułów bez odpowiedniego przypisania oraz odkrycia WIRED, które wskazują, że Perplexity skrobie strony, które wyraźnie tego zabraniają. Inni wydawcy również wyrażają obawy, że takie nieautoryzowane skrobanie zagraża ich własności intelektualnej.

Jason Kint, CEO Digital Content Next, grupy handlowej reprezentującej wydawców online, nie owijał w bawełnę. „Domyślnie firmy AI powinny zakładać, że nie mają prawa do korzystania i ponownego wykorzystywania treści wydawców bez ich zgody,” stwierdził. „Jeśli Perplexity omija warunki korzystania z usługi lub pliki robots.txt, powinny zapalić się czerwone alarmy, że dzieje się coś nieodpowiedniego.”

Te rewelacje skłoniły teraz Amazon Web Services (AWS), które hostuje serwer zamieszany w domniemane nieprawidłowe skrobanie przez Perplexity, do rozpoczęcia śledztwa. AWS stanowczo zabrania klientom angażowania się w działania abuzywne lub nielegalne naruszające jego warunki usług.

CEO Perplexity, Aravind Srinivas, początkowo zbagatelizował obawy, twierdząc, że odzwierciedlają one „głębokie i fundamentalne nieporozumienie” dotyczące działalności firmy i internetu jako takiego. Jednak w kolejnym wywiadzie dla Fast Company przyznał, że Perplexity polega na nieujawnionym dostawcy stron trzecich do przeszukiwania sieci i indeksowania, sugerując, że to oni mogli być odpowiedzialni za naruszenia plików robots.txt.

Na razie wydaje się, że Perplexity jest zdeterminowane, aby przetrwać ten sztorm, a rzecznik firmy bagatelizuje dochodzenie AWS jako „standardową procedurę” i wskazuje, że firma nie wprowadziła żadnych zmian w swojej działalności. Jednakże, ta wyzywająca postawa może okazać się nie do utrzymania, ponieważ narastające obawy dotyczące praktyk zbierania danych przez AI nadal rosną.

Źródło