Claude wchodzi do przeglądarki. Czy AI naprawdę kliknie za nas przycisk „Kup teraz”?
Bezpieczeństwo Wybór redakcji

Claude wchodzi do przeglądarki. Czy AI naprawdę kliknie za nas przycisk „Kup teraz”?

Anthropic właśnie postawił kolejny krok w stronę samodzielnych agentów AI. Po miesiącach pracy nad integracją Claude’a z kalendarzami, dokumentami i innymi narzędziami, firma wpuściła swojego asystenta… prosto do przeglądarki. A konkretnie – do Chrome.

Dlaczego to takie ważne? Bo większość naszej pracy, zakupów i rozrywki dzieje się właśnie w oknie przeglądarki. Jeśli AI umie już pisać mejle i porządkować raporty, to naturalnym kolejnym etapem jest to, że zacznie też klikać linki, wypełniać formularze i – tak, to nie żart – kasować niechciane maile. Problem w tym, że nie zawsze tylko te niechciane.

Potęga i niebezpieczeństwo jednocześnie

Anthropic nie kryje, że wprowadzenie „Claude for Chrome” to nie tylko ekscytacja, ale też spory ból głowy. Bo jeśli AI widzi to samo, co my na ekranie, i może wykonywać akcje, to otwieramy drzwi dla całej plejady ataków. Najpoważniejsze zagrożenie? Prompt injection, czyli sytuacja, w której sprytnie ukryte instrukcje w mailu czy na stronie każą AI zrobić coś, czego użytkownik wcale nie chciał.

Firma przeprowadziła testy na 123 scenariuszach ataków i wyniki – delikatnie mówiąc – nie napawają optymizmem. Bez zabezpieczeń aż 23,6% prób zakończyło się sukcesem atakującego. Jeden z przykładów? E-mail, który przekonywał Claude’a, że w ramach „zabezpieczeń” należy usunąć wszystkie wiadomości. I Claude, jak posłuszny urzędnik z czasów PRL-u, wykonał polecenie bez mrugnięcia okiem.

Pierwsze tarcze obronne

Na szczęście to nie koniec historii. Anthropic wprowadził kilka kluczowych zabezpieczeń. Po pierwsze – użytkownik decyduje, do jakich stron Claude ma dostęp, a po drugie – AI musi pytać o potwierdzenie przy podejmowaniu ryzykownych działań, takich jak publikowanie treści czy zakup online.

Do tego dochodzą systemowe „nawyki” – czyli specjalne instrukcje, jak Claude ma traktować wrażliwe dane. Zablokowano także kategorie stron z podwyższonym ryzykiem, np. bankowość czy treści dla dorosłych (bo nikt nie chce, żeby AI samo zamówiło subskrypcję na „wątpliwych” portalach).

Efekt? Skuteczność ataków spadła niemal o połowę – do 11,2%. A w testach typowo przeglądarkowych, gdzie wcześniej wskaźnik sukcesu wynosił 35,7%, po zastosowaniu nowych tarcz udało się zejść do… zera.

Testy w realnym świecie

Tu jednak wracamy na ziemię. Nawet najlepsze testy w laboratorium nie odzwierciedlą tego, co spotyka użytkowników w sieci. Dlatego Anthropic uruchamia pilotaż – 1000 osób z planu Max dostanie dostęp do rozszerzenia Chrome, by sprawdzić Claude’a w prawdziwych warunkach.

Firma zachęca testerów, by korzystali głównie z zaufanych stron i nie wystawiali AI na pokusy związane z finansami czy medycyną. A co najważniejsze – żeby raportowali każdy problem. Bo w tym eksperymencie to właśnie użytkownicy mają stać się współtwórcami bezpieczeństwa.

Co dalej?

Anthropic nie ukrywa, że celem jest zbudowanie fundamentów pod nową erę „AI w przeglądarce”. Jeśli testy się powiodą, Claude stanie się nie tylko wirtualnym sekretarzem, ale i kimś w rodzaju stażysty online – będzie w stanie samodzielnie rezerwować spotkania, sprawdzać oferty czy testować strony.

Oczywiście, jak to zwykle bywa z nowymi technologiami, znajdą się też sceptycy. Ktoś powie: „Już dziś ciężko zaufać AI w generowaniu tekstów, a co dopiero dawać mu kartę kredytową do ręki”. Ale historia internetu pokazuje, że tam, gdzie pojawia się wygoda, użytkownicy szybko przymykają oko na ryzyka.

💡 Mój ulubiony szczegół? Ten pilot z Claude’em przypomina trochę pierwsze loty braci Wright – jeszcze nie wiadomo, czy maszyna poleci dalej niż kilkaset metrów, ale ekscytacja jest ogromna. Różnica tylko taka, że tutaj zamiast silników mamy kod i algorytmy, a zamiast ryzyka upadku – możliwość, że AI kliknie nie w ten przycisk, co trzeba.