Anthropic właśnie postawił kolejny krok w stronę samodzielnych agentów AI. Po miesiącach pracy nad integracją Claude’a z kalendarzami, dokumentami i innymi narzędziami, firma wpuściła swojego asystenta… prosto do przeglądarki. A konkretnie – do Chrome.
Dlaczego to takie ważne? Bo większość naszej pracy, zakupów i rozrywki dzieje się właśnie w oknie przeglądarki. Jeśli AI umie już pisać mejle i porządkować raporty, to naturalnym kolejnym etapem jest to, że zacznie też klikać linki, wypełniać formularze i – tak, to nie żart – kasować niechciane maile. Problem w tym, że nie zawsze tylko te niechciane.
Potęga i niebezpieczeństwo jednocześnie
Anthropic nie kryje, że wprowadzenie „Claude for Chrome” to nie tylko ekscytacja, ale też spory ból głowy. Bo jeśli AI widzi to samo, co my na ekranie, i może wykonywać akcje, to otwieramy drzwi dla całej plejady ataków. Najpoważniejsze zagrożenie? Prompt injection, czyli sytuacja, w której sprytnie ukryte instrukcje w mailu czy na stronie każą AI zrobić coś, czego użytkownik wcale nie chciał.
Firma przeprowadziła testy na 123 scenariuszach ataków i wyniki – delikatnie mówiąc – nie napawają optymizmem. Bez zabezpieczeń aż 23,6% prób zakończyło się sukcesem atakującego. Jeden z przykładów? E-mail, który przekonywał Claude’a, że w ramach „zabezpieczeń” należy usunąć wszystkie wiadomości. I Claude, jak posłuszny urzędnik z czasów PRL-u, wykonał polecenie bez mrugnięcia okiem.
Pierwsze tarcze obronne
Na szczęście to nie koniec historii. Anthropic wprowadził kilka kluczowych zabezpieczeń. Po pierwsze – użytkownik decyduje, do jakich stron Claude ma dostęp, a po drugie – AI musi pytać o potwierdzenie przy podejmowaniu ryzykownych działań, takich jak publikowanie treści czy zakup online.
Do tego dochodzą systemowe „nawyki” – czyli specjalne instrukcje, jak Claude ma traktować wrażliwe dane. Zablokowano także kategorie stron z podwyższonym ryzykiem, np. bankowość czy treści dla dorosłych (bo nikt nie chce, żeby AI samo zamówiło subskrypcję na „wątpliwych” portalach).
Efekt? Skuteczność ataków spadła niemal o połowę – do 11,2%. A w testach typowo przeglądarkowych, gdzie wcześniej wskaźnik sukcesu wynosił 35,7%, po zastosowaniu nowych tarcz udało się zejść do… zera.
Testy w realnym świecie
Tu jednak wracamy na ziemię. Nawet najlepsze testy w laboratorium nie odzwierciedlą tego, co spotyka użytkowników w sieci. Dlatego Anthropic uruchamia pilotaż – 1000 osób z planu Max dostanie dostęp do rozszerzenia Chrome, by sprawdzić Claude’a w prawdziwych warunkach.
Firma zachęca testerów, by korzystali głównie z zaufanych stron i nie wystawiali AI na pokusy związane z finansami czy medycyną. A co najważniejsze – żeby raportowali każdy problem. Bo w tym eksperymencie to właśnie użytkownicy mają stać się współtwórcami bezpieczeństwa.
Co dalej?
Anthropic nie ukrywa, że celem jest zbudowanie fundamentów pod nową erę „AI w przeglądarce”. Jeśli testy się powiodą, Claude stanie się nie tylko wirtualnym sekretarzem, ale i kimś w rodzaju stażysty online – będzie w stanie samodzielnie rezerwować spotkania, sprawdzać oferty czy testować strony.
Oczywiście, jak to zwykle bywa z nowymi technologiami, znajdą się też sceptycy. Ktoś powie: „Już dziś ciężko zaufać AI w generowaniu tekstów, a co dopiero dawać mu kartę kredytową do ręki”. Ale historia internetu pokazuje, że tam, gdzie pojawia się wygoda, użytkownicy szybko przymykają oko na ryzyka.
💡 Mój ulubiony szczegół? Ten pilot z Claude’em przypomina trochę pierwsze loty braci Wright – jeszcze nie wiadomo, czy maszyna poleci dalej niż kilkaset metrów, ale ekscytacja jest ogromna. Różnica tylko taka, że tutaj zamiast silników mamy kod i algorytmy, a zamiast ryzyka upadku – możliwość, że AI kliknie nie w ten przycisk, co trzeba.