Google próbuje „podsłuchać” delfiny. Nowy model AI ma odkodować ich język
Natura Wybór redakcji

Google próbuje „podsłuchać” delfiny. Nowy model AI ma odkodować ich język

Kliknięcia, gwizdy i pulsujące dźwięki rozchodzące się w morskich głębinach od dawna są dla naukowców tym, czym hieroglify były dla Champolliona – fascynujące, ale niezrozumiałe. Teraz Google twierdzi, że ma klucz do tej zagadki. Przedstawiamy DolphinGemma – sztuczną inteligencję, która ma pomóc rozszyfrować język delfinów.

Model AI, opracowany we współpracy z Georgia Institute of Technology i oparty na dekadach badań prowadzonych przez Wild Dolphin Project (WDP), został zaprezentowany tuż przed amerykańskim National Dolphin Day. Przypadek? Nie sądzę.

Delfini język, czyli kliknij i gwizdnij, jeśli mnie słyszysz

DolphinGemma została stworzona, by zrozumieć strukturę dźwięków wydawanych przez delfiny. I nie chodzi tu o losowe piski – badacze z WDP przez niemal 40 lat rejestrowali „rozmowy” tych morskich ssaków, tworząc największe archiwum tego typu na świecie. Dzięki niemu udało się zidentyfikować m.in.:

  • „Sygnaturowe” gwizdy – coś w stylu imion, pozwalających delfinom odnaleźć się nawzajem, np. gdy matka woła swoje młode.
  • Krzykliwe impulsy – pojawiają się najczęściej w sytuacjach konfliktowych, trochę jak nasze podniesione głosy przy rodzinnym stole.
  • Klikające „brzęczenia” – często towarzyszą flirtowi albo… pogoni za rekinem. Bo kto powiedział, że życie delfina jest nudne?

DolphinGemma analizuje te sekwencje za pomocą specjalnego tokenizera dźwięku (SoundStream), który pozwala „zrozumieć” strukturę i przewidywać kolejne dźwięki w ciągu – podobnie jak chatboty przewidują nasze następne słowa w zdaniu.

Technologia od Google, sprzęt z kieszeni

Model ma około 400 milionów parametrów i jest na tyle lekki, że można go uruchomić nawet na smartfonach Google Pixel. Tak – telefon w kieszeni może teraz pełnić funkcję tłumacza języka delfinów. A przynajmniej jego ucznia.

To nie koniec. Zespół WDP wykorzystuje DolphinGemma do automatycznego wychwytywania wzorców, których wcześniej szukano ręcznie przez długie miesiące. Efekt? Więcej czasu na analizę i mniej na ślęczenie nad nagraniami.

CHAT – czyli nie chodzi o czat, tylko o rozmowę z delfinem

Równolegle rozwijany jest system o wdzięcznej nazwie CHAT (Cetacean Hearing Augmentation Telemetry). Ale tu zamiast tłumaczenia języka delfinów, chodzi o stworzenie czegoś w rodzaju wspólnego słownika.

Delfiny uczą się przypisywać sztucznie wygenerowane gwizdy do określonych przedmiotów – np. szalika czy wodorostu (tak, wodorosty też mogą być super). Jeśli delfin zechce zabawkę – może ją „zamówić” odpowiednim dźwiękiem. Coś jak Alexa, tylko mokra.

Cała ta magia dzieje się dzięki smartfonom Pixel – to one analizują dźwięki, wykrywają gwizdy i informują naukowców (przez słuchawki przewodzące dźwięk przez kości czaszki!) o próbach komunikacji. A już latem 2025 r. nadciąga nowa generacja systemu – z Pixelem 9 w roli głównej.

Nowy sprzęt ma jednocześnie rozpoznawać dźwięki, analizować je w czasie rzeczywistym i obsługiwać modele AI – wszystko to na jednej słuchawce. James Bond byłby dumny.

I co dalej? Otwartość i współpraca

Google planuje udostępnić DolphinGemma jako otwarty model jeszcze tego lata. Choć wytrenowano go na podstawie dźwięków atlantyckich delfinów plamistych, architektura ma potencjał do pracy z innymi gatunkami – wystarczy drobne dostrojenie.

Celem jest umożliwienie naukowcom z całego świata badania delfiniej komunikacji na własną rękę. Od pasywnego podsłuchiwania przechodzimy do aktywnego rozszyfrowywania – a może nawet pierwszych prób międzygatunkowego dialogu.

Bo kto wie? Może kiedyś, zamiast mówić „Ok Google”, powiemy „Kliknij jeśli mnie słyszysz” – i odpowiedź usłyszymy nie z głośnika, ale prosto z oceanu.

Źródło