Google DeepMind postanowiło zejść z chmur. Dosłownie. Nowa wersja ich modelu sztucznej inteligencji dla robotów – Gemini Robotics On-Device – działa w pełni lokalnie. Oznacza to, że robot nie musi być podłączony do internetu, by wykonywać zadania. Trochę jak my w 2003 roku, kiedy komputer działał szybciej, gdy wyłączyło się Wi-Fi.
Nowa wersja bazuje na marcowym modelu Gemini Robotics, ale to już nie ten sam zawodnik. To wersja „do noszenia w plecaku”, lekka i samodzielna. A mimo to – potrafi sporo. Według Google, ten lokalny model działa prawie tak dobrze, jak wersja chmurowa. Mało tego – bije na głowę inne modele działające offline (choć Google nie powiedziało, które dokładnie – jakby nie chcieli robić nikomu przykrości).
W praktyce, nowe dziecko DeepMind potrafi kontrolować ruchy robotów, reagować na polecenia w języku naturalnym i – jak pokazano w demonstracjach – rozpakowywać torby czy składać ubrania. A że został wytrenowany na robotach ALOHA, a potem przeniesiony na Franka FR3 (z dwoma ramionami) i humanoidalnego Apollo, to pokazuje, że model ma nie tylko wiedzę, ale i umiejętność adaptacji. Czyli coś jak nauczyciel WF-u, który nagle zostaje trenerem szachowym. I daje radę.
Ciekawostką jest to, że robot Franka FR3 potrafił poradzić sobie z nowymi zadaniami, jak montaż na taśmie produkcyjnej, mimo że wcześniej takich rzeczy „na oczy nie widział”. Jeśli ktoś jeszcze wątpi w możliwości uczenia się maszyn – to może być moment na zmianę zdania.
Nowością jest również SDK (Software Development Kit), który umożliwia deweloperom trenowanie robota w warunkach domowych (albo biurowych, jak kto woli) przy pomocy symulatora fizyki MuJoCo. Wystarczy 50–100 demonstracji, by robot załapał, o co chodzi.
Carolina Parada z Google DeepMind przyznała, że co prawda model hybrydowy (czyli ten, który działa i w chmurze, i lokalnie) wciąż jest mocniejszy, ale ten nowy offline’owiec zaskoczył ich swoją skutecznością. „To świetny model początkowy. Albo dla tych, którzy mają kiepski internet” – mówi Parada. A można dodać: albo dla tych, którym bezpieczeństwo danych spędza sen z powiek.
Póki co model i SDK trafią jedynie do zaufanych testerów, a Google nadal pracuje nad zapewnieniem maksymalnego bezpieczeństwa.