Gemma 3n – Sztuczna inteligencja z chmurki schodzi na ziemię (i do twojego telefonu)
Wybór redakcji Technologia

Gemma 3n – Sztuczna inteligencja z chmurki schodzi na ziemię (i do twojego telefonu)

Google nie próżnuje. Po premierze modeli Gemma 3 i Gemma 3 QAT, które już teraz robią furorę wśród deweloperów grzebiących w AI na desktopach i w chmurze, przyszła pora na kolejny krok. Tym razem naprawdę bliski – bo prosto do naszych kieszeni. Poznajcie Gemma 3n, czyli nowy model, który powstał z myślą o pracy… lokalnie. Tak, chodzi o twojego smartfona, laptopa czy tablet.

Nowa architektura, nowe możliwości

Gemma 3n to pierwszy model open source oparty na świeżo opracowanej, nowoczesnej architekturze – zaprojektowanej wspólnie z tuzami mobilnego hardware’u: Qualcommem, MediaTekiem i działem Samsung System LSI. Efekt? AI, które działa szybko, lokalnie, multimodalnie i – co nie mniej ważne – prywatnie.

Czyli dokładnie tak, jak chcielibyśmy w 2025 roku: bez czekania, bez wysyłania danych w eter, bez konieczności trzymania się Wi-Fi jak tonący tratwy.

A co pod maską? Sporo nowości

Google poszło na całość i wyposażyło Gemmę 3n w kilka ciekawych sztuczek. Oto najważniejsze:

  • PLE (Per-Layer Embeddings) – technologia z Google DeepMind, która pozwala znacznie ograniczyć zużycie pamięci RAM. Choć model ma 5 lub 8 miliardów parametrów, działa z pamięciożernością odpowiadającą 2–4B. Czyli telefon nie wybuchnie.
  • Szybkość i elastyczność – nowa architektura daje odpowiedzi nawet 1,5x szybciej niż poprzednik (Gemma 3 4B), a przy tym lepiej gospodaruje pamięcią. Do tego model zawiera w sobie mniejszy podmodel 2B, co pozwala „na żywo” przełączać się między wydajnością a jakością.
  • Audio, obraz, wideo – proszę bardzo – Gemma 3n rozumie język mówiony, obrazy i klipy wideo. I to nie tylko na pokaz – potrafi tłumaczyć mowę w locie, transkrybować rozmowy i analizować złożone multimodalne interakcje.
  • Offline i prywatnie – dane nie lecą do chmury. Wszystko dzieje się na urządzeniu, co oznacza, że możesz gadać z AI nawet w samym środku puszczy (pod warunkiem, że nie zabraknie baterii).

Deweloperzy, start!

Gemma 3n w wersji preview dostępna jest już dziś – zarówno do testów w chmurze (Google AI Studio), jak i do integracji lokalnej (Google AI Edge). Można więc zacząć tworzyć aplikacje, które:

  • słuchają, patrzą i reagują w czasie rzeczywistym,
  • rozumieją kontekst wypowiedzi dzięki analizie tekstu, dźwięku i obrazu,
  • tłumaczą i transkrybują mowę bez połączenia z internetem.

I jeszcze jedno: odpowiedzialność

Google, choć pcha AI w każdą kieszeń, podkreśla, że nie robi tego na oślep. Gemma 3n przeszła przez sito testów bezpieczeństwa, przegląd danych i szlifowanie pod kątem zgodności z politykami etycznymi firmy. Czyli – jak mawiali nasi dziadkowie – „nie wszystko co błyszczy, to złoto”, ale tutaj przynajmniej ktoś to złoto uczciwie przeczesywał.

Gemma 3n to nie tylko nowa zabawka dla geeków. To technologia, która może naprawdę zmienić sposób, w jaki korzystamy z AI – bliżej, szybciej i bardziej po cichu. A jeśli twój telefon już teraz wydaje się nieco zdezorientowany – spokojnie, to tylko przyszłość zapukała do drzwi.

I wygląda na to, że nie zamierza długo czekać.

Źródło