Gemini 1.5 Pro od Google bije swojego starszego brata

Oto i ona, nowa odsłona sztucznej inteligencji, która znowu podnosi poprzeczkę.

Aktualizacja Google’a do modelu Gemini 1.5 Pro to jak dać uszy komputerowi. Teraz model może słuchać wrzucanych plików audio i wyciągać z nich informacje, na przykład z rozmów o wynikach finansowych czy audio z filmów, bez konieczności zaglądania do pisemnego stenogramu. To trochę jak nauczyć maszynę podsłuchiwać, tylko w szczytnym celu, oczywiście.

Ta nowa wersja Gemini Pro, która ma być takim środkowym modelem w rodzinie Gemini, już pobiła na głowę największego i najpotężniejszego członka rodziny, Gemini Ultra, pod względem wydajności. Gemini 1.5 Pro rozumie skomplikowane polecenia i, jak twierdzi Google, eliminuje potrzebę dostosowywania modeli. Czyli mówiąc po ludzku, jest wystarczająco mądra, żeby obejść się bez szkolenia.

Dostęp do Gemini 1.5 Pro mają na razie tylko ci z dostępem do platformy Vertex AI. Ale to nie jedyny duży model AI od Google, który dostaje aktualizację. Imagen 2, model generacji obrazów tekst-na-obraz, który pomaga w generowaniu obrazów przez Gemini, dodaje też funkcje edycji wygenerowanych obrazów – podobnie jak ostatnio zrobił to ChatGPT ze swoim kompanem DALL-E.

Źródło