Nowe narzędzie do mierzenia systemów LLM

Primate Labs wreszcie wypuściło Geekbench AI – narzędzie do testowania sztucznej inteligencji, które udowadnia, że AI to nie tylko termin na prezentacje, ale coś, co faktycznie trzeba umieć zmierzyć.

Geekbench AI 1.0 to efekt lat pracy i współpracy z ekspertami od AI. Kiedyś znany jako Geekbench ML, teraz zyskał nową nazwę, bo w świecie technologii liczy się branding, prawda? Teraz dostępny na Windows, macOS, Linux, Google Play i Apple App Store, więc możecie testować, gdzie tylko chcecie.

Najciekawsze w tym benchmarku jest to, że daje trzy wyniki, bo przecież jedna liczba to za mało, by ocenić AI. Jak to mówi Primate Labs: „Pomiar wydajności to nie bułka z masłem”. Trzy wyniki uwzględniają różne poziomy precyzji i optymalizacji sprzętu, więc każdy znajdzie coś dla siebie.

Co jeszcze? Geekbench AI mierzy nie tylko szybkość, ale i dokładność, bo AI to nie tylko szybkość reakcji, ale też jakość odpowiedzi – takie połączenie szybkości Usaina Bolta z precyzją snajpera.

Primate Labs opublikowało szczegółowe opisy techniczne obciążeń i modeli używanych w Geekbench AI 1.0, podkreślając swoje zaangażowanie w transparentność i testowanie zgodne z branżowymi standardami. Benchmark jest zintegrowany z Geekbench Browser, co ułatwia porównania międzyplatformowe i udostępnianie wyników.

Firma przewiduje regularne aktualizacje Geekbench AI, aby nadążać za zmianami rynkowymi i nowymi funkcjami AI. Jednak Primate Labs uważa, że Geekbench AI osiągnął już poziom niezawodności, który sprawia, że nadaje się do integracji z profesjonalnymi przepływami pracy, a główne firmy technologiczne, takie jak Samsung i Nvidia, już korzystają z tego benchmarku.

Źródło