Nowe etapy ChatGPT i ocena AI „od kuchni”
Big Data Wybór redakcji

Nowe etapy ChatGPT i ocena AI „od kuchni”

OpenAI zaprezentowało właśnie trzy nowości, które razem wyznaczają kierunek, w jakim rozwija się praca ze sztuczną inteligencją – od współpracy zespołowej, przez nowe metody oceny jakości modeli, aż po bardziej proaktywnego asystenta codziennego. Choć każda z nich dotyczy innego obszaru, to wszystkie łączy jeden cel: uczynienie ChatGPT narzędziem nie tylko do rozmów i szybkiego generowania treści, ale realnym wsparciem w pracy i organizacji dnia.

Współpraca zespołowa w ChatGPT – Shared Projects i konektory

Pierwszym ogłoszeniem są rozbudowane funkcje zespołowe w ChatGPT. Do tej pory aplikacja była przede wszystkim narzędziem indywidualnym, jednak w planach Business, Enterprise czy Edu pojawia się możliwość tworzenia tak zwanych Shared Projects. To przestrzenie, w których członkowie zespołu mogą współdzielić pliki, historię rozmów i instrukcje, a ChatGPT wykorzystuje cały ten kontekst, by udzielać spójnych i dopasowanych odpowiedzi.

Równolegle pojawiły się konektory do popularnych narzędzi firmowych: Gmaila, Kalendarza Google, Outlooka, Microsoft Teams, GitHuba, Dropboxa czy SharePointa. W praktyce oznacza to, że model może nie tylko odpowiadać na pytania, ale także korzystać z bieżących danych organizacji – pod warunkiem, że użytkownicy wyraźnie włączą takie integracje. Nowości uzupełnia pakiet zabezpieczeń obejmujący certyfikaty ISO, rozszerzony raport SOC 2, logowanie jednokrotne SSO, kontrolę dostępu na poziomie roli czy możliwość ograniczenia użycia do wskazanych adresów IP. Co istotne, dane z wersji biznesowych ChatGPT nie są wykorzystywane do trenowania modeli, chyba że firma sama wyrazi na to zgodę.

GDPval — jak ocenić, czy AI naprawdę się przydaje

Drugim elementem jest zupełnie nowe podejście do oceny możliwości modeli. OpenAI przedstawiło inicjatywę o nazwie GDPval, która ma mierzyć nie tyle zdolność AI do rozwiązywania testów akademickich czy łamigłówek, ale jej przydatność w pracy zawodowej. Nazwa nawiązuje do PKB, bo chodzi o ocenę, ile wartości realnie mogą przynieść modele w zadaniach związanych z różnymi branżami. W ramach GDPval powstał zbiór obejmujący 44 zawody z dziewięciu kluczowych sektorów gospodarki. Zadania, których w pełnym zestawie jest 1320, dotyczą między innymi prawa, inżynierii, analizy biznesowej, opieki medycznej czy obsługi klienta. Ich rozwiązania oceniane są przez ekspertów z danej dziedziny, którzy porównują odpowiedzi modeli z własnymi i decydują, czy są one lepsze, równorzędne, czy gorsze.

Aby przyspieszyć proces, opracowano także automatycznego „recenzenta”, który potrafi przewidzieć ocenę eksperta, choć nie zastępuje on ludzi. Wstępne wyniki pokazują, że najnowsze modele – takie jak GPT-5 – w niektórych przypadkach osiągają jakość porównywalną z profesjonalistami, a co ważne, robią to kilkadziesiąt razy szybciej i taniej. Postęp pomiędzy GPT-4o a GPT-5 według OpenAI był ponad trzykrotny w zakresie jakości na zadaniach GDPval. Warto jednak pamiętać, że obecna metodologia zakłada pojedyncze rozwiązania, bez dłuższych iteracji czy uwzględnienia realiów codziennej pracy, w której zadania bywają bardziej chaotyczne i wieloetapowe.

ChatGPT Pulse — kiedy ChatGPT „podchodzi do ciebie” z pomysłem

Trzecią zapowiedzią jest ChatGPT Pulse – funkcja, która ma zmienić sposób, w jaki użytkownicy korzystają z aplikacji na co dzień. Dotychczas ChatGPT czekał na pytanie, teraz sam zacznie podsuwać treści. Pulse, dostępny w wersji testowej dla posiadaczy planu Pro na urządzeniach mobilnych, codziennie rano prezentuje użytkownikowi zestaw spersonalizowanych kart z informacjami. Mogą to być przypomnienia, sugestie związane z kalendarzem, podsumowania ważnych tematów czy propozycje działań. Co ważne, to użytkownik decyduje, jak Pulse działa – może wskazać, jakie treści chce widzieć, ocenić przydatność poszczególnych kart czy edytować preferencje. Pulse może także korzystać z danych z narzędzi, do których użytkownik świadomie przyzna dostęp, takich jak poczta czy kalendarz.

Dzięki temu ChatGPT staje się bardziej aktywnym asystentem, który nie tylko odpowiada na pytania, ale również sam inicjuje interakcje. Na razie jednak funkcja jest eksperymentalna, dostępna tylko na telefonach i potrafi popełniać błędy w doborze treści.

Choć trzy nowości OpenAI różnią się zakresem, łączy je wizja sztucznej inteligencji, która wychodzi poza rolę biernego narzędzia. Shared Projects i konektory pokazują, że ChatGPT może być centrum współpracy zespołowej. GDPval to próba zmierzenia, na ile AI faktycznie potrafi wspierać pracę zawodową, a Pulse otwiera drzwi do asystenta, który aktywnie uczestniczy w codzienności użytkownika. Każde z tych rozwiązań ma jeszcze ograniczenia i wymaga czasu, by w pełni zadziałać, ale kierunek jest jasny: sztuczna inteligencja ma nie tylko odpowiadać na pytania, ale też realnie odciążać ludzi w pracy i organizacji dnia. To zapowiedź przejścia z modelu „zadaj pytanie → otrzymaj odpowiedź” do modelu „pracujemy razem”.

Źródło