Na naszych oczach ChatGPT przechodzi kolejną metamorfozę – z pomocnego rozmówcy w inteligentnego cyfrowego asystenta, który potrafi samodzielnie wykonywać złożone zadania od A do Z. Tak, dobrze czytasz: teraz ChatGPT może faktycznie „zrobić to za Ciebie”, a nie tylko podpowiedzieć, jak to zrobić.
Agent w Twoim komputerze. Ale spokojnie – Ty rządzisz
Nowe funkcje ChatGPT to nie tylko kosmetyczne zmiany. To prawdziwa rewolucja, która łączy trzy wcześniej oddzielne rozwiązania: Operatora (czyli system zdolny do klikania i przeglądania internetu), deep research (zaawansowane przetwarzanie informacji) oraz klasyczne możliwości ChatGPT (czyli znajomego gadulca, który potrafi całkiem sensownie pisać i analizować). Teraz to wszystko zamknięto w jednym modelu, który korzysta z własnego wirtualnego komputera.
Możesz poprosić go o rzeczy takie jak:
- sprawdzenie Twojego kalendarza i przygotowanie briefu z newsami o klientach,
- zaplanowanie zakupów na japońskie śniadanie dla czterech osób,
- przygotowanie slajdów porównujących trzech konkurentów na rynku.
Brzmi jak sekretarka z Silicon Valley, prawda?
ChatGPT wie, co robi, ale pyta o zgodę
Ważne: to nie Matrix. Masz pełną kontrolę. ChatGPT poprosi o pozwolenie zanim zrobi coś poważnego – np. kliknie w Twoim imieniu „kup teraz” czy zaloguje się gdziekolwiek. Możesz go w każdej chwili zatrzymać, przejąć kontrolę nad przeglądarką lub poprosić o podsumowanie postępów.
Nowe funkcje są dostępne już dziś dla użytkowników planów Pro, Plus i Team (USA, ale Europa już niedługo) – wystarczy włączyć „agent mode” z poziomu narzędzi w oknie rozmowy.
Agent, który działa jak prawdziwy człowiek. Tylko szybciej
To nie jest tylko „asystent AI”. To mała rewolucja w świecie automatyzacji. ChatGPT wyposażono w:
- przeglądarkę wizualną, która potrafi klikać jak człowiek,
- przeglądarkę tekstową do analiz i wyszukiwań,
- terminal do wykonywania kodu,
- dostęp do API i integrację z aplikacjami jak Gmail czy GitHub.
To oznacza, że agent może jednocześnie korzystać z różnych ścieżek, by osiągnąć cel – np. przetwarzać kalendarz przez API, analizować dane w terminalu i przeglądać wizualnie stronę internetową.
A gdy się pomylisz albo zmienisz zdanie? Nie ma problemu. Możesz zmodyfikować zadanie w trakcie jego realizacji, a ChatGPT nie pogubi się i nie straci kontekstu.
Nie tylko dla geeków. Użytek codzienny i zawodowy
Nowe możliwości przydają się nie tylko do tworzenia slajdów czy analiz. ChatGPT może:
- konwertować zrzuty ekranu do edytowalnych prezentacji,
- zaplanować podróż z rezerwacjami,
- zaktualizować dane w Excelu bez psucia formatu,
- znaleźć lekarza i umówić wizytę.
W pracy – jak i w życiu prywatnym – może więc zdjąć z barków wiele żmudnych zadań. To tak, jakbyś miał stażystę, który nigdy nie śpi i nie zadaje zbędnych pytań. No, może czasem zapyta: „czy na pewno chcesz, żebym wysłał tego maila?”
Wyniki jak z laboratoriów NASA
Model przeszedł szereg testów na benchmarkach:
- na Humanity’s Last Exam osiągnął rekordowe 44,4 punktu przy zrównolegleniu prób,
- na FrontierMath (gdzie zadania rozwiązuje się godzinami) uzyskał 27,4% poprawności,
- na SpreadsheetBench – bije na głowę Copilota w Excelu,
- a w testach zadań inwestycyjnych (takich jak budowa modeli finansowych) przewyższa nawet o3 i o4-mini.
Innymi słowy – radzi sobie nie tylko z teorią, ale i praktyką.
Z dużą mocą przychodzi… bezpieczeństwo
Wraz z nowymi funkcjami pojawiają się nowe zagrożenia. ChatGPT może działać na żywych danych i wchodzić w interakcje z prawdziwymi stronami internetowymi. Dlatego OpenAI wdrożyło szereg zabezpieczeń:
- obowiązkowe pytania o zgodę przy ryzykownych akcjach,
- brak dostępu do haseł – nawet w trybie „przejmowania przeglądarki”,
- możliwość natychmiastowego usunięcia historii przeglądania,
- systemy wykrywające próby manipulacji tzw. prompt injection.
Wszystko to po to, by agent nie tylko był użyteczny, ale i bezpieczny.
Co dalej?
To dopiero początek. OpenAI zapowiada dalsze rozwijanie agentowych funkcji: od lepszych slajdów po płynniejsze interakcje. W tej chwili funkcja tworzenia prezentacji dopiero raczkuje – slajdy czasem są toporne i mniej dopracowane, ale… hej, to dopiero beta. Nowe modele już są trenowane.
Dla użytkowników z Europy – chwilka cierpliwości. Funkcja jeszcze nie trafiła na Stary Kontynent, ale to tylko kwestia czasu.
Zanim więc znowu siądziesz do żmudnego raportu czy planowania zakupów – zastanów się, czy przypadkiem nie ma kogoś, kto mógłby to ogarnąć za Ciebie. Kogoś, kto nie pyta o podwyżkę i nie robi sobie przerw na kawę.
Kogoś jak ChatGPT Agent.