ChatGPT dostał własny komputer. I właśnie nauczył się pracować za Ciebie
Wybór redakcji Praca

ChatGPT dostał własny komputer. I właśnie nauczył się pracować za Ciebie

Na naszych oczach ChatGPT przechodzi kolejną metamorfozę – z pomocnego rozmówcy w inteligentnego cyfrowego asystenta, który potrafi samodzielnie wykonywać złożone zadania od A do Z. Tak, dobrze czytasz: teraz ChatGPT może faktycznie „zrobić to za Ciebie”, a nie tylko podpowiedzieć, jak to zrobić.

Agent w Twoim komputerze. Ale spokojnie – Ty rządzisz

Nowe funkcje ChatGPT to nie tylko kosmetyczne zmiany. To prawdziwa rewolucja, która łączy trzy wcześniej oddzielne rozwiązania: Operatora (czyli system zdolny do klikania i przeglądania internetu), deep research (zaawansowane przetwarzanie informacji) oraz klasyczne możliwości ChatGPT (czyli znajomego gadulca, który potrafi całkiem sensownie pisać i analizować). Teraz to wszystko zamknięto w jednym modelu, który korzysta z własnego wirtualnego komputera.

Możesz poprosić go o rzeczy takie jak:

  • sprawdzenie Twojego kalendarza i przygotowanie briefu z newsami o klientach,
  • zaplanowanie zakupów na japońskie śniadanie dla czterech osób,
  • przygotowanie slajdów porównujących trzech konkurentów na rynku.

Brzmi jak sekretarka z Silicon Valley, prawda?

ChatGPT wie, co robi, ale pyta o zgodę

Ważne: to nie Matrix. Masz pełną kontrolę. ChatGPT poprosi o pozwolenie zanim zrobi coś poważnego – np. kliknie w Twoim imieniu „kup teraz” czy zaloguje się gdziekolwiek. Możesz go w każdej chwili zatrzymać, przejąć kontrolę nad przeglądarką lub poprosić o podsumowanie postępów.

Nowe funkcje są dostępne już dziś dla użytkowników planów Pro, Plus i Team (USA, ale Europa już niedługo) – wystarczy włączyć „agent mode” z poziomu narzędzi w oknie rozmowy.

Agent, który działa jak prawdziwy człowiek. Tylko szybciej

To nie jest tylko „asystent AI”. To mała rewolucja w świecie automatyzacji. ChatGPT wyposażono w:

  • przeglądarkę wizualną, która potrafi klikać jak człowiek,
  • przeglądarkę tekstową do analiz i wyszukiwań,
  • terminal do wykonywania kodu,
  • dostęp do API i integrację z aplikacjami jak Gmail czy GitHub.

To oznacza, że agent może jednocześnie korzystać z różnych ścieżek, by osiągnąć cel – np. przetwarzać kalendarz przez API, analizować dane w terminalu i przeglądać wizualnie stronę internetową.

A gdy się pomylisz albo zmienisz zdanie? Nie ma problemu. Możesz zmodyfikować zadanie w trakcie jego realizacji, a ChatGPT nie pogubi się i nie straci kontekstu.

Nie tylko dla geeków. Użytek codzienny i zawodowy

Nowe możliwości przydają się nie tylko do tworzenia slajdów czy analiz. ChatGPT może:

  • konwertować zrzuty ekranu do edytowalnych prezentacji,
  • zaplanować podróż z rezerwacjami,
  • zaktualizować dane w Excelu bez psucia formatu,
  • znaleźć lekarza i umówić wizytę.

W pracy – jak i w życiu prywatnym – może więc zdjąć z barków wiele żmudnych zadań. To tak, jakbyś miał stażystę, który nigdy nie śpi i nie zadaje zbędnych pytań. No, może czasem zapyta: „czy na pewno chcesz, żebym wysłał tego maila?”

Wyniki jak z laboratoriów NASA

Model przeszedł szereg testów na benchmarkach:

  • na Humanity’s Last Exam osiągnął rekordowe 44,4 punktu przy zrównolegleniu prób,
  • na FrontierMath (gdzie zadania rozwiązuje się godzinami) uzyskał 27,4% poprawności,
  • na SpreadsheetBench – bije na głowę Copilota w Excelu,
  • a w testach zadań inwestycyjnych (takich jak budowa modeli finansowych) przewyższa nawet o3 i o4-mini.

Innymi słowy – radzi sobie nie tylko z teorią, ale i praktyką.

Z dużą mocą przychodzi… bezpieczeństwo

Wraz z nowymi funkcjami pojawiają się nowe zagrożenia. ChatGPT może działać na żywych danych i wchodzić w interakcje z prawdziwymi stronami internetowymi. Dlatego OpenAI wdrożyło szereg zabezpieczeń:

  • obowiązkowe pytania o zgodę przy ryzykownych akcjach,
  • brak dostępu do haseł – nawet w trybie „przejmowania przeglądarki”,
  • możliwość natychmiastowego usunięcia historii przeglądania,
  • systemy wykrywające próby manipulacji tzw. prompt injection.

Wszystko to po to, by agent nie tylko był użyteczny, ale i bezpieczny.

Co dalej?

To dopiero początek. OpenAI zapowiada dalsze rozwijanie agentowych funkcji: od lepszych slajdów po płynniejsze interakcje. W tej chwili funkcja tworzenia prezentacji dopiero raczkuje – slajdy czasem są toporne i mniej dopracowane, ale… hej, to dopiero beta. Nowe modele już są trenowane.

Dla użytkowników z Europy – chwilka cierpliwości. Funkcja jeszcze nie trafiła na Stary Kontynent, ale to tylko kwestia czasu.

Zanim więc znowu siądziesz do żmudnego raportu czy planowania zakupów – zastanów się, czy przypadkiem nie ma kogoś, kto mógłby to ogarnąć za Ciebie. Kogoś, kto nie pyta o podwyżkę i nie robi sobie przerw na kawę.

Kogoś jak ChatGPT Agent.

Źródło