OpenAI wprowadziło nową funkcję generowania obrazów w ChatGPT, opartą na modelu GPT-4o. Ta innowacja pozwala użytkownikom na tworzenie obrazów bezpośrednio w ramach rozmowy z chatbotem, co znacząco rozszerza możliwości interakcji. Funkcja jest dostępna dla wszystkich użytkowników, choć w wersji darmowej obowiązują pewne ograniczenia dotyczące liczby generowanych obrazów.
GPT-4o to model multimodalny, który łączy tekst i obraz w spójną całość. Dzięki temu użytkownicy mogą tworzyć złożone obrazy z precyzyjnie osadzonym tekstem, co wcześniej było trudne do osiągnięcia. Model potrafi generować do 20 różnych obiektów na jednym obrazie, zachowując przy tym ich wzajemne relacje i atrybuty.
Interesującą cechą GPT-4o jest możliwość prowadzenia wieloetapowego procesu tworzenia obrazów. Użytkownicy mogą rozpocząć od podstawowego obrazu, a następnie, poprzez kolejne polecenia, dodawać szczegóły lub modyfikować istniejące elementy. To przypomina trochę pracę z artystą, który na bieżąco dostosowuje swoje dzieło do wskazówek klienta.
Warto jednak pamiętać, że choć GPT-4o znacząco poprawia jakość generowanych obrazów, nadal istnieją pewne ograniczenia. Na przykład, w jednym z eksperymentów model nie odtworzył wszystkich okien w wygenerowanym obrazie salonu. To pokazuje, że mimo postępów, technologia wciąż ma swoje granice.
OpenAI podkreśla swoje zaangażowanie w kwestie bezpieczeństwa i etyki. Wszystkie wygenerowane obrazy zawierają cyfrowe znaczniki wskazujące na ich pochodzenie z AI, a użytkownicy mają pełne prawa do stworzonych przez siebie grafik, zgodnie z polityką użytkowania usługi.
Podsumowując, wprowadzenie funkcji generowania obrazów w ChatGPT otwiera nowe możliwości dla użytkowników, łącząc kreatywność z zaawansowaną technologią AI. To krok naprzód w kierunku bardziej interaktywnych i wszechstronnych narzędzi opartych na sztucznej inteligencji.