OpenAI ulepsza generowanie obrazów
Grafika LLM Wybór redakcji

OpenAI ulepsza generowanie obrazów

OpenAI wprowadziło nową funkcję generowania obrazów w ChatGPT, opartą na modelu GPT-4o. Ta innowacja pozwala użytkownikom na tworzenie obrazów bezpośrednio w ramach rozmowy z chatbotem, co znacząco rozszerza możliwości interakcji. Funkcja jest dostępna dla wszystkich użytkowników, choć w wersji darmowej obowiązują pewne ograniczenia dotyczące liczby generowanych obrazów. 

GPT-4o to model multimodalny, który łączy tekst i obraz w spójną całość. Dzięki temu użytkownicy mogą tworzyć złożone obrazy z precyzyjnie osadzonym tekstem, co wcześniej było trudne do osiągnięcia. Model potrafi generować do 20 różnych obiektów na jednym obrazie, zachowując przy tym ich wzajemne relacje i atrybuty. 

Interesującą cechą GPT-4o jest możliwość prowadzenia wieloetapowego procesu tworzenia obrazów. Użytkownicy mogą rozpocząć od podstawowego obrazu, a następnie, poprzez kolejne polecenia, dodawać szczegóły lub modyfikować istniejące elementy. To przypomina trochę pracę z artystą, który na bieżąco dostosowuje swoje dzieło do wskazówek klienta.

Warto jednak pamiętać, że choć GPT-4o znacząco poprawia jakość generowanych obrazów, nadal istnieją pewne ograniczenia. Na przykład, w jednym z eksperymentów model nie odtworzył wszystkich okien w wygenerowanym obrazie salonu. To pokazuje, że mimo postępów, technologia wciąż ma swoje granice. 

OpenAI podkreśla swoje zaangażowanie w kwestie bezpieczeństwa i etyki. Wszystkie wygenerowane obrazy zawierają cyfrowe znaczniki wskazujące na ich pochodzenie z AI, a użytkownicy mają pełne prawa do stworzonych przez siebie grafik, zgodnie z polityką użytkowania usługi. 

Podsumowując, wprowadzenie funkcji generowania obrazów w ChatGPT otwiera nowe możliwości dla użytkowników, łącząc kreatywność z zaawansowaną technologią AI. To krok naprzód w kierunku bardziej interaktywnych i wszechstronnych narzędzi opartych na sztucznej inteligencji.

Źródło