Wybór redakcji Grafika

Midjourney V7 już w testach. Nowy silnik, nowa jakość i… rozmowy z AI

Midjourney nie zwalnia tempa. Twórcy jednego z najpopularniejszych generatorów obrazów opartych na AI ogłosili właśnie start testów wersji alpha swojego najnowszego modelu – V7. Co nowego? Lepsze zrozumienie promptów tekstowych, wyższa jakość obrazów i większa spójność detali. Ale po kolei.

„V7 to niesamowity model. Znacznie lepiej radzi sobie z tekstowymi promptami, obrazy wyglądają świetnie, a jakość i detale – od tekstur po dłonie – są zdecydowanie na wyższym poziomie” – chwali się Midjourney. Skromność nie była nigdy ich cechą wiodącą, ale w tym przypadku mogą mieć rację.

Jednym z kluczowych elementów nowej wersji jest personalizacja modelu, która od teraz jest domyślnie aktywna – choć trzeba ją najpierw odblokować (co zajmuje około pięciu minut). Potem można ją dowolnie włączać i wyłączać. Po co to wszystko? Żeby model lepiej „czytał” nasze intencje i artystyczne gusta. Midjourney twierdzi, że to prawdziwy przełom w zrozumieniu użytkownika. A kto wie – może faktycznie AI lepiej rozpozna, czy wolimy melancholijne pejzaże o zachodzie słońca, czy cyberpunkowe miasta nocą.

Razem z V7 debiutuje też nowa funkcja – Tryb roboczy (Draft Mode). Obiecuje dziesięciokrotne przyspieszenie generowania grafik i… połowę niższy koszt. Jak to się mówi – szybciej, taniej, prawie lepiej. Obrazki w trybie draft są niższej jakości, ale zachowują styl i charakter. A jak się spodoba, wystarczy kliknąć „ulepsz” albo „zróżnicuj” i voilà – wersja premium gotowa.

Co ciekawe, przyspieszenie działania pozwoliło też na uruchomienie czegoś w rodzaju „trybu rozmowy”. Użytkownik może powiedzieć (lub napisać), by zamiast kota na obrazku była sowa, a pora dnia zmieniła się z południa na głęboką noc – system sam przetworzy sugestię i wygeneruje nową wersję grafiki. I tu wchodzi nowość: obsługa głosu. Wystarczy wcisnąć mikrofon i powiedzieć, co ma się znaleźć na obrazku. Pomysł rodem z futurystycznych filmów? A jakże. Ale działa.

Nowy model V7 oferowany będzie początkowo w dwóch trybach szybkości: Turbo i Relax. Tryb standardowy wciąż jest w fazie dopieszczania. Warto przy tym pamiętać, że Turbo kosztuje dwa razy więcej niż standard, a Draft – połowę ceny. Taki AI-owy cennik elastyczny.

Nie wszystko jednak przesiada się od razu na V7. Niektóre funkcje – jak powiększanie (upscaling), edycja i zmiana tekstur – nadal korzystają z modelu V6, przynajmniej na razie. Moodboardy i funkcje SREF działają, a ich wydajność ma się z czasem poprawić.

Plany? Oj, jest ich sporo. Midjourney zapowiada intensywny harmonogram aktualizacji – co 1-2 tygodnie nowe funkcje przez najbliższe 60 dni. A jednym z większych kroków ma być możliwość rozpoznawania i utrwalania postaci czy obiektów – wreszcie AI zapamięta, że twoja postać miała czerwony szalik i nie zamieni go w zielony po drugim promptcie.

Na koniec ważna uwaga od twórców: V7 to zupełnie nowy model z własnymi mocnymi stronami… i słabościami. Warto więc eksperymentować, testować, a czasem nawet zmienić sposób, w jaki piszemy prompta. Bo to, co działało w V6, niekoniecznie musi zadziałać tu.

Czy to już rewolucja? Trudno powiedzieć. Ale jedno jest pewne – Midjourney nie przestaje próbować. I chyba właśnie za to kochają go graficy, marketerzy i wszyscy ci, którzy marzyli kiedyś, by komputer czytał im w myślach. Teraz jest tego coraz bliżej.

Źródło

Wyjście z wersji mobilnej