Midjourney nie chce robić tylko obrazków. Czas na wideo – i to w ruchu
Film Wybór redakcji

Midjourney nie chce robić tylko obrazków. Czas na wideo – i to w ruchu

Midjourney, znane dotąd głównie z generowania pięknych (i czasem niepokojąco realistycznych) obrazów, właśnie wykonało duży krok naprzód. Firma ogłosiła premierę swojego pierwszego modelu wideo – i choć to dopiero początek większej układanki, to kierunek jest jasny: pełne, otwarte symulacje w czasie rzeczywistym. Brzmi jak coś z gry science fiction? Być może. Ale twórcy są całkiem poważni.

Celem jest stworzenie systemu, który pozwala nie tylko generować obrazy czy wideo, ale też poruszać się w pełni trójwymiarowej przestrzeni, w której wszystko – od postaci po całe środowisko – reaguje na nasze polecenia. Taka „otwarta symulacja świata” to ich Święty Graal. Ale zanim dojdziemy do tego punktu, trzeba zbudować fundamenty.

Budujemy od podstaw

Midjourney chce poskładać ten cyfrowy świat z czterech klocków: obrazów, ruchu (czyli wideo), przestrzeni (czytaj: modele 3D) i szybkości (czyli działania w czasie rzeczywistym). A rok 2025 ma być właśnie czasem składania tych puzzli. Pojedynczo, krok po kroku.

Na razie jednak skupiamy się na jednym z tych elementów – i to całkiem ekscytującym. Wersja 1 modelu wideo Midjourney trafiła właśnie do całej społeczności.

Od obrazka do filmu

Nowa funkcja nazywa się “Image-to-Video”. Co to oznacza w praktyce? Generujesz obraz w Midjourney jak zwykle, a potem wciskasz magiczny przycisk “Animate” – i obraz ożywa. Tak po prostu.

Dostępne są dwa tryby animacji: automatyczny i ręczny. Ten pierwszy działa trochę jak tryb „niespodzianka” – system sam wymyśla, co się ma ruszać. Drugi pozwala użytkownikowi dokładnie opisać, co i jak ma się wydarzyć. Są też dwa poziomy dynamiki: niski i wysoki. Niski sprawdzi się w scenach ambientowych, gdzie kamera ledwo się porusza. Wysoki? Tu wszystko tańczy, choć czasem w trochę nieskoordynowany sposób.

Wideo można też przedłużać – o około 4 sekundy na raz, do czterech razy. A jeśli masz obraz spoza Midjourney – żaden problem. Można go wrzucić do systemu, zaznaczyć jako „klatkę początkową” i nadać kierunek ruchu.

Ile to kosztuje?

Midjourney obiecuje, że ceny będą „zaskakująco niskie” jak na standardy branżowe. Koszt jednego zadania wideo to równowartość około ośmiu obrazów. Ale jedno zadanie generuje cztery klipy po 5 sekund – co w przeliczeniu daje mniej więcej jedną „cenę obrazka” za sekundę filmu. To aż 25 razy taniej niż konkurencja. A w wersji Pro testowany jest już tryb „relax” dla wideo.

Na razie funkcja dostępna jest wyłącznie przez przeglądarkę. Twórcy przyznają, że nie są jeszcze pewni jak rozłoży się zainteresowanie – mogą być przeciążenia, a mogą też być pustki. Wszystko będzie dostosowywane w czasie rzeczywistym.

I co dalej?

Wideo to dopiero początek – jak piszą sami twórcy, każde kolejne usprawnienie będzie wpływać również na rozwój modeli obrazów. Plan jest ambitny, a jego realizacja może zmienić sposób, w jaki tworzymy nie tylko grafikę, ale całe cyfrowe doświadczenia.

A teraz cytując klasyka: „Kiedyś to były obrazy. Teraz się ruszają. I jeszcze mają czelność wyglądać lepiej niż rzeczywistość”.

Źródło