Big Data Film Internet Technologia Wybór redakcji

Chiński Kling wyprzedza OpenAI Sora w wyścigu technologii AI T2V

Odkrywanie nowych technologii nigdy nie przestaje fascynować, a najnowsze osiągnięcia w dziedzinie sztucznej inteligencji zawsze przynoszą coś, co warto obserwować.

Chińska firma technologiczna Kuaishou Technology właśnie wypuściła na rynek generator tekst-na-wideo (T2V) o nazwie Kling, który może stanowić poważną konkurencję dla Sora od OpenAI. Gdy OpenAI w lutym zaprezentowało swoje demo Sora, wielu z nas z zapartym tchem szukało przycisku „zarejestruj się”. Cztery miesiące później nadal czekamy na premierę Sory, bez żadnych informacji, kiedy to nastąpi.

Kuaishou, firma z siedzibą w Pekinie, rozwija platformy do dzielenia się treściami, które, jak twierdzi, ułatwiają „produkcję, dystrybucję i konsumpcję treści”. Ich platforma do krótkich filmów, również nazwana Kuaishou, jest druga pod względem średniej liczby aktywnych użytkowników dziennie, tuż za TikTokiem.

Tworzenie treści na swoich platformach byłoby znacznie łatwiejsze, gdyby nie musiało polegać wyłącznie na treściach generowanych przez ludzi. To może być jedna z przyczyn, dla których rozwijają narzędzie T2V. Kling zamienia tekstowe polecenia w spójne czasowo i przestrzennie filmy, które wyglądają świetnie. Kuaishou twierdzi, że Kling może generować filmy o długości do 2 minut przy rozdzielczości 1080p i 30 klatkach na sekundę.

To o minutę dłużej niż deklaruje OpenAI dla Sory. Inną dużą różnicą jest to, że Kling jest już dostępny publicznie, podczas gdy Sora wciąż pozostaje w ukryciu. Jeśli jesteś w Chinach, lub masz chiński numer telefonu i VPN, możesz już teraz zgłosić się do testowania aplikacji.

Podobnie jak Sora, Kling używa architektury transformatora dyfuzji. Posiada również zaawansowaną technologię rekonstrukcji twarzy i ciała w 3D, która może używać pełnego obrazu ciała jako wskazówki do generowania filmu ze płynnymi ruchami kończyn.

Wersja beta Klinga to w pewnym sensie komentarz do podejścia Wschodu kontra Zachód do AI. Podczas gdy Zachód debatuje nad bezpieczeństwem AI, prywatnością i zagrożeniami dezinformacji, Chiny pędzą naprzód z rozwojem, mimo amerykańskich sankcji próbujących to spowolnić.

Podczas gdy OpenAI stara się wymyślić, jak uczynić Sorę „bezpieczną” lub politycznie poprawną, być może powinniśmy spojrzeć na Chiny, aby dały nam porządne narzędzie T2V, w obliczu braku takowego wykonanego w USA.

Źródło

Wyjście z wersji mobilnej