reklama
PanzerGlass iPhone 15

FullHD AI video? Minutové klipy jsou bez problémů!

FullHD AI video? Minutové klipy jsou bez problémů!
2024-03-16T12:58:01+01:00
• 16. 2. 2024

Open AI dokazuje, že AI video je tu - ve FullHD a pekelně realistické, zdroj: openai.com

Zdá se, že Pandořina skříňka byla otevřená a už ji nikdo nezavře. Open AI umí generovat 1080p video už dnes. A jeho obsah? Jak jste zvyklí. Jednoduše slovy popíšete, co by mělo obsahovat. Výsledky jsou tak dobré, že je často od reálného videozáznamu nerozeznáte. I když si nemyslíme, že by pomocí AI vznikl příští týden nový celovečerní trhák, videoklip se svižným střihem by asi klidně mohl spatřit světlo světa už dnes. Pár promptů, šikovný střihač co videa poslepuje a jsme tam.

Je tak klidně možné, že za pár let prostě řeknete svému televizoru, na jakou show máte večer náladu a on vám ji připraví na míru. A to je ta veselejší část. Trochu děsivá je představa, že takovou umělou inteligenci dostane do rukou banda podvodníků, nebo manipulátorů. A my si bohužel myslíme, že ta pravděpodobnost je prakticky stoprocentní. Těžko se pak budeme divit, že už nebude možné na Internetu věřit ničemu. Pojďme se teď ale místo strachování mrknout, jak se úchvatné technologii daří měnit slova ve vizuální dílka.

AI video od OpenAI Sora

Nový model, který Open AI umožňuje generovat 1080p AI video se jmenuje Sora. Podobně jako v případě Chat GPT nebo Dall-E se jedná o difuzní model, který nejprve vygeneruje šum a postupně jej eliminuje a zpřesňuje výstup tak, aby odpovídal zadání uživatele. A pokud znělo zadání třeba „corgi vloguje na tropickém Maui“, dočkáte se odpovídajícího výstupu.

AI video od modelu Open AI Sora při zadání „corgi vloguje na tropickém Maui“, zdroj: openai.com/sora

Tento model pracuje s obrovským množstvím videí a obrázků, které jsou rozděleny na malé části zvané patche. Každý patch je jako malá skládačka obsahující části celkového obrazu nebo videa. Sora se učí, jak tyto skládačky vytvářet a spojovat dohromady, aby vytvořila nový vizuální obsah. Ptáte se, jak funguje? Začíná tím, že analyzuje tisíce a tisíce videí i obrázků, rozdělených na útržky obrazových informací. Je to podobné jako u textových modelů. V jejich případě však nemluvíme o patchích, ale o tokenech. Ty mohou být, slabikami, slovy a nebo dokonce celými větami.

OpenAI sora patche a analyza 2031x378x

Open AI Sora analyzuje videa a obrázky, které rozkládá na patche a z nich pak vytváří nové AI video, zdroj: openai.com/sora

Patche Sora analyzuje a právě tak se učí, jak vypadají různé objekty, scény a akce z reálného světa. Když potom dostane zadání vytvořit něco nového, použije to, co se naučila, aby vytvořila patche, které pak poskládá dohromady jako puzzle. Výsledkem je nové video nebo obrázek, který odpovídá vašemu popisu.

Máme se začít bát?

Sory se zatím nemusí bát ani Hollywood a ani my. Je totiž zatím pouze výzkumným nástrojem, který Open AI drží pod svou kontrolou. My si tak ještě nějakou dobu vlastní videa ve vysokém rozlišení generovat nebudeme. A kvůli omezení, jako je nemožnost přesně predikovat výsledek a chybám, které se ve videích objevují, ji asi nenasadí ani filmová studia. To se ale může brzy změnit. Open AI totiž o zpřístupnění technologie uvažuje. Musí ale prý nejprve vyřešit bezpečnost. Na svých stránkách Open AI doslova uvádí:

„Před zpřístupněním Sory v produktech OpenAI podnikneme několik důležitých bezpečnostních kroků. Spolupracujeme s členy red teamu – odborníky v oblastech jako jsou dezinformace, nenávistný obsah a předsudky – kteří budou model testovat. Zároveň vyvíjíme nástroje, které pomohou detekovat zavádějící obsah. Bude k nim patřit i detektor, který dokáže rozpoznat videa vygenerovaná Sorou.“

Bohužel je tu ale faktor, který by nás měl vést minimálně k opatrnosti. Už jsme si vyzkoušeli, že pro zmatení veřejnosti stačí i „obyčejné“ Deepfake video. A pro jeho tvorbu není třeba nejmodernější AI ani extrémně výkonný HW. A také víme, že už dnes může mít a rozvíjet vlastní AI model prakticky kdokoli. Nemůžeme si tak být jistí, že někde nevzniká podobný model jako je Sora, který podobnému opatrnému postupu nepodléhá, nebo je k výrobě desinformačních materiálů rovnou cvičen. Opatrnost při konzumaci médií na internetu je tak rozhodně na místě.

Co ještě AI Sora dokáže?

Z hlediska výroby AI videí toho umí Sora ještě víc, než jen zhmotnit slovy zadanou představu. Dokáže také rozpohybovat existující obrázek (třeba vaši fotografii), nebo prodloužit existující videoklip. Problém modelu nedělá ani editace existujících videí. Dokáže je spojovat, nebo úplně změnit prostředí scény.

Originální video automobilu na projížďce, zdroj: openai.com

AI video po úpravě se zadáním „změň prostředí na bujnou džungli“, zdroj: openai.com

Výsledky jsou úchvatné a děsivé zároveň. Poměrně překvapivě Sora konkuruje i svému staršímu bratříčkovy Dall-E v oblasti generování obrázků. Celou plejádu ukázek si pro vás Open AI připravila na těchto stránkách. Pokud se tam vydáte, tak určitě nepřehlédněte možnost, vybrat si u jednotlivých ukázek různá nastavení. Automobil například můžete nechat jet třeba mezi dinosaury, nebo také ve vesmíru, anebo na dně oceánu. S AI je prakticky jediným limitem vaše fantazie.

AI video zatím není dokonalé

Open AI otevřeně komunikuje nejen úspěchy, ale i limity nové technologie. Především se jedná o omezení v simulaci fyziky materiálů a interakcí. Jako příklad uvádí, že se skleněné předměty po pádu nerozbijí, nebo že občas nemizí jídlo, které někdo v záběru jí. Sem tam se navíc ve videích některé objekdy spontálně objevují i když chyběly v předchozích snímcích videa.

Společnost ale dodává, že tyto neduhy časem vymizí v důsledku růstu velikosti podobných modelu. Sora tak má potencil v budoucnosti sloužit nejen pro generování videa, ale také pro simulace reálného světa. Určitě se máme na co těšit.

Zdroje: openai.com, openai.com, zive.cz, unbox.ph, twitter.com, twitter.com

Od malička pohlcený technologiemi, zvukem a obrazem. Nejraději je, když sedne doma u filmu. Pak ostatní otravuje řečmi o tom, že je domácí kino lepší než multiplex.

Komentáře

Hifimánie.cz

Přidat komentář

Pro komentování se musíte přihlásit

Tmavý režim