Datum zveřejnění: 
26. 3. 2026
Americká společnost Open AI ukončí svou aplikaci Sora. Uživatelé v ní pomocí umělé inteligence vytvářeli videa. Společnost tak ukončí i nedávno podepsané partnerství se studiem Disney. Britskému deníku BBC sdělila, že by se dál chtěla zaměřit na jiné oblasti vývoje, jako je robotika. Téma pro následující minuty a našeho dalšího hosta Jakuba Marečka, výzkumníka z Centra umělé inteligence Fakulty elektrotechnické ČVUT. Vítejte ve vysílání.

Co se tedy tímto krokem změní na poli AI generátorů videí?

Tak komunita uživatelů přichází o nejdokonalejší model ve smyslu práce s fyzikou tak, jak teď je vytvořeno na ukázce, práce s fyzikou kapalin, práce s komplexními scénami. Z druhé strany je asi dobré říct, že Sora byla milníkem v době, kdy vyšla, v roce 2024, a dneska mimo některé ty otázky simulace složitější fyziky a hodně složitých scén, tak vlastně ji dotáhly i modely, které je možné provozovat doma nebo podobně, které mají otevřené váhy.

Podle Forbesu se společnost OpenAI potýkala s problémem, jak tu aplikaci Sora zpeněžit. Jak nákladné je tedy pro společnost vyrobit AI video?

Očekává se, že ta cena generování jednoho videa o délce 10 sekund je zhruba 1,5 dolaru, když se uvažují náklady na ten výpočetní hardware na otevřeném trhu. To znamená, že například u Amazonu, Microsoftu nebo podobně kdyby si člověk chtěl zakoupit ten výpočetní čas, to by celkově odpovídalo třeba 5 mld. dolarů za rok při tom rozsahu použití,kteý Sora dneska těm uživatelům při tom rozsahu použití nabízí.

Proč je vygenerování videa oproti například obrázku nebo textu vlastně obecně nákladnější?

Tak bezprostředně proto, protože je to větší objem dat jak ve smyslu toho výstupu, tak ve smyslu toho, jak velký je ten model, který je potřeba i pro ty relativně jednoduché výstupy. Zatímco u těch textových výstupů je možné čekat, že i menší model pro nějakou běžnou konverzaci, nikoliv nějaké dlouhodobější plánování složitějších výstupů, může být i pro menší modely možné. Tak to generování toho videovýstupu ještě ve vyšším rozlišení vyžaduje velké modely.

Sora se také potýkala s etickými problémy a problémy s porušováním autorských práv. Co konkrétně společnosti způsobovalo ty problémy? Mohl to být další aspekt, proč se rozhodly zrušit tu aplikaci?

Určitě. Tak já myslím, že na straně Open I to rozhodování bylo asi vedené spíš než bezprostředně těmi operačními náklady, tou úvahou právě tady těch právních rizik s tím modelem spojených, což je dané tím, že alespoň pro nějaké uživatele může být veckterý ten video výstup velice citlivý a ta Sora v té technologii skenování obličeje to generování odvržených videí tzv. deep fakes umožňovala velice komfortně, zatímco pokud někdo chce generovat ty deep fakes modely s otevřenými váhami, tak potřebuje poměrně netriviální technologii na to, aby si dobře nasnímal z mnoha stran ten obličej, aby si ten model rozchodil. Tak Sora vlastně tohleto umožňovala po stažení aplikace dost automaticky.

Dohody Sory a Disney se kvůli většímu zapojování umělé inteligence v umění obával filmový průmyslu. Jakou hrozbu tedy pro ně představuje umělá inteligence?

Pro filmový průmysl určitě umělá inteligence představuje i příležitost i hrozbu. Ve smyslu příležitosti rekonstrukce 3D modelů z nějakých obrazových dat, to už používá filmový průmysl nějakou dobu, a to rozhodně zjednodušuje, zlevňuje vytváření sofistikovaných animací, vizualizací. Z druhé strany pro ten filmový průmysl ve smyslu tisíců animátorů pokud by ty animace to zjednodušilo mnoho, tak je možné čekat, že bude ten přínos spíš třeba u scenáristů než u těch animátorů nebo podobně. Ale to myslím, že pro ten filmový průmysl není nutně takové riziko, protože ten scénář je i u mnoha těch animovaných filmů velice důležitý.

Na závěr možná otázka, kterou se vracíme zase na začátek a to jaké AI generátory videí budou podle Vás po ukončení Sory nejvíc využívané? Můžu zmínit, že v únoru například přišla čínská firma, která vlastní TikTok s novou aplikací See Dance. Tak půjde to tímhle směrem?

Tak já myslím, že pro filmové profesionály to v nějakém okamžiku musel být velký šok, zejména když přišla Sora v tom roce 24, ale dneska je to velká příležitost, protože se strojem za čtvrt milionu dokáží generovat velice přesvědčivé video rychleji než kdy předtím. A pro pro ně může být jednodušší používat ty modely s otevřeným kódem, ať už tedy na nějakém cloudu nebo na nějakém domácím stroji, zatímco pro ty běžné uživatele je dneska dostupná možná desítka poměrně kvalitních alternativ k Soře ve smyslu těch aplikací, často s nějakým takovým modelem, kde po nějaké době se čeká, že začnou platit generování třeba delších videí nebo podobně.

Říká Jakub Mareček, výzkumník z Centra umělé inteligence Fakulty elektrotechnické ČVUT Díky za Váš čas a přeju hezký den.
 

Zdroj: 
ČT24