Az Odyssey új mesterséges intelligencia modellje interaktív videók streamingjére specializálódott, lehetővé téve a felhasználók számára, hogy egyedi élményekben vegyenek részt.

Az önvezető autók területéről érkező alapítók olyan MI-platformon dolgoznak, amelynek révén a néző valós időben fedezhetné fel a videófolyamokban megjelenő világot.
Az Odyssey, egy 2023 óta működő innovatív kaliforniai startup, új irányt mutat a filmes tartalmak és szerkeszthető 3D-s jelenetek létrehozásában. Fejlesztésük célja, hogy egy olyan vizuális mesterséges intelligencia platformot hozzanak létre, amely lehetővé teszi a felhasználók számára, hogy aktívan interakcióba lépjenek a streamelt videókkal. A héten a cég bemutatta legújabb, korai fázisú demóanyagát, amelyben a tervek szerint mindössze 40 milliszekundumos válaszidővel generálnák a képkockákat. Az élmény hasonlít egy 3D-s videojáték felfedezéséhez, ahol a nézők a megszokott vezérlők segítségével navigálhatnak a videó különböző területein, ezzel pedig azonnali és dinamikus hatásokat érhetnek el a megjelenített tartalmakban.
A bejegyzésben említett modell "a világ aktuális állapotát" reprezentálja, és célja, hogy a bejövő műveletek és azok előzményei alapján előre jelezze a jövőbeli helyzeteket. Külön figyelmet fordít arra, hogy fenntartja a térbeli konzisztenciát, miközben legalább 5 percen keresztül folytonos és koherens videófolyamokat biztosít. A TechCrunch által közölt információk szerint a hasonló "világmodellek" iránti érdeklődés számos fejlesztői csapatot motivál, akik óriási potenciált látnak bennük az interaktív média és a realisztikus szimulációk világában. Ugyanakkor a kreatív ipar szakemberei vegyes érzésekkel viseltetnek a technológia iránt, hiszen sokan attól tartanak, hogy ez a fejlődés munkahelyek tömeges megszűnéséhez vezethet. Az Odyssey projekt bizonyos mértékig igyekszik enyhíteni ezeket a félelmeket.
Az interaktív videó új dimenziókat nyit meg a szórakoztatás világában, lehetőséget adva olyan formák felfedezésére, amelyek a hagyományos videós tartalmak következő evolúciós lépcsőjét jelenthetik. Ezek a valós időben működő világmodellek lehetővé teszik, hogy egyedi és igény szerint generált történetek keljenek életre, mindezt a klasszikus produkciók megszorításaitól és költségeitől mentesen. Nem meglepő, hogy a kreatív ipar szereplői óvatosan közelítik meg az ilyen jövőbeli elképzeléseket, hiszen ezek az új megoldások közvetlenül az ő munkájukra támaszkodnak. Bár az Odyssey demói jelenleg még kezdetlegesek és instabilak, a cég ambiciózus fejlődési terveket vázolt fel, ami remélhetőleg hamarosan új lehetőségeket hoz a szórakoztatás területén.
A látvány lenyűgöző, de a működő világmodell sajnos nem biztosított.
A vállalkozás eddig lenyűgöző 27 millió dollárt gyűjtött össze a befektetőktől, és igazgatóságában olyan neves szakemberek ülnek, mint a Pixar egyik alapítója és a Walt Disney Animation Studios korábbi elnöke. Jelenleg a technológia képes 30 képkocka/másodperc sebességgel streamelni a videókat Nvidia H100 GPU-kból álló klasztereken keresztül, ami a vállalat saját állítása szerint felhasználói szinten óránként mindössze 1-2 dolláros költséget jelent. Az igazi áttörés azonban az, hogy az Odyssey egy radikálisan eltérő megközelítést alkalmaz, mint más mesterséges intelligencia laborok, amelyek a világmodellek fejlesztésére összpontosítanak: a vállalat egy 360 fokos, hátizsákra rögzíthető kamerarendszert tervezett, amely lehetővé tenné a valós tájak rögzítését, és ez szolgálna alapul a nyilvános adatokon betanított, egyre kifinomultabb modellek számára.
Az Odyssey közleménye világosan kifejti, hogy nem egy már megoldott kutatási problémáról van szó, és csak idő kérdése, hogy milyen formában fog megnyilvánulni a minőség fokozatos javulása. Egyes vélemények szerint ez a megközelítés eleve kudarcra van ítélve, mivel bár képes lehet látványos videók létrehozására, a "világszimuláció" számtalan, előre nem látható lehetősége már olyan absztrakciós szintek meglétét igényli, amelyek megkövetelik az irreleváns részletek válogatás nélküli elemzését. Mindazonáltal figyelemre méltó, hogy az új megoldások a korábban rögzített képkockák halmazainak egyidejű létrehozása helyett képkockánként reagálnak a történésekre, ezzel nyitottá téve a videók fejlődését.