Eine neue KI-Technologie der US-Startup Odyssey erlaubt es Nutzer*innen, computergenerierte Welten in Echtzeit zu erkunden – vollkommen dynamisch, auf Basis von Text- oder Bildeingaben. Hinter dem Projekt steht niemand Geringeres als Pixar-Mitgründer Edwin Catmull, was die Wucht der Vision unterstreicht: Die Zukunft des Entertainments könnte genau hier beginnen.
KI-Welten, die sich in Echtzeit verändern

Gegründet wurde Odyssey von den Ingenieuren Oliver Cameron und Jeff Hawke, unterstützt von Catmull. Ihre Technologie basiert auf sogenanntem „interaktivem Video“: eine Mischung aus generativer KI, 3D-Rendering und freier Bewegung, ähnlich wie in einem First-Person-Videospiel. Die Steuerung erfolgt klassisch über die Tasten W, A, S und D.
Technisch läuft alles über ein Netz aus H100-GPU-Clustern, verteilt zwischen den USA und Europa. Diese liefern genug Rechenleistung, um Umgebungen in Echtzeit zu erzeugen. Nutzer*innen geben Text oder Bilder ein, die dann in Szenen verwandelt werden – kompatibel mit gängigen Engines wie Unreal oder Blender.
Die visuelle Qualität? Noch rudimentär. Vergleichbar mit einem verschwommenen Google Street View. Einige Objekte verhalten sich physikalisch korrekt, andere nicht. Türen werden manchmal zu Wänden, Wände zu Portalen. Doch gerade diese Unvollkommenheit erzeugt eine seltsame Faszination: Man befindet sich in einem Ort, der zuvor nicht existierte – und der aufhört zu existieren, sobald man ihn verlässt.
Ein Vorgeschmack auf immersive Erzählkunst
Introducing AI video you can watch and interact with, in real-time!
Powering this is a new world model that imagines and streams video frames every 40ms(!). No game engine in sight.
We call it interactive video, and it's free for anyone to try right now (GPUs permitting)! pic.twitter.com/QtADRXCQ8z
— Odyssey (@odysseyml) May 28, 2025
Trotz visueller Unruhe und unvorhersehbarer Kollisionen spricht Edwin Catmull von einem technologischen Wendepunkt. Sein Ziel: Künstliche Intelligenz soll Kreative nicht ersetzen, sondern ihnen neue Möglichkeiten geben. Die Technologie soll der Geschichte dienen, nicht umgekehrt.
Aktuell bietet Odyssey drei frei zugängliche Umgebungen: einen Wald mit Hütte, ein Einkaufszentrum und einen Parkplatz vor einem Gebäude. Jede Session dauert zweieinhalb Minuten – Wiederholungen sind unbegrenzt möglich. Noch kann das System weder Videospiele noch Filme ersetzen, doch es markiert den Anfang einer neuen Form des Storytellings. Einer, bei der die Fantasie der Nutzer*innen zum Schlüssel für völlig neue Welten wird.