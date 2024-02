Text to Video Sora: Warum das neue Projekt von OpenAI in aller Munde ist

Das "Text to Video"-Programm Sora stellt schon vor seiner Veröffentlichung Branchen auf den Kopf. (elm/spot)

SpotOn News | 27.02.2024, 13:34 Uhr

Sora ist nach ChatGPT der nächste große Wurf von OpenAI in Sachen Künstlicher Intelligenz. Warum es gerade kaum ein heißeres Thema in der Tech-Branche gibt.

Das "Text to Video"-Programm Sora des Unternehmens OpenAI ist zwar noch nicht frei zugänglich, doch es beherrscht seit seiner Präsentation vor wenigen Tagen die Schlagzeilen. Mit einfachen Eingabeaufforderungen lassen sich fotorealistische Videos generieren, die bei vielen Menschen gleichzeitig Begeisterung und Sorge auslösen. Ein Beispiel von vielen ist Hollywood-Produzent Tyler Perry (64), der die Präsentation von Sora so beeindruckend fand, dass er den 800-Millionen-Dollar-Ausbau seines Studios auf unbestimmte Zeit auf Eis gelegt hat. Warum Sora derzeit so von sich reden macht.

Einen Zeitplan für den Release von Sora gibt es ausdrücklich nicht, teilt das KI-Unternehmen OpenAI bei der Präsentation seines neuen Stars mit. Man scheint sich der Potenziale der videogenerierenden KI bewusst zu sein – und damit auch ihrer Gefahren. Denn Sora ist dazu in der Lage, mit einfachen Aufforderungen wie "Die Sicht einer Ameise auf dem Weg durch ihr Nest" Videos zu generieren, die täuschend echt und nicht mehr auf den ersten Blick als KI-Produkt zu erkennen sind.

"pov footage of an ant navigating the inside of an ant nest" Video generated by Sora pic.twitter.com/N3Ik9QBinU — Aditya Ramesh (@model_mechanic) February 18, 2024

Ohne auch nur von seinem Computer aufstehen zu müssen, lassen sich so Videos von allem erzeugen, was wir uns nur vorstellen und in Worte kleiden können. Die kreativen Beispiele von Soras Betatestern sind schon jetzt faszinierend, und wie immer bei diesen Technologien muss man sich vor Augen führen: Der jetzige Zustand ist der schlechteste, in dem die Technik je sein wird. Für viele Menschen ist genau diese Aussicht jedoch bedenklich. Wie kann man sich vor den Gefahren der Technologie schützen, wo Deepfakes doch schon heute ein echtes Problem sind?

Hollywood-Star schlägt Alarm: "Ohne Regeln kein Überleben"

Die Videos von Sora werden zwar mit einem Wasserzeichen ausgespielt, doch ein solches lässt sich einfach herausschneiden. Daher werden die Rufe in Richtung OpenAI laut, Sora erst dann der Öffentlichkeit zugänglich zu machen, wenn sich die gesamte Tech-Industrie auch auf einen Standard für ein digitales Wasserzeichen geeinigt hat, das KI-Videos zweifelsfrei als solche kenntlich macht. Andere Stimmen meinen, man könne der anstehenden Flut von KI-Content nur Herr werden, indem man weitere KIs darauf trainiert, generierte Videos als solche zu erkennen.

Das Potenzial von Sora ist indes so groß, dass ganze Branchen aufhorchen. Wer braucht in Zukunft Anbieter von Stock-Material, wenn man die Wunschbilder einfach diktieren kann? Wie steht es um den Berufsstand der Kameraleute, Schnitttechniker, Maskenbildner oder Schauspieler, wenn eine KI sie einfach aus Einsen und Nullen nachahmen kann? Was bedeutet eine solche Technik für Urheberrechte derjenigen Videos, mit denen die KI trainiert wurde? Hollywood-Produzent Perry meint im Interview mit "The Hollywood Reporter": "Wir brauchen Regulierungen, sonst sehe ich nicht wie wir überleben können."

Ist Sora Teil einer viel fähigeren KI?

Sora ist derzeit außerdem der Anlass für Spekulationen, dass OpenAI womöglich bereits eine Allgemeine Künstliche Intelligenz (AGI) erschaffen haben könnte. Sora wäre demnach nur ein kleiner Teil einer wesentlich fähigeren KI. In Userforen und auf Tech-Blogs wird beispielsweise diskutiert, dass Sora ein fundiertes Verständnis für physikalische Zusammenhänge haben müsse, um die Videos in der gezeigten Konsistenz darstellen zu können. Technisch müsse dahinter mehr stecken als OpenAI bislang mitgeteilt habe. Außerdem hat OpenAI mit "Jukebox" bereits das nächste Projekt in der Pipeline, das Musik komponieren und Töne erzeugen kann, was ein weiterer Hinweis auf die Existenz einer noch fähigeren KI sei.

Bislang sind das jedoch Spekulationen, die OpenAI-CEO Sam Altman (38) in der Öffentlichkeit weder bestätigt noch dementiert. Ganz entschieden dementierte er am Wochenende allerdings die Darstellung des "Wall Street Journal", er wolle bis zu sieben Billionen Dollar an Geldern sammeln, um Chipfabriken zu errichten und habe hierzu Pläne in den Arabischen Emiraten vorgestellt. Auf einer Veranstaltung des Chipherstellers Intel verneinte Altman ein solches Vorhaben. Richtig sei, dass viel Geld investiert werden müsse, um eine Technik, die die Zukunft zum Besseren wenden werde, an die Menschen zu bringen.