OpenAI

Sora von OpenAI - die KI kann jetzt auch Video

Diese Frau existiert nicht – sie ist ein Produkt der KI Sora von Open AI. (c) Open AI

17.02.2024 um 08:26

Drucken

Es war nur eine Frage der Zeit, bis Open AI wieder alles auf den Kopf stellt. Nach Text und Bild kann die KI nun auch aus Textvorgaben Videos erstellen.

Daenerys und Jon Snow stehen der überwältigenden Armee des Eiskönigs gegenüber. Im Hintergrund nähern sich die Drachen. Cersei hält sich im Hintergrund, unsicher, ob sie etwas davon hätte, wenn sie einschritte. Es ist nur eine Möglichkeit, wie die Kultserie „Game of Thrones“ hätte enden können. Bis zu diesem Tag ging man immer davon aus, dass die Wünsche nach einem alternativen Serienende unerfüllt bleiben. Schon bald könnte sich jeder sein eigenes Serien- und Filmende selbst basteln. Die künstliche Intelligenz ist dabei, das für immer zu ändern.

Im November 2022 hat das kleine Start-up Open AI aus dem Silicon Valley die Welt mit Chat GPT auf den Kopf gestellt. Plötzlich konnten wir mit einer Maschine sprechen. Ihr in kurzen Sätzen sagen, was sie für uns tun soll. Diese sogenannten Prompts sind zwar eine Sache für sich und benötigen Übung. Aber sie machen möglich, dass eine KI Texte erstellt, einen Programmiercode schreibt, Mathematikhausaufgaben erledigt oder unsere kreativen Ideen in farbenprächtige Bilder umwandelt. Und während noch über gesetzliche Rahmenbedingungen, gesellschaftliche Folgen diskutiert wird, laufen die Entwicklungen im Eiltempo weiter.

Es war nur eine Frage der Zeit, bis Open AI eine KI präsentiert, die Bewegtbilder generieren kann. Am Donnerstagabend war es dann so weit. Chef des KI-Start-ups, Sam Altman, teilte auf X die ersten Ergebnisse mit der Welt.

Wer denkt heute bei Corona noch an Bier?

Das Meinungsforschungsinstitut Sora, das hierzulande stark mit Wahlen und Analysen verknüpft ist, bekommt Konkurrenz. Es ist nur eine Frage von Wochen, bis Sora von Open AI bekannter sein wird als das 1996 gegründete Institut. Vielleicht kann die belgische Brauerei Anheuser-Busch helfen, denn wer denkt heute bei Corona noch an Bier?

Doch zurück zur KI: Sora entspringt einem Forschungsprojekt innerhalb von Open AI. Und es ist bei Weitem noch nicht perfekt oder gar ein Konkurrent für ein Filmstudio. Das fängt bei der Länge der Videos an. Das Maximum liegt derzeit bei einer Minute. Außerdem gibt es noch zahlreiche Fehler, wie Open AI selbst einräumt und dabei das Video von einem Mann auf einem Laufband zeigt. Doch leider läuft der Mann noch in die verkehrte Richtung und vom Laufband weg. Nur eines der kleinen Hoppalas, mit denen die KI noch zu kämpfen hat.

Außerdem scheint man bei Open AI auch ein bisschen überlegter vorzugehen. Bevor das Programm vollumfänglich allen zur Verfügung gestellt wird, hat Open AI den Zugang reguliert. Immerhin ist Sora noch bei einem Spezialteam, das es aktuell auf Schäden oder Risiken untersucht. Auch auf Vorurteile wird die KI abgeklopft, denn: Ein System ist nur so gut wie die Vielfalt der Trainingsdaten, auf dem es beruht. „Wir gewähren auch einer Reihe von Künstlern, Designern und Filmemachern Zugang, um Feedback darüber zu erhalten, wie das Modell für Kreative am hilfreichsten sein kann“, heißt es auf der Webseite.

Die von Open AI veröffentlichten Videos sind beeindruckend. Von der Bandbreite ganz zu schweigen. Es gibt ein Video von einer Frau, die durch eine von Neonschildern beleuchtete japanische Stadt spaziert, bis hin zu Mammuts, die durch eine verschneite Landschaft laufen. Das erste Beispiel beinhaltet den Prompt, also die Vorgabe, dass die Frau eine Lederjacke und ein rotes Kleid tragen soll. Die Straße soll an Tokio erinnern und viele Neonleuchtreklamen haben, die sich zudem in Lacken spiegeln. Open AI betont, dass die Bilder nicht nachbearbeitet wurden. Um sich besser vorstellen zu können, wie das funktioniert, hat Open AI die Prompts den Videos beigefügt. Ein kluger Schachzug, denn so können Interessierte auch gleich sehen, wie solche Anweisungen zu schreiben sind, um möglichst gute Videos zu erstellen. Und je mehr Videos mit Sora erstellt werden, umso besser wird die KI. Doch noch steht nicht fest, wann die KI der breiten Öffentlichkeit zur Verfügung gestellt wird. Denn Open AI zeigt auch, was für Fehler noch passieren können. Sora ist nämlich noch in einem recht frühen Entwicklungsstadium. So hat sie auch noch ein paar Schwierigkeiten mit den Regeln der Physik und der Logik. Aber auch Kausalzusammenhänge versteht sie nicht immer: So könne es laut Open AI passieren, dass jemand von einem Keks abbeißt, aber der Keks einfach nicht kleiner wird.

Gefahr von Missbrauch entgegenwirken

Lehrer fürchten, dass sie bei schriftlichen Arbeiten nicht erkennen können, ob dies eine Eigenleistung ist oder ob die KI nachgeholfen hat. Noch sind jene KI-Programme, die die KI aufspüren soll, nicht sonderlich zuverlässig. Doch nicht nur das Bildungswesen steht vor einem Umbruch: Wir leben in einer Zeit, in der wir unseren Augen und Ohren nicht mehr trauen können. Und je besser die Systeme werden, umso schwieriger wird es, echt und falsch zu unterscheiden. Dieser Verantwortung scheint sich Open AI bewusst.

Es sind Sicherheitsvorkehrungen geplant, um das Risiko des Missbrauchs zu minimieren. So gelten dieselben Regeln wie für Chat GPT und die Bild-KI Dall-E. Völlig verhindern wird sich Missbrauch nicht lassen, so realistisch muss man sein. Aber Open AI macht es jenen, die es versuchen, schwerer: „Wir werden mehrere wichtige Sicherheitsschritte implementieren, bevor wir Sora verfügbar machen“, heißt es vom Unternehmen. Das oben erwähnte Spezialteam wird Sora in den kommenden Tagen gezielt angreifen, um es auf Schwachstellen zu überprüfen. „Wir entwickeln auch Tools, um irreführende Inhalte auszumachen, wie z. B. einen Erkennungsklassifizierer, der sehen kann, wann ein Video von Sora generiert wurde. Wir planen, in Zukunft C2PA-Metadaten einzubeziehen, wenn wir das Modell in einem Open-AI-Produkt einsetzen.“

Beginn einer neuen Stummfilm-Ära

Bei dieser Form der Metadaten handelt es sich um einen offenen Standard, der Medien digital kennzeichnet. Darüber wird auch die Herkunft verifiziert. Einige Kameras und selbst Meta (Facebook) verwenden den Standard bereits. Die Abkürzung C2PA steht für Coalition for Content Provenance and Authenticity. Dieser Initiative gehören Adobe, Canon, Microsoft, aber auch die „New York Times“ an.

Damit kommt Open AI einer der zentralen Forderungen des „AI Act“ der Europäischen Union nach, welche fordert, dass KI-Inhalte – egal, ob Text, Bild oder Video – künftig gekennzeichnet sind.

Fest steht: Open AI stellt einmal mehr die Welt auf den Kopf. Die Videos sind trotz des frühen Entwicklungsstadiums beeindruckend. Doch noch hat Sora keine Stimme, die Videos sind stumm. Sobald Sora und Chat GPT miteinander verbunden sind, stellt das allerdings kein Problem mehr dar. Filmstudios müssen künftig noch bessere Arbeit liefern, denn bald haben alle ein Filmstudio auf ihrem Handy.

Lesen Sie mehr zu diesen Themen:

Tech
Kultur