Apple veröffentlicht den Prototyp eines Tools für künstliche Intelligenz, das Bilder auf der Grundlage von Textbeschreibungen animiert
Apples interne Forscher haben Keyframer vorgestellt, den Prototyp eines KI-gestützten generativen Animationstools, mit dem Sie 2D-Bildern Bewegung hinzufügen können, indem Sie beschreiben, wie sie animiert werden sollen.
In einem Forschungspapier erklärte Apple, dass große Sprachmodelle (Large Language Models, LLMs) für die Animation “zu wenig erforscht” sind, obwohl sie ihr Potenzial in anderen kreativen Medien wie der Schrift und der Bilderzeugung bewiesen haben. Das LLM-basierte Keyframer-Tool wird als eines der Beispiele für die Anwendung der Technologie vorgestellt, berichtet The Verge.
Unter Verwendung von OpenAIs GPT4 als Basismodell kann Keyframer skalierbare Vektorgrafikdateien (SVG) akzeptieren – ein Illustrationsformat, das ohne Qualitätseinbußen verändert werden kann – und CSS-Code generieren, um Bilder auf der Grundlage von Textanweisungen zu animieren. Der Benutzer lädt ein Bild hoch, gibt eine Aufforderung wie “Lass die Sterne funkeln” ein und klickt auf die Schaltfläche Erzeugen. Die in der Studie angeführten Beispiele zeigen, wie die Illustration des Saturn zu verschiedenen Hintergründen wechseln kann oder wie Sterne im Vordergrund verschwinden und wieder auftauchen.
Benutzer können mehrere Animationsdesigns in einem einzigen Paket erstellen und Eigenschaften wie Farbcodes und Animationsdauer anpassen. Es sind keine Programmierkenntnisse erforderlich, da Keyframer diese Änderungen automatisch in CSS umwandelt, obwohl der Code selbst vollständig editierbar ist.
Es ist jedoch noch ein langer Weg zu gehen. Keyframer ist noch nicht öffentlich verfügbar, und an der Nutzerstudie für das Forschungspapier von Apple nahmen nur 13 Personen teil, die beim Experimentieren mit dem Tool nur zwei einfache, vorab ausgewählte SVG-Bilder verwenden konnten.
Apple weist auch auf die Grenzen des Programms hin und betont, dass Keyframer sich auf Web-Animationen wie Ladesequenzen, Datenvisualisierungen und animierte Übergänge konzentriert. Im Gegensatz dazu ist die Animation, die man in Filmen und Videospielen sieht, zu komplex, um sie allein mit Beschreibungen zu erstellen – zumindest noch nicht.