Das Neuronale Netzwerk Hat Gelernt, Videos Basierend Auf Der Beschreibung Von - Alternative Ansicht

Das Neuronale Netzwerk Hat Gelernt, Videos Basierend Auf Der Beschreibung Von - Alternative Ansicht
Das Neuronale Netzwerk Hat Gelernt, Videos Basierend Auf Der Beschreibung Von - Alternative Ansicht

Video: Das Neuronale Netzwerk Hat Gelernt, Videos Basierend Auf Der Beschreibung Von - Alternative Ansicht

Video: Das Neuronale Netzwerk Hat Gelernt, Videos Basierend Auf Der Beschreibung Von - Alternative Ansicht
Video: Neuronale Netze - Grundlagen 2024, Kann
Anonim

Künstliche Intelligenz erstellt geskriptete Videos - bisher kurz und verschwommen, aber eines Tages wird sie allein ein ganzes Filmstudio ersetzen.

Neuronale Netze sind bereits recht gut (und in vielen Fällen besser als Menschen) darin, Muster in einem Bild zu erkennen, und können ganze Szenen allgemein beschreiben. Generative neuronale Netze führen die umgekehrte Transformation durch und können basierend auf ihrer Beschreibung ein Bild erzeugen oder den nächsten Rahmen basierend auf den vorherigen vorhersagen.

Die belgischen Entwickler sind noch weiter gegangen und haben diese Funktionen in einem einzigen System kombiniert, das Videos "aus dem Nichts" erstellt, basierend auf ihren eigenen Erfahrungen mit maschinellem Lernen und Skripttext. Tinne Tuytelaars sprach darüber auf einem Treffen der Vereinigung zur Förderung der künstlichen Intelligenz (AAAI) in den Vereinigten Staaten.

Das neuronale Netzwerk arbeitet in zwei Stufen - so Tinne, als würde es den kreativen Prozess einer Person imitieren: In der ersten Stufe wird eine verschwommene, ungefähre "Skizze" jedes Rahmens gebildet, wonach Details spezifiziert und hinzugefügt werden. Einer der wichtigen Teile eines solchen Systems ist ein diskriminierendes neuronales Netzwerk, das das Ergebnis mit "echten" Videos vergleicht, die zu einem bestimmten Szenario passen, und es Ihnen ermöglicht, seine Qualität zu bewerten und die Arbeit des generativen Teils des Systems zu verbessern.

Das neuronale Netz wurde an 10 Szenen trainiert ("Golf spielen auf dem Rasen", "Kitesurfen im Meer" usw.) und lernte, Aktionen und Umstände voneinander zu trennen und sie auch auf eine bestimmte Weise zu kombinieren, um beispielsweise Videos zu erstellen "Golf im Pool":

Image
Image

oder "Segeln im Schnee":

Image
Image

Werbevideo:

Natürlich ist die Qualität solcher Animationen noch lange nicht akzeptabel: "Videos", die etwa eine Sekunde dauern, bestehen aus nur 32 Bildern mit einer Größe von 64 x 64 Pixel.

Mit der gleichen Zuversicht kann jedoch garantiert werden, dass sich diese Zahlen rasch verbessern, da das Kino selbst vor nicht allzu langer Zeit nur ein schlammiges, zuckendes und dummes Bild aufweisen konnte. Wenn ein solches neuronales Netzwerk wirklich schnell und effizient aufgebaut werden kann, könnte Hollywood ein Ende haben: Es wird ausreichen, das Drehbuch zu übernehmen, und der Film ist fertig. Diese Möglichkeit wird nützlich sein, um große Mengen zum Trainieren anderer neuronaler Netze zu generieren und neue Algorithmen zum Komprimieren und Übertragen von Streaming-Videos zu erstellen.

Sergey Vasiliev

Empfohlen: