Google hat neue Funktionen für seine KI-gestützten Tools zur Audio- und Videoerstellung vorgestellt. Die Updates betreffen unter anderem die Plattformen Imagen 3, Veo 2, Chirp und Lyria. Mit diesen Neuerungen zielt Google darauf ab, im Markt der generativen KI-Tools für Unternehmen konkurrieren zu können.
Neuerungen in Google Imagen 3 und Veo 2
Die aktualisierte Version von Imagen 3 bietet verbesserte Möglichkeiten zur Bilderzeugung, einschließlich einer erweiterten Inpainting-Funktion, die das Rekonstruieren fehlender oder beschädigter Bildteile erleichtert. Auch das Entfernen von unerwünschten Objekten aus Fotos wird durch die neuen Features vereinfacht.
Bei Veo 2, dem KI-Tool zur Videoerstellung, gibt es zahlreiche neue Bearbeitungs- und Anpassungsoptionen für visuelle Effekte. Nutzer können spezifische Kamerawinkel in KI-generierten Szenen angeben und die Geschwindigkeit anpassen, um Zeitraffer oder Drohnenaufnahmen zu erstellen. Das Tool kann außerdem zwischen festgelegten Anfangs- und Endbildern interpolieren.
Mit Veo 2 können nun auch Hintergründe, Logos und Objekte aus bestehenden Videos entfernt sowie der Bildausschnitt von Videoaufnahmen erweitert werden. Diese neuen Funktionen stehen derzeit als Vorschau für Unternehmenskunden zur Verfügung und sollen es erleichtern, filmisch ansprechende Videos zu erstellen.
Updates für Lyria und Chirp 3
Lyria, ein KI-Modell zur Musikgenerierung, wurde ebenfalls in privater Vorschau mit einer Whitelist im Vertex AI Media Studio bereitgestellt. Das Tool ermöglicht die Erstellung vollständiger, produktionsfertiger Musikstücke basierend auf einem Textprompt und dient als Hintergrundmusik für mit Veo 2 generierte Videos.
Zusätzlich hat Google eine Funktion namens „Instant Custom Voice“ für sein Sprachsynthese-Modell Chirp 3 eingeführt. Diese Funktion kann realistische benutzerdefinierte Stimmen aus nur 10 Sekunden Audioeingabe erzeugen. Das Tool trennt und identifiziert einzelne Sprecher in Mehrspuraufnahmen für genauere Transkriptionen.
Es ist erwähnenswert, dass Google alle von den genannten KI-Tools generierten Medien mit der SynthID-Technologie kennzeichnet. Die generativen KI-Modelle verfügen über „eingebaute Schutzmaßnahmen“, um die Erstellung von schädlichen Inhalten zu verhindern.