KI: Google verbessert Tools für Audio- und Video

Google hat neue Funktionen für seine KI-gestützten Tools zur Audio- und Videoerstellung vorgestellt. Die Updates betreffen unter anderem die Plattformen Imagen 3, Veo 2, Chirp und Lyria. Mit diesen Neuerungen zielt Google darauf ab, im Markt der generativen KI-Tools für Unternehmen konkurrieren zu können.

Neuerungen in Google Imagen 3 und Veo 2

Die aktualisierte Version von Imagen 3 bietet verbesserte Möglichkeiten zur Bilderzeugung, einschließlich einer erweiterten Inpainting-Funktion, die das Rekonstruieren fehlender oder beschädigter Bildteile erleichtert. Auch das Entfernen von unerwünschten Objekten aus Fotos wird durch die neuen Features vereinfacht.

Bei Veo 2, dem KI-Tool zur Videoerstellung, gibt es zahlreiche neue Bearbeitungs- und Anpassungsoptionen für visuelle Effekte. Nutzer können spezifische Kamerawinkel in KI-generierten Szenen angeben und die Geschwindigkeit anpassen, um Zeitraffer oder Drohnenaufnahmen zu erstellen. Das Tool kann außerdem zwischen festgelegten Anfangs- und Endbildern interpolieren.

Mit Veo 2 können nun auch Hintergründe, Logos und Objekte aus bestehenden Videos entfernt sowie der Bildausschnitt von Videoaufnahmen erweitert werden. Diese neuen Funktionen stehen derzeit als Vorschau für Unternehmenskunden zur Verfügung und sollen es erleichtern, filmisch ansprechende Videos zu erstellen.

Updates für Lyria und Chirp 3

Lyria, ein KI-Modell zur Musikgenerierung, wurde ebenfalls in privater Vorschau mit einer Whitelist im Vertex AI Media Studio bereitgestellt. Das Tool ermöglicht die Erstellung vollständiger, produktionsfertiger Musikstücke basierend auf einem Textprompt und dient als Hintergrundmusik für mit Veo 2 generierte Videos.

Zusätzlich hat Google eine Funktion namens „Instant Custom Voice“ für sein Sprachsynthese-Modell Chirp 3 eingeführt. Diese Funktion kann realistische benutzerdefinierte Stimmen aus nur 10 Sekunden Audioeingabe erzeugen. Das Tool trennt und identifiziert einzelne Sprecher in Mehrspuraufnahmen für genauere Transkriptionen.

Es ist erwähnenswert, dass Google alle von den genannten KI-Tools generierten Medien mit der SynthID-Technologie kennzeichnet. Die generativen KI-Modelle verfügen über „eingebaute Schutzmaßnahmen“, um die Erstellung von schädlichen Inhalten zu verhindern.

Dieser Artikel erschien am und wurde am aktualisiert.
Veranstaltungstipp! Ich (KI Experte Karsten Höft und Betreiber von ECIN) lade Sie ein zum kostenlosen Event: KI im Fokus

In eigener Sache: Die Welt der künstlichen Intelligenz entwickelt sich rasant. Um stets auf dem Laufenden zu halten, führe ich einen monatlichen Online-Impuls im und beim Digitalzentrum Zukunftskultur durch. Immer am letzten Donnerstag im Monat präsentiere ich in der kostenlosen Veranstaltung „KI im Fokus: Up to date in 30 Minuten“ interessante Entwicklungen und Neuigkeiten aus dem Bereich der Künstlichen Intelligenz des letzten Monats und das kurz und knapp in einer halben Stunde.

Der nächste Termin von KI im Fokus ist am 24. April 2025 von 12 Uhr bis 12:30 Uhr. Melden Sie noch heute an. Die Teilnahme ist kostenlos:
Nach oben scrollen