GPT-4o: Das kann das neue KI-Modell von OpenAI

ki künstliche intelligenz

GPT-4o (“o” for “omni”) ist da: Die neueste Innovation von OpenAI zur Verbesserung der Mensch-Computer-Interaktion durch die Integration von Text-, Audio- und Bildinformationen in Echtzeit. Das Modell soll ChatGPT auf eine neue Stufe heben. Der Name GPT-4o steht für seine omnimodalen Fähigkeiten und bedeutet eine deutliche Verbesserung von Latenz, Kosten und Leistung. Es kann Ein- und Ausgaben in jeder Kombination von Text, Audio und Bild verarbeiten und reagiert auf Audiobefehle fast so schnell wie ein menschliches Gespräch.

Was kann GPT-4o?

GPT-4o wurde entwickelt, um Eingaben ganzheitlicher zu verarbeiten als frühere Modelle, die Aufgaben in einzelnen Schritten bearbeiteten. Dieser ganzheitliche Ansatz ermöglicht es GPT-4o, Nuancen wie Stimmlage, Kontext und Umgebungsgeräusche direkt zu interpretieren und so eine größere Bandbreite menschenähnlicher Reaktionen wie Lachen und emotionale Nuancen auszudrücken.

Das Modell entspricht laut OpenAI der Textleistung des GPT-4 Turbo und erweitert dessen Fähigkeiten in den Bereichen mehrsprachiger Text, Audiointerpretation und visuelles Verständnis. Mittels umfassender Sicherheitsmaßnahmen und ausgiebiger Tests – einschließlich eines robusten Red-Teaming-Prozesses mit über 70 externen Experten – ist GPT-4o in der Lage, die komplexe Landschaft der KI-Interaktionen sicher und effizient zu navigieren. Dies teilte OpenAI in einem Blogbeitrag mit.

Die ersten Versionen von GPT-4o konzentrieren sich auf Text- und Bildfunktionen innerhalb von ChatGPT, einschließlich der Verfügbarkeit für Free- und Plus-Benutzer. Audio- und Videofunktionen werden folgen, wobei der Schwerpunkt auf Sicherheit und Funktionsverbesserungen liegt. GPT-4o ist ein wichtiger Schritt, um KI-Interaktionen dynamischer und zugänglicher zu machen.

Dieser Artikel erschien am und wurde am aktualisiert.
Veranstaltungstipp! Wir laden Sie ein zum kostenlosen Event: KI im Fokus

In eigener Sache: Die Welt der künstlichen Intelligenz entwickelt sich rasant. Um stets auf dem Laufenden zu halten, führen wir (ich) einen monatlichen Online-Impuls im und beim Digitalzentrum Zukunftskultur durch. Immer am letzten Donnerstag im Monat präsentieren wir in der kostenlosen Veranstaltung „KI im Fokus: Up to date in 30 Minuten“ interessante Entwicklungen und Neuigkeiten aus dem Bereich der Künstlichen Intelligenz des letzten Monats und das kurz und knapp in einer halben Stunde.

Der nächste Termin von KI im Fokus ist am 29. Mai 2024 (ausnahmsweise Mittwoch) von 12 Uhr bis 12:30 Uhr. Melden Sie noch heute an. Die Teilnahme ist kostenlos:
Nach oben scrollen