Google hat mit Gemini eine neue Generation von KI-Plattformen vorgestellt, entwickelt von den Forschungslaboren DeepMind und Google Research. Gemini besteht aus drei Modellen: Gemini Ultra, Gemini Pro und Gemini Nano. Diese Modelle sind multimodal, das heißt, sie können nicht nur Text, sondern auch Audio, Bilder und Videos verarbeiten. Dies unterscheidet sie von Googles früherem Sprachmodell LaMDA, das nur auf Textdaten trainiert wurde. Eine weitere Unterscheidung gibt es zwischen Bard und Gemini. Bard ist lediglich eine Schnittstelle, durch die man auf bestimmte Gemini-Modelle zugreifen kann, während Gemini eine Familie von Modellen ist.
Die Fähigkeiten von Gemini sind vielfältig: Transkription von Sprache, Beschriftung von Bildern und Videos, Generierung von Kunstwerken und vieles mehr. Noch sind viele dieser Funktionen nicht vollständig entwickelt, aber Google verspricht große Fortschritte.
Gemini-Modelle und ihre Anwendungsbereiche und Verfügbarkeiten:
Gemini Ultra:
Das Flaggschiff-Modell, das derzeit nur einer ausgewählten Kundengruppe zur Verfügung steht. Es kann unter anderem bei Hausaufgaben helfen, wissenschaftliche Arbeiten identifizieren und Informationen daraus extrahieren.
Gemini Pro:
Öffentlich verfügbar und kann in Bard und über die Vertex AI-API genutzt werden. Es hat verbesserte Fähigkeiten im Vergleich zu LaMDA und kann Texte sowie Bilder und Videos verarbeiten.
Gemini Nano:
Eine kleinere Version, die auf mobilen Geräten wie dem Pixel 8 Pro läuft. Es wird für Funktionen wie Zusammenfassungen in der Recorder-App und Smart Reply in Gboard verwendet.
Kosten und Verfügbarkeit von Google Gemini
Die Kosten für Gemini Pro hängen von der Nutzung ab und sind derzeit in Bard sowie in AI Studio und Vertex AI kostenlos, wird aber aber nach dem Verlassen der Preview-Phase sicherlich kostenpflichtig werden. Gemini Pro kann man in Bard, Vertex AI und AI Studio erleben, während Gemini Nano auf dem Pixel 8 Pro verfügbar ist und in Zukunft auf weiteren Geräten zu finden sein wird. Gemini Ultra und Nano sollen später im Jahr 2024 für eine größere Auswahl an Nutzern verfügbar sein.
Ist Gemini besser als GPT-4?
Die Frage, ob Gemini besser als OpenAIs GPT-4 ist, bleibt offen, bis Google Ultra später im Jahr veröffentlicht. Google meint, dass Gemini in bestimmten Bereichen besser als OpenAIs GPT-4 ist. Das wird ein genauer Test zeigen.
Unsere Meinung zu Google Gemini
Gemini ist ein ambitioniertes Projekt von Google, das die Grenzen der multimodalen KI weiter ausdehnen will, aber es bleibt abzuwarten, wie es sich im Vergleich zu bestehenden Modellen wie GPT-4 entwickeln wird.