Google stellt Gemini vor: ein revolutionäres KI-Modell, das den ChatGPT-4 übertreffen kann
Google hat ein neues fortschrittliches Modell der künstlichen Intelligenz (KI) mit dem Namen Gemini vorgestellt, das nach Angaben von Google den derzeit führenden Chat GPT deutlich übertreffen kann. Das Unternehmen setzt große Hoffnungen auf das neue Modell im Jahr 2024 und bezeichnet es als Durchbruch in der maßgeschneiderten KI.
Laut Sundar Pichai, dem CEO von Google, ist es an der Zeit für eine neue Ära der KI im Unternehmen, die er die “Gemini-Ära” nennt. Gemini ist die neueste Entwicklung von Google im Bereich der groß angelegten Sprachmodelle. Das Projekt wurde bereits im Juni auf der I/O-Entwicklerkonferenz angekündigt und ist nun für die Öffentlichkeit zugänglich. Pichai und der CEO von Google DeepMind, Demis Hassabis, beschreiben Gemini als einen bedeutenden Fortschritt in der Entwicklung von KI-Modellen, der sich auf fast alle Google-Produkte auswirken wird. Pichai merkt an: “Das Besondere an diesem Moment ist, dass wir durch die Arbeit an einer Kerntechnologie und deren Verbesserung einen unmittelbaren Einfluss auf alle unsere Produkte haben können.”
Gemini ist nicht nur ein KI-Modell. Es gibt eine leichtere Version namens Gemini Nano, die für die Offline-Nutzung auf Android-Geräten konzipiert ist. Eine leistungsfähigere Version, Gemini Pro, wird bald die Grundlage für viele KI-Dienste von Google sowie für Bard bilden. Außerdem gibt es das leistungsstärkste Modell Gemini Ultra, das für Rechenzentren und den Einsatz in Unternehmen konzipiert ist.
Google implementiert das Modell derzeit auf verschiedene Weise: Bard wird jetzt von Gemini Pro angetrieben, und Pixel 8 Pro-Nutzer werden neue Funktionen mit Gemini Nano erhalten. Die Markteinführung des Gemini Ultra ist für nächstes Jahr geplant. Entwickler und Unternehmenskunden werden ab dem 13. Dezember über Google Generative AI Studio oder Vertex AI in der Google Cloud auf Gemini Pro zugreifen können. Derzeit ist Gemini nur in englischer Sprache verfügbar, aber es ist geplant, weitere Sprachen hinzuzufügen. Pichai weist darauf hin, dass das Modell schließlich in die Google-Suche, in Werbeprodukte, in den Chrome-Browser und vieles mehr integriert werden soll.
OpenAI hat ChatGPT vor einem Jahr ins Leben gerufen, und es wurde schnell zu einem wichtigen Bestandteil der KI-Welt. Jetzt bereitet sich Google darauf vor, die Herausforderung anzunehmen.
Es ist wichtig zu betonen, dass Gemini dank seiner Multimodalität eine hervorragende Interaktion mit Video und Audio ermöglicht. Google hat nicht wie OpenAI mit DALL-E und Whisper getrennte Modelle für Bilder und Sprache erstellt, sondern von Anfang an ein universelles multisensorisches Modell entwickelt. Laut Hassabis ist dies Teil eines umfassenderen Entwicklungsplans für Gemini, das mit der Zeit immer mehr Funktionen erhalten und immer genauer und realistischer werden soll.
Der Gemini ist nicht nur leistungsfähiger, sondern auch effizienter als frühere Modelle. Es wurde auf Googles Tensor Processing Units trainiert, wodurch es schneller und billiger zu verwenden ist. Google bringt außerdem eine neue Version seines TPU-Systems, TPU v5p, auf den Markt, die für das Training und die Nutzung großer Modelle in Datenzentren konzipiert ist.
Pichai und Hassabis sehen den Start von Gemini als den Beginn eines größeren Projekts und als einen wegweisenden Schritt. Gemini könnte nicht nur Googles Antwort auf ChatGPT werden, sondern auch der Beginn einer neuen Ära der Technologien für künstliche Intelligenz.