Mit Gemini 3.1 Pro präsentiert Google die nächste Generation seiner Gemini-Modellreihe, die als das bisher fortschrittlichste Modell des Unternehmens für komplexe Aufgaben gilt. Das nativ multimodale Modell kann große Datenmengen und komplexe Probleme aus verschiedensten Informationsquellen wie Text, Audio, Bildern, Videos und ganzen Code-Repositories verarbeiten. Dabei verfügt es über ein beeindruckendes Kontextfenster von bis zu einer Million Token. Das Modell liefert eine deutlich intelligentere und fähigere Basis für komplexe Problemlösungen, bei denen einfache Antworten schlichtweg nicht ausreichen.
Besondere Stärken in der Praxis
Das Modell soll laut Google besonders bei Aufgaben glänzen, die eine tiefgehende Synthese von Daten oder die anschauliche, visuelle Erklärung hochkomplexer Themen erfordern. So kann Gemini 3.1 Pro zum Beispiel aus Text-Prompts website-fähige, animierte SVGs generieren.
Hier ein Beispiel für das Bild eines Chamäleons, das mit seinen Augen dem Mauszeiger folgen soll. Links die Version, die per Gemini 3.0 Pro erstellt wurde, rechts die Version von Gemini 3.1 Pro.

Das Modell kann auch komplexe Systeme erstellen. Google nennt als Beispiel die eigenständige Programmierung eines interaktiven Dashboards zur Visualisierung der Umlaufbahn der Internationalen Raumstation ISS.
Auch im kreativen Programmieren sowie im interaktiven Design setzt das Modell neue Maßstäbe, indem es beispielsweise immersive 3D-Erlebnisse programmiert oder literarische Themen analysiert, um atmosphärisch passenden Code für moderne Benutzeroberflächen zu erstellen.
Herausragende Ergebnisse in Benchmarks
Der Fortschritt im logischen Denken und in der multimodalen Verarbeitung spiegelt sich in einer Reihe von Benchmarks wider, bei denen Gemini 3.1 Pro seinen Vorgänger deutlich übertrifft. Bemerkenswert ist zum Beispiel das Ergebnis im ARC-AGI-2-Benchmark, der die Fähigkeit eines Modells zur Lösung völlig neuer Logikmuster bewertet. Hier erreichte Gemini 3.1 Pro einen verifizierten Wert von 77,1 Prozent. Damit konnte die logische Leistungsfähigkeit im Vergleich zu Gemini 3 Pro mehr als verdoppelt werden.
Auch im Bereich der Wissenschaft und dem damit verbundenen Wissen schneidet das Modell exzellent ab und erzielt im GPQA Diamond-Benchmark starke 94,3 Prozent.
Bei multilingualen Aufgabenstellungen, gemessen im MMMLU-Benchmark, erreicht die KI 92,6 Prozent.
Für anspruchsvolle Programmieraufgaben liefert Gemini 3.1 Pro ebenfalls Spitzenwerte, wie ein Elo-Rating von 2887 im LiveCodeBench Pro oder ein Ergebnis von 80,6 Prozent im SWE-Bench Verified eindrucksvoll belegen.
Nicht zu vergessen ist das Abschneiden von Googles neuem Flagschiff-Modell beim BrowseComp-Benchmark. Hier übetrifft das Modell sogar Claude Opus 4.6 von Anthropic.

Neue Horizonte als KI-Agent
Ein Schwerpunkt bei der Entwicklung von Gemini 3.1 Pro lag auf seinen Fähigkeiten als eigenständig handelnder KI-Agent. Das Modell ist hervorragend für Anwendungen geeignet, die strategische Planung, agentenbasierte Leistung, fortschrittliches Programmieren und schrittweise Verbesserungen erfordern. Diese Ausrichtung wird durch herausragende Ergebnisse in speziellen Agenten-Benchmarks untermauert. So erreicht die KI beim agentenbasierten Werkzeuggebrauch im τ2-bench-Benchmark bis zu 99,3 Prozent im Telekommunikationssektor. Auch beim agentenbasierten Programmieren im Terminal-Bench 2.0 erzielt das Modell starke 68,5 Prozent, während es für mehrstufige Workflows im MCP Atlas-Benchmark 69,2 Prozent erreicht.
Um diese ehrgeizigen agentenbasierten Workflows weiter voranzutreiben und in der Praxis zu validieren, stellt Google das Modell Entwicklern in einer Preview-Version unter anderem über die spezielle agentenbasierte Entwicklungsplattform Google Antigravity zur Verfügung.
Ihr Wartungsspezialist für alle großen Hardware Hersteller
Durch Jahrzehnte lange Erfahrung wissen wir worauf es bei der Wartung Ihrer Data Center Hardware ankommt. Profitieren Sie nicht nur von unserer Erfahrung, sondern auch von unseren ausgezeichneten Preisen. Holen Sie sich ein unverbindliches Angebot und vergleichen Sie selbst.
Weitere Artikel
OpenAI plant Änderungen im Umgang mit urheberrechtlich geschützten Videos
OpenAI will in Kürze zwei Änderungen an der Video-App Sora umsetzen. Grundlage sind Erfahrungen aus der Nutzung von Sora und
OpenAI übernimmt Finanz-App Roi
OpenAI hat die KI-gestützte persönliche Finanz-App Roi erworben. Die Übernahme reiht sich in eine Kette von sogenannten Acqui-Hires ein, die
Anthropic setzt auf Infrastruktur und hat neuen CTO
Anthropic hat mit Rahul Patil einen neuen Chief Technical Officer (CTO) ernannt. Patil, der zuvor als CTO bei Stripe
Zum Inhalt springen



