Google Gemini 3.1 Pro ist da: Spitzenreiter in vielen Benchmarks

Mit Gemini 3.1 Pro präsentiert Google die nächste Generation seiner Gemini-Modellreihe, die als das bisher fortschrittlichste Modell des Unternehmens für komplexe Aufgaben gilt. Das nativ multimodale Modell kann große Datenmengen und komplexe Probleme aus verschiedensten Informationsquellen wie Text, Audio, Bildern, Videos und ganzen Code-Repositories verarbeiten. Dabei verfügt es über ein beeindruckendes Kontextfenster von bis zu einer Million Token. Das Modell liefert eine deutlich intelligentere und fähigere Basis für komplexe Problemlösungen, bei denen einfache Antworten schlichtweg nicht ausreichen.

Besondere Stärken in der Praxis

Das Modell soll laut Google besonders bei Aufgaben glänzen, die eine tiefgehende Synthese von Daten oder die anschauliche, visuelle Erklärung hochkomplexer Themen erfordern. So kann Gemini 3.1 Pro zum Beispiel aus Text-Prompts website-fähige, animierte SVGs generieren.

Hier ein Beispiel für das Bild eines Chamäleons, das mit seinen Augen dem Mauszeiger folgen soll. Links die Version, die per Gemini 3.0 Pro erstellt wurde, rechts die Version von Gemini 3.1 Pro.

KI-generiertes SVG von einem animierten Chamäleon, das mit den Augen dem Mauszeiger folgt: Gemini 3.0 Pro im Vergleich mit Gemini 3.1 Pro

Das Modell kann auch komplexe Systeme erstellen. Google nennt als Beispiel die eigenständige Programmierung eines interaktiven Dashboards zur Visualisierung der Umlaufbahn der Internationalen Raumstation ISS.

Auch im kreativen Programmieren sowie im interaktiven Design setzt das Modell neue Maßstäbe, indem es beispielsweise immersive 3D-Erlebnisse programmiert oder literarische Themen analysiert, um atmosphärisch passenden Code für moderne Benutzeroberflächen zu erstellen.

Herausragende Ergebnisse in Benchmarks

Der Fortschritt im logischen Denken und in der multimodalen Verarbeitung spiegelt sich in einer Reihe von Benchmarks wider, bei denen Gemini 3.1 Pro seinen Vorgänger deutlich übertrifft. Bemerkenswert ist zum Beispiel das Ergebnis im ARC-AGI-2-Benchmark, der die Fähigkeit eines Modells zur Lösung völlig neuer Logikmuster bewertet. Hier erreichte Gemini 3.1 Pro einen verifizierten Wert von 77,1 Prozent. Damit konnte die logische Leistungsfähigkeit im Vergleich zu Gemini 3 Pro mehr als verdoppelt werden.

Auch im Bereich der Wissenschaft und dem damit verbundenen Wissen schneidet das Modell exzellent ab und erzielt im GPQA Diamond-Benchmark starke 94,3 Prozent.

Bei multilingualen Aufgabenstellungen, gemessen im MMMLU-Benchmark, erreicht die KI 92,6 Prozent.

Für anspruchsvolle Programmieraufgaben liefert Gemini 3.1 Pro ebenfalls Spitzenwerte, wie ein Elo-Rating von 2887 im LiveCodeBench Pro oder ein Ergebnis von 80,6 Prozent im SWE-Bench Verified eindrucksvoll belegen.

Nicht zu vergessen ist das Abschneiden von Googles neuem Flagschiff-Modell beim BrowseComp-Benchmark. Hier übetrifft das Modell sogar Claude Opus 4.6 von Anthropic.

Gemini 3.1 Pro Benchmarks im Vergleich mit anderen Modellen

Neue Horizonte als KI-Agent

Ein Schwerpunkt bei der Entwicklung von Gemini 3.1 Pro lag auf seinen Fähigkeiten als eigenständig handelnder KI-Agent. Das Modell ist hervorragend für Anwendungen geeignet, die strategische Planung, agentenbasierte Leistung, fortschrittliches Programmieren und schrittweise Verbesserungen erfordern. Diese Ausrichtung wird durch herausragende Ergebnisse in speziellen Agenten-Benchmarks untermauert. So erreicht die KI beim agentenbasierten Werkzeuggebrauch im τ2-bench-Benchmark bis zu 99,3 Prozent im Telekommunikationssektor. Auch beim agentenbasierten Programmieren im Terminal-Bench 2.0 erzielt das Modell starke 68,5 Prozent, während es für mehrstufige Workflows im MCP Atlas-Benchmark 69,2 Prozent erreicht.

Um diese ehrgeizigen agentenbasierten Workflows weiter voranzutreiben und in der Praxis zu validieren, stellt Google das Modell Entwicklern in einer Preview-Version unter anderem über die spezielle agentenbasierte Entwicklungsplattform Google Antigravity zur Verfügung.

Erfahren Sie mehr

Ihr Wartungsspezialist für alle großen Hardware Hersteller

Durch Jahrzehnte lange Erfahrung wissen wir worauf es bei der Wartung Ihrer Data Center Hardware ankommt. Profitieren Sie nicht nur von unserer Erfahrung, sondern auch von unseren ausgezeichneten Preisen. Holen Sie sich ein unverbindliches Angebot und vergleichen Sie selbst.

Erfahren Sie mehr