Geld zurück GarantieErfahrungen & Bewertungen zu Hardwarewartung.com eine Marke von Change-IT
  • OpenAI bringt mit Codex einen KI-Agenten für die Softwareentwicklung

OpenAI bringt mit Codex einen KI-Agenten für die Softwareentwicklung

Von |2025-05-17T15:47:45+00:0017.5.2025|
OpenAI hat eine Preview auf Codex vorgestellt, einen KI-Agenten für die Software-Entwicklung, der cloud-basiert arbeitet. Codex soll der leistungsfähigste KI-Coding-Agent von OpenAI sein. Er basiert auf codex-1, einer speziell für Software-Engineering optimierten Version von GPT-o3. codex-1 wurde durch Reinforcement Learning auf echten Coding-Aufgaben trainiert und zeichnet sich dadurch aus, dass er Code generiert, der dem menschlichen Stil und ähnelt, Anweisungen genau folgt und Tests iterativ ausführt, bis ein positives Ergebnis erzielt wird. Im Vergleich zu o3 liefert codex-1 bessere Code-Änderungen, die direkt überprüft und integriert werden können.

codex-1 zeigte in Benchmarks eine hohe Leistung – sogar ohne AGENTS.md oder benutzerdefiniertes Scaffolding. Die Ergebnisse in SWE-Bench überstiegen in der Genauigkeit o3-high:

codex-1 SWE Bench

Ihr Wartungsspezialist im DataCenter

Durch Jahrzehnte lange Erfahrung wissen wir worauf es in Ihrem Data Center ankommt. Profitieren Sie nicht nur von unserer Erfahrung, sondern auch von unseren ausgezeichneten Preisen. Holen Sie sich ein unverbindliches Angebot und vergleichen Sie selbst.

So funktioniert Codex

Der Zugriff auf Codex ist über die seitliche Navigation in ChatGPT möglich. Man kann Codex Aufgaben zuweisen, indem man einen entsprechenden Prompt eingibt und auf „Code“ klickt. Möglich ist es auch, Fragen zur Codebasis zu stellen, indem man „Ask“ wählt.

OpenAI Codex Prompt

Jede Aufgabe wird in einer eigenständigen, isolierten Cloud-Sandbox-Umgebung bearbeitet. Diese Umgebung wird mit dem Code-Repository des Nutzers geladen. Innerhalb dieser Sandbox kann Codex Dateien lesen und bearbeiten sowie Befehle ausführen wie z. B. Test-Frameworks, Linter und Typ-Checker.

Die Bearbeitung einer Aufgabe dauert normalerweise zwischen einer und 30 Minuten, abhängig von der Komplexität. Man kann den Fortschritt in Echtzeit verfolgen. Sobald eine Aufgabe abgeschlossen ist, speichert Codex seine Änderungen in seiner Umgebung. Nachweise seiner Aktionen wie Terminal-Protokolle und Testergebnisse werden bereitgestellt, um jeden Schritt während der Aufgabenerledigung verfolgen zu können. Man kann die Ergebnisse überprüfen, weitere Überarbeitungen anfordern, einen GitHub-Pull-Request öffnen oder die Änderungen direkt in die eigene lokale Umgebung integrieren.

Die Umgebung von Codex lässt sich so konfigurieren, dass sie der tatsächlichen Entwicklungsumgebung möglichst genau entspricht. Codex funktioniert dann am besten, wenn er mit gut konfigurierten Entwicklungsumgebungen, zuverlässigen Test-Setups und klarer Dokumentation ausgestattet ist. Er lässt sich durch AGENTS.md-Dateien im Repository zusätzlich steuern, in denen Anweisungen zur Navigation oder zu Testbefehlen enthalten sind. Codex kann mehrere Aufgaben gleichzeitig erledigen, während man auf dem Rechner und im Browser an anderen Dingen arbeitet.

Anwendungsbereiche

Codex kann für eine Vielzahl von Aufgaben im Software-Engineering eingesetzt werden. Dazu gehören das Schreiben neuer Features, das Beantworten von Fragen zur Codebasis, das Beheben von Fehlern und das Vorschlagen von Pull-Requests zur Überprüfung vor einem Merge.

Für interne Teams bei OpenAI kommt Codex bereits täglich zum Einsatz, um zum Beispiel wiederkehrende, klar definierte Aufgaben wie Refactoring, Umbenennungen und das Schreiben von Tests auszulagern.

Mit Codex lassen sich auch automatisch neue Funktionen konzipieren (Scaffolding), Komponenten verbinden oder Dokumentation entwerfen. Erste Tester nutzen Codex bereits, um die Feature-Entwicklung zu beschleunigen, Probleme zu debuggen, Tests zu schreiben und auszuführen sowie um große Codebasen zu refaktorieren. Auch kleine, wiederkehrende Aufgaben wie die Verbesserung der Testabdeckung oder die Behebung von Integrationsfehlern lassen sich beschleunigen. Codex kann auch als nützliches Referenzwerkzeug dienen, um unbekannte Teile des Codes zu verstehen.

Ziel ist, dass KI-Agenten wie Codex als „virtuelle Teamkollegen“ agieren, die Aufgaben übernehmen, die Menschen Stunden oder sogar Tage kosten würden. Die Entwicklung geht in Richtung eines asynchronen Multi-Agenten-Workflows.

Sicherheit

Beim Design von Codex wurde laut OpenAI großer Wert auf Sicherheit und Transparenz gelegt. Nutzer können zum Beispiel die Arbeit von Codex anhand von Zitaten, Terminal-Protokollen und Testergebnissen kontrollieren. Wenn der Agent unsicher ist oder auf Testfehler stößt, teilt er das ausdrücklich mit. Nutzer können auf dieser Grundlage fundierte Entscheidungen treffen. Nach wie vor ist es aber unerlässlich, den gesamten vom Agenten generierten Code manuell zu prüfen und zu validieren, bevor er integriert und ausgeführt wird.

Ebenfalls zur Sicherheit beitragen soll die Isolierung der Ausführungsumgebung. Codex arbeitet vollständig in einem sicheren, isolierten Container in der Cloud. Während der Ausführung von Aufgaben ist der Internetzugang deaktiviert Die Interaktion des Agenten ist auf den Code beschränkt, der explizit über GitHub-Repositories bereitgestellt wird, sowie auf vordefinierte Abhängigkeiten, die vom Benutzer konfiguriert wurden. Der Agent kann keine externen Websites, APIs oder andere Dienste aufrufen.

Zudem soll der Missbrauch von KI-gesteuerten Software-Engineering-Werkzeugen verhindert werden. Codex wurde trainiert, Anfragen zur Entwicklung von Malware zu identifizieren und abzulehnen, während legitime, aber potenziell sensible Aufgaben wie zum Beispiel Low-Level-Kernel-Entwicklung weiterhin unterstützt werden.

Codex CLI

Zusätzlich zum Cloud-basierten Agenten hat OpenAI auch Codex CLI veröffentlicht, einen leichtgewichtigen Open-Source-Coding-Agenten, der direkt im Terminal läuft der Nutzer läuft. Er bringt die Fähigkeiten von Modellen wie o3 und o4-mini in den lokalen Workflow, um Aufgaben schneller zu erledigen. Es gibt eine kleinere Version von codex-1 für Codex CLI, die auf o4-mini basiert. Das neue Modell unterstützt schnellere Workflows im CLI und ist für Code-Q&A und -Bearbeitung mit geringen Latenzen optimiert, behält aber die Stärken bei der Befolgung von Anweisungen und im Stil bei.

Der Zugriff auf Codex CLI wurde vereinfacht; man kann sich jetzt einfach mit dem persönlichen ChatGPT-Konto anmelden, anstatt API-Tokens manuell zu konfigurieren.

Verfügbarkeit und Kosten

Codex ist derzeit für Nutzer von ChatGPT Pro, Enterprise und Team weltweit verfügbar. Die Unterstützung für Plus- und Edu-Benutzer ist für die nahe Zukunft geplant. In den ersten Wochen haben Nutzer großzügigen Zugriff ohne zusätzliche Kosten. Danach wird ein Zugriff mit Limits und flexiblen Preisoptionen eingeführt.

Für Entwickler, die das Modell codex-mini-latest über die API nutzen möchten, beträgt der Preis 1,50 US-Dollar pro einer Million Eingabe-Token und 6 US Dollar pro einer Million Ausgabe-Token mit einem Rabatt von 75 Prozent für Prompt-Caching.

Ihr Wartungsspezialist für alle großen Hardware Hersteller

Durch Jahrzehnte lange Erfahrung wissen wir worauf es bei der Wartung Ihrer Data Center Hardware ankommt. Profitieren Sie nicht nur von unserer Erfahrung, sondern auch von unseren ausgezeichneten Preisen. Holen Sie sich ein unverbindliches Angebot und vergleichen Sie selbst.

Weitere Artikel

Über den Autor:

Christian Kunz ist ein bekannter Experte für SEO, Suchmaschinen und die Optimierung für LLMs. Er war außerdem Koordinator für die IT eines Unternehmensbereichs in einem deutschen Internet-Konzern sowie IT-Projektmanager.
Nach oben