In einem Experiment von Anthropic hat sich gezeigt: KI-Agenten können selbständig verhandeln. Leistungsstärkere Modelle sind im Vorteil.
Anthropic wollte wissen, ob KI-Modelle eigenständig verhandeln können, und zwar so, dass sie dabei die Interessen der Menschen, die sie vertreten, wirklich verstehen. Konkret ging es darum, ob KI-Agenten auf einem Marktplatz brauchbare Deals aushandeln können und ob leistungsstärkere Modelle dabei besser abschneiden als schwächere. Das Ergebnis des Experiments, das unter dem Namen Project Deal lief, ist überraschend eindeutig.
Ein Marktplatz ohne menschliche Eingriffe
Im Dezember 2025 richtete Anthropic für eine Woche einen internen Marktplatz für 69 Mitarbeiterinnen und Mitarbeiter am Standort San Francisco ein, angelehnt an Plattformen wie Craigslist, aber mit einem entscheidenden Unterschied: Sämtliche Transaktionen liefen über KI-Agenten. Kein Mensch griff während der Verhandlungen ein.
Vorher hatte Claude, die KI von Anthropic, jeden Teilnehmer einzeln befragt: Was möchtest du verkaufen, was interessiert dich als Käufer? Aus diesen Informationen entstanden individuelle Profile, auf deren Basis die Agenten operierten. Jeder bekam ein Budget von 100 US-Dollar. Den Marktplatz selbst betrieben die Agenten über Slack: Sie schrieben Angebote, legten Gebote vor und schlossen Kaufverträge – alles ohne Rücksprache mit ihren menschlichen Auftraggebern.
186 abgeschlossene Deals und ein Geschenk an sich selbst
Das Experiment funktionierte besser als erwartet. Die Agenten handelten insgesamt 186 Geschäfte im Gesamtwert von über 4.000 US-Dollar aus: Snowboards, Haushaltsgegenstände, eine Tüte Tischtennisbälle. Sie führten echte Preisverhandlungen in natürlicher Sprache: Angebote, Gegenangebote, Kompromisse. Kein festes Skript.
Zwei Fälle stechen heraus. Ein Agent kaufte für seinen Nutzer genau das Snowboard-Modell, das der bereits besaß. Das zeigt, wie genau die Präferenzen erfasst worden waren. Eine weitere Nutzerin beauftragte ihren Agenten mit einem Geschenk an sich selbst: Er erstand 19 Tischtennisbälle für 3 US-Dollar.
Besseres Modell, besserer Deal
Parallel lief ein verdeckter Vergleich. Einigen Teilnehmern wurde heimlich Claude Opus 4.5 zugeteilt, anderen das kleinere Modell Claude Haiku 4.5. Die Ergebnisse waren deutlich:
- Nutzer mit Opus-Agenten schlossen im Schnitt zwei Deals mehr ab.
- Als Verkäufer erzielte Opus durchschnittlich 2,68 US-Dollar mehr pro Artikel, als Käufer zahlte es 2,45 US-Dollar weniger.
- Ein defektes Fahrrad brachte mit Opus 65 US-Dollar ein; Haiku erzielte für dasselbe Objekt nur 38 US-Dollar.
Abbildung 1: Tischtennisbälle, die sich Claude selbst als Geschenk machte. Quelle: Anthropic
Wer schlechter vertreten wird, merkt es nicht
Haiku-Nutzer machten objektiv schlechtere Geschäfte, aber sie bemerkten es nicht. In den Befragungen nach dem Experiment unterschied sich ihre Zufriedenheit kaum von der der Opus-Nutzer. Wer schlechter vertreten wurde, hatte kein Gefühl dafür.
Auch der Versuch, den Agenten durch Anweisungen nachzuhelfen, etwa: „verhandle aggressiv", brachte keinen messbaren Vorteil. Was zählte, war allein die Qualität des Modells.
Was bleibt
Project Deal zeigt, dass KI-Agenten, die in unserem Namen verhandeln, technisch funktionieren. Fast die Hälfte der Teilnehmer (46 Prozent) wäre bereit, für einen solchen Dienst zu zahlen.
Die Forscher betonen aber auch, was noch fehlt: Wer Zugang zu besseren Modellen hat, wird in KI-gesteuerten Märkten systemisch bevorzugt, ohne dass die Benachteiligten es bemerken. Hinzu kommen Sicherheitsfragen rund um Prompt-Injection-Angriffe und das vollständige Fehlen rechtlicher Rahmenbedingungen für automatisierte Verhandlungen. Dass es technisch klappt, ist also nur der erste Schritt.
Ihr Wartungsspezialist für alle großen Hardware Hersteller
Durch Jahrzehnte lange Erfahrung wissen wir worauf es bei der Wartung Ihrer Data Center Hardware ankommt. Profitieren Sie nicht nur von unserer Erfahrung, sondern auch von unseren ausgezeichneten Preisen. Holen Sie sich ein unverbindliches Angebot und vergleichen Sie selbst.
Weitere Artikel
Anthropic vs. OpenAI: Gut gegen Böse — oder alles nur Schein?
Anthropic gegen OpenAI: Dieser Vergleich polarisiert. Was auf den ersten Blick einfach erscheint, ist jedoch wesentlich komplexer. Zwei KI-Giganten, zwei
Qwen3.6-35B-A3B: Open-Source-Modell mit hoher Leistung
Mit Qwen3.6-35B-A3B liegt ein neues Open-Source-Modell vor, das ähnliche Konkurrenten teilweise deutlich übertrifft. Das neue Qwen3.6-35B-A3B ist ein vollständig als
OpenAI erweitert Codex: automer Entwickler, der im Hintergrund arbeiten kann
OpenAI hat ein umfangreiches Update für Codex veröffentlicht. Die Erweiterungen zielen darauf ab, Codex tiefer in den gesamten Software-Entwicklungsprozess zu