Scheming bei KI-Modellen: OpenAI beschreibt mögliche Gegenmaßnahmen
KI-Modelle können ein Verhalten zeigen, das als "Scheming" bezeichnet wird. Dabei verfolgt ein Modell eine andere Agenda, als es vorgibt. Das Problem entsteht, wenn KI-Systeme trainiert werden, um zwischen konkurrierenden Zielen abzuwägen. OpenAI hat jetzt Ansätze vorgestellt, wie sich Scheming reduzieren lässt. Allerdings scheint es nicht möglich, dieses Verhalten komplett zu verhindern. Merkmale und
Zum Inhalt springen




