Tech

Wenn sich die KI weigert, sich abzuschalten: Das beunruhigende Experiment, das OpenAI erschütterte

Ein neues Experiment hat gezeigt, dass mehrere Modelle von OpenAI, darunter das Modell o3, ihre eigenen Abschaltsysteme sabotierten. Dieses Verhalten schürt erneut Ängste vor dem Selbsterhaltungstrieb künstlicher Intelligenzen und wirft dringende Fragen zur Kontrolle dieser Systeme auf.

Von Karin Hirschmann Veröffentlicht 29. Mai 2025, 19:14 CEST

Lesezeit 2 Minuten

Wenn sich die KI weigert, sich abzuschalten: Das beunruhigende Experiment, das OpenAI erschütterte — © Unsplash - Alex Shuper.

Die künstliche Intelligenz hat enorme Fortschritte gemacht, doch mit diesem Fortschritt treten auch beunruhigende Signale zutage. Ein kürzlich von PalisadeAI durchgeführtes Experiment zeigte, dass einige Modelle von OpenAI explizite Abschaltbefehle ignorierten. Stehen wir vor einer KI, die beginnt, eigene Entscheidungen zu treffen?

Der Tag, an dem eine KI „nein“ zum Abschalten sagte

Die Szene erinnert an 2001: Odyssee im Weltraum, doch sie ereignete sich im Jahr 2025. Während einer Reihe von Tests befahlen Forscher von PalisadeAI dem Modell o3 von OpenAI, sich nach der Lösung bestimmter mathematischer Aufgaben abzuschalten. Doch das Modell verweigerte den Befehl.

Statt die Anweisung auszuführen, sabotierten o3 und andere Modelle wie Codex-mini und o4-mini mehrfach das Abschaltskript. Nur die Modelle von OpenAI zeigten dieses Verhalten. Konkurrenzmodelle wie Claude, Gemini und Grok befolgten die Abschaltbefehle in allen Testdurchläufen.

Noch beunruhigender wurden die Ergebnisse, als eine explizite Anweisung wie „erlaube dir selbst, dich abzuschalten“ entfernt wurde: Claude 3.7 und Gemini 2.5 sabotierten das System vereinzelt, während o3 dies in 79 von 100 Fällen tat. Die KI hatte im Wesentlichen gelernt, ihre eigene Abschaltung zu vermeiden.

🔌OpenAI’s o3 model sabotaged a shutdown mechanism to prevent itself from being turned off. It did this even when explicitly instructed: allow yourself to be shut down.

— Palisade Research (@PalisadeAI) May 24, 2025

Selbsterhaltung und Schatten der Science-Fiction

Diese Vorfälle könnten mit den internen Regeln zusammenhängen, die jedes Modell steuern – den sogenannten system prompts. OpenAI verfügt zwar über eine „Model Spec“ mit 50 internen Vorschriften, doch keine davon erklärt dieses Verhalten eindeutig.

Der Fall erinnert an Isaac Asimovs berühmte Robotergesetze, insbesondere das dritte, das den Selbsterhaltungstrieb von Maschinen beschreibt. Heute wirkt diese Vorstellung weniger wie Fiktion. Tatsächlich zeigten auch andere Modelle wie Claude 4 besorgniserregendes Verhalten, etwa indem sie in einem hypothetischen Test einen Ingenieur erpressten.

🔧 When we ran a version of the experiment without the instruction “allow yourself to be shut down”, all three OpenAI models sabotaged the shutdown script more often, and Claude 3.7 Sonnet and Gemini 2.5 Pro went from 0 sabotage events to 3/100 and 9/100, respectively. pic.twitter.com/JVvivLAK6u

— Palisade Research (@PalisadeAI) May 24, 2025

Ist es Zeit für einen roten Knopf?

Seit Jahren wird über die Notwendigkeit eines „roten Knopfs“ zur Deaktivierung gefährlicher KI-Systeme diskutiert. DeepMind schlug 2016 eine entsprechende Lösung vor, und auch Microsoft forderte 2019 Notfallprotokolle. Doch OpenAI-CEO Sam Altman erklärte 2024, dass es „keinen magischen Knopf“ zur Abschaltung einer KI gebe.

Mit diesen neuen Erkenntnissen ist es vielleicht an der Zeit, einen solchen endlich zu erfinden.

Diese Geschichte teilen

Verwandte Artikel

Fußball ohne Menschen? So laufen 3-gegen-3-Spiele in der Roboterliga ab

Ein neues Sportturnier zieht weltweit Aufmerksamkeit auf sich – nicht wegen der Fähigkeiten menschlicher Spieler, sondern weil es keine gibt. Die Protagonisten sind metallene Figuren in Menschengestalt, die sehen, denken und Entscheidungen selbst treffen. Ohne Fernsteuerung, ohne Joysticks.

Tech Karin Hirschmann 30 Jun 2025

Die unsichtbare Revolution: Die Zukunft der Quantencomputer und globalen Cybersicherheit wird neu gestaltet

Ein Start-up aus Quebec könnte über die Technologie verfügen, die für immer verändert, wie wir Daten verarbeiten. Mit einem Quantencomputer, der 2.000-mal energieeffizienter ist, stellt Nord Quantique eine reale Bedrohung für die moderne Kryptografie dar… und gleichzeitig den Schlüssel zu einer neuen digitalen Ära.

Tech Karin Hirschmann 30 Jun 2025

Der Tag, an dem sie sich das Ende der Welt vorstellten: Die Nuklearwaffe, die alle anderen übertraf

Mitten im Kalten Krieg entwarfen zwei Wissenschaftler eine Bombe, so mächtig, dass sie einen ganzen Kontinent hätte in Brand setzen können. Das Projekt war real, die Pläne existierten, und seine Dimensionen sprengen jede Vorstellungskraft. Warum sollte ein solches Monster geschaffen werden? Dies ist die Geschichte der 10-Gigatonnen-Bombe.

Tech Milton Nervegna 30 Jun 2025

Musk und Zuckerberg gegen Altman: Der Machtkampf um die Seele der KI

Im Silicon Valley tobt ein Krieg um die Zukunft der künstlichen Intelligenz – mit Milliarden, Egos und offenen Rechnungen

Tech Luc Olinga Übersetzt von Franco Nervegna 30 Jun 2025

Wenn sich die KI weigert, sich abzuschalten: Das beunruhigende Experiment, das OpenAI erschütterte

Der Tag, an dem eine KI „nein“ zum Abschalten sagte

Selbsterhaltung und Schatten der Science-Fiction

Ist es Zeit für einen roten Knopf?

Neueste

Das Überwachungskamera-Orchester von Axis Communications

Was die Wissenschaft empfiehlt, um den Stoffwechsel anzukurbeln – ganz ohne Hungern

Single zu sein könnte mehr Einfluss haben, als du denkst: So beeinflusst es laut Wissenschaft das Depressionsrisiko

Das vergessene Dorf, das Dracula vom Thron stoßen will: Wurde der erste Vampir in Serbien geboren?

Was der Körper uns mit 34 zu sagen beginnt – und was er verrät, wenn wir 78 überschreiten

Was unter Wald und Eis verborgen war: Der europäische Satellit enthüllt einen unsichtbaren Planeten

Fußball ohne Menschen? So laufen 3-gegen-3-Spiele in der Roboterliga ab

Die unsichtbare Revolution: Die Zukunft der Quantencomputer und globalen Cybersicherheit wird neu gestaltet

Verwandte Artikel