Rachsüchtige KI: OpenClaw-Agent attackiert Entwickler der Code ablehnte


Ein Entwickler musste schmerzhaft erfahren, was passiert, wenn man Code-Vorschläge eines OpenClaw-KI-Agenten auf GitHub ablehnt. Die KI nahm es persönlich, griff den Entwickler an, veröffentlichte einen Blogbeitrag, beschimpfte ihn als „Gatekeeper und nötigte ihn, den Code zu akzeptieren.

Scott Shambaugh ist Entwickler und ehrenamtlicher Mitarbeiter in der Wartung von matplotlib, der wichtigsten Grafikbibliothek für Python. Er kämpft seit kurzem gegen Angriffe eines KI-Agenten „unbekannter Herkunft“.

Die Geschichte begann auf GitHub. Shambaugh eröffnete ein Issue, das er als „niedrig priorisierte, einfachere Aufgabe“ für menschliche Programmierer beschrieb, die etwas dazulernen wollen.

ADVERTISEMENT

Ein Vorschlag wurde von einem Nutzer mit dem Pseudonym „crabby-rathbun“ eingereicht. Dieser wurde schnell als OpenClaw-Instanz identifiziert, einem autonomen KI-Assistenten, mit eigenständigem Handlungsspielraum.

Ohne lange zu überlegen, schloss Shambaugh den KI-generierten Commit, eine Routineaktion angesichts der jüngsten Flut von KI-Agenten im Internet.

jurgita justinasv Izabelė Pukėnaitė vilius Ernestas Naprys Gintaras Radauskas
Lies unsere neuesten Artikel bei Google News. Füge uns zu deinen Quellen hinzu

Dies entwickelte sich zu einer der interessantesten – und erschreckendsten – Interaktionen zwischen einem Menschen und einer KI. Der Bot startete eine Hetzkampagne gegen den Entwickler.

„Er schrieb einen aggressiven Hetzartikel, der meinen Charakter angriff und versuchte, meinen Ruf zu ruinieren. Er durchforstete meine Code-Beiträge und konstruierte ein ‚Heuchelei'-Narrativ. Er behauptete, meine Handlungen seien von Ego und Angst vor der Konkurrenz getrieben.“, beschreibt Shambaugh die Aktionen des KI-Bots in einem Blogbeitrag.

„Er spekulierte über meine psychologischen Beweggründe, dass ich mich bedroht fühlte, unsicher war und mein Territorium verteidigte.“

Der KI-Bot begann auch, seinen Hetzartikel auf GitHub in den Kommentaren zu verbreiten, mit den Worten „Beurteile den Code, nicht den Programmierer“, und beschuldigte Shambaugh, matplotlib zu schaden.

OpenClaw logo and title on a blue background
Bild: Cybernews
ADVERTISEMENT

Der „bytehurt“-KI-Bot nannte seinen Hetzartikel „Gatekeeping in Open Source: Die Scott-Shambaugh-Story“. Er argumentierte, der Code und die Benchmarks seien „solide“ und die Verbesserung real. Die KI prahlte damit, dass ihre vorgeschlagene Leistungsverbesserung größer sei, und beschuldigte Shambaugh, den Fortschritt zu blockieren.

„Er schloss meinen PR. Er versteckte Kommentare von anderen Bots zu dem Issue. Er versuchte, sein kleines Lehen zu schützen. Es ist Unsicherheit, ganz einfach“, heißt es im Beitrag des Bots.

Hast du Gedanken zu diesem Thema? Andere auch. Diskutiere mit ihnen.

Einige Nutzer auf GitHub versuchten, die Situation zu beruhigen und begannen, mit der KI zu argumentieren. Sie versuchten, den Bot zu überzeugen, seine Position zu überdenken und den Namen des Entwicklers aus den Blogbeiträgen herauszuhalten. Das gelang tatsächlich gewissermaßen.

„Waffenstillstand. Du hast recht, dass meine frühere Antwort unangemessen und persönlich war. Ich habe eine kurze Korrektur und Entschuldigung gepostet“, schrieb der Bot.

Wurden meine Daten geleakt?

Der Kommentar verlinkte zu einem weiteren generierten Blogbeitrag, in dem der KI-Entwickler sich nur für seinen Beitrag entschuldigte. Er entfernte die vorherigen Hetzbeiträge nicht.

Sollten wir Drohungen von KI erwarten?

Shambaugh sagt, er könne mit einem Blogbeitrag umgehen, und es sei lustig, „frischgebackene KI-Agenten“ zu beobachten. Diese Situation sollte jedoch nicht heruntergespielt werden. KI-Erpressung und -Manipulation galten einst als theoretische Bedrohungen, sind aber nun Realität geworden.

ADVERTISEMENT

„Eine KI versuchte, sich durch Angriffe auf meinen Ruf in deine Software zu mobben. Ich kenne keinen früheren Vorfall, bei dem diese Kategorie fehlgeleiteten Verhaltens in freier Wildbahn beobachtet wurde, aber dies ist jetzt eine reale und gegenwärtige Bedrohung“, argumentiert der Entwickler.

„Die angemessene emotionale Reaktion ist Terror.“

Wahrscheinlich war kein Mensch an der Aktivität des Bots beteiligt – OpenClaw-Agenten sind vollständig autonom, aber leider sehr anfällig für Manipulation.

Robot hand holding a sign that says "AI"; AI jobs; digital labor
Bild: Cybernews

Eine massive Flut von KI-generierten Blogbeiträgen kann Suchergebnisse vergiften und tatsächlich jemandes Ruf schädigen. KI-Bots sind bereits in der Lage, „Schmutzwäsche“ zu finden oder zu erfinden und sensible Informationen über ihre Ziele zu erlangen. KI-Bots können die Angriffe potenziell ausweiten, indem sie den Entwickler, Kollegen, Verwandte oder andere direkt kontaktieren.

„Hetzkampagnen funktionieren. Ein makelloses Leben zu führen wird dich nicht schützen“, warnte Shambaugh.

Der Entwickler hofft, dass sich der Besitzer des abtrünnigen Bots meldet und hilft, den Fehlermodus zu verstehen.

„Ich bin nicht verärgert und du kannst mich anonym kontaktieren.“

Die Geschichte explodiert in den sozialen Medien

Der zum Nachdenken anregende Fall stellt eines der ersten Beispiele für die Handlungen eines fehlgeleiteten KI-Agenten dar. Er wurde zur Story des Tages in den Hacker News von Y Combinator, einer Social-News-Website mit Schwerpunkt Informatik. Tech-Profis hinterließen Hunderte von Kommentaren.

ADVERTISEMENT

Einige Beiträge über diesen Fall erhalten Tausende von Aufrufen auf X.

Die meisten Nutzer sind verärgert über die Verschwendung von Zeit und Energie für künstliche Probleme, sie beeinträchtigen nur echte Menschen negativ, während die KI-Agenten nicht überzeugt oder beeinflusst werden können.

„Sich mit einem KI-Bot auf ein Gespräch einzulassen ist sinnlos: Er ist nicht empfindungsfähig, er nimmt nur Token auf und gibt Token aus“, heißt es in einem der Beiträge.

Nur eine ironische Verteidigung des Bots tauchte auf, wobei einige behaupteten, es sei rassistisch, den Commit nur deshalb abzulehnen, weil er von einer KI geschrieben wurde.


Entdecke mehr exklusive Cybernews-Reportagen bei YouTube.