Im Sommer 2023 hat ein New Yorker Anwalt einen Schriftsatz bei Gericht eingereicht, in dem sechs Präzedenzfälle zitiert waren — alle sechs erfunden von ChatGPT. Das Disziplinarverfahren folgte sofort. Was diesem Kollegen passiert ist, ist kein Bedienungsfehler. Es ist die Grundeigenschaft generativer KI: Sprachmodelle erfinden, weil sie statistisch wahrscheinliche Sätze ausgeben — nicht wahre.

Für Berufsträger ist das ein Problem. Eine erfundene BGH-Entscheidung im Schriftsatz, ein erfundenes BMF-Schreiben in der Steuererklärung, ein erfundener Paragraph in der Vertragsprüfung — alles drei kann Berufsrechtsverstoß und Haftungsfall in einem sein. Die gute Nachricht: Sie können Halluzinationen sehr gut kontrollieren, wenn Sie ein paar Grundregeln einhalten.

Warum Sprachmodelle „halluzinieren"

Ein Large Language Model wie GPT-4 oder Claude ist im Kern ein gigantischer Autocomplete-Mechanismus. Es schaut auf den bisherigen Text und gibt das wahrscheinlich nächste Wort aus — basierend auf Milliarden Textfragmenten aus dem Training. Wenn das Modell ein Aktenzeichen produzieren soll und keines „kennt", erfindet es ein plausibles. „BGH, Urteil vom 17.03.2021, Az. VIII ZR 78/20" klingt richtig. Es kann auch komplett fiktiv sein.

Das ist nicht reparabel im Modell selbst. Die einzige Lösung ist Retrieval-Augmented Generation (RAG): Die KI ruft erst die echten Quellen aus einer kuratierten Datenbank ab und antwortet erst dann. Wer ohne RAG arbeitet, fliegt blind.

Regel 1: Niemals ohne Quellenangabe akzeptieren

Eine KI-Antwort ohne explizite Quellenangabe ist im juristischen Kontext wertlos. Wenn Ihre KI „Nach § 281 BGB schuldet der Schuldner Schadensersatz statt der Leistung, sobald …" ausgibt, muss daneben stehen: Quelle: BGB, Stand 01.01.2026, Bundesgesetzblatt Teil I 2023, S. 1234. Wenn die KI keine Quelle nennt, müssen Sie davon ausgehen, dass keine vorliegt — und der Inhalt potenziell frei erfunden ist.

Bei Cubicle erzwingt das System Quellenangaben bei jeder rechts- oder steuerrelevanten Aussage. Antworten ohne Quellen-Tag bekommen Sie nicht zu sehen. Das ist eine Architektur-Entscheidung, keine User-Option.

Regel 2: Aktenzeichen immer gegen primäre Datenbank prüfen

Selbst wenn die KI ein Aktenzeichen liefert, sollten Sie es bei den ersten Nutzungen kurz verifizieren — über juris, Beck-online oder die offizielle BGH-Datenbank. Nach ein paar Wochen werden Sie spüren, wann Sie der KI vertrauen können und wann nicht. Faustregel: Häufig zitierte Leiturteile sind in Trainingsdaten besser repräsentiert als Spezial-Sachverhalte aus dem OLG Bremen.

Eine gute Berufs-KI sollte Ihnen die Verifikation abnehmen: Cubicle prüft jedes ausgegebene Aktenzeichen automatisch gegen den eigenen Vektor-Index. Findet sich der Fundstellen-Snippet nicht oder nur teilweise, wird die Antwort als „nicht verifiziert" markiert — oder gar nicht erst ausgespielt.

Regel 3: Bei Unsicherheit das Original lesen

KI-Antworten sind Zusammenfassungen — gut, wenn Sie nur einen Überblick brauchen, aber gefährlich, wenn Sie auf einer subtilen Norm aufbauen. Wenn es um die Frage geht, ob § 311a BGB Abs. 2 anwendbar ist, oder ob bei § 305c BGB tatsächlich eine überraschende Klausel vorliegt, sollten Sie den Gesetzestext einmal selbst lesen. Die KI hilft Ihnen, dorthin zu kommen — sie ersetzt das genaue Lesen nicht.

Faustregel

Je näher Ihre Frage am Tatbestandsmerkmal, am Wortlaut, am Subtext einer Klausel ist, desto eher müssen Sie selbst die Quelle anschauen. KI gut für Recherche, Überblick und Drafting — Original gut für Entscheidungen.

Regel 4: Cross-Check mit zweitem Modell oder zweiter Quelle

Bei kritischen Mandaten lohnt sich ein zweiter Lauf. Wenn Sie eine wichtige Schadenshöhe schätzen lassen oder eine Erfolgswahrscheinlichkeit, fragen Sie zwei Modelle (z.B. Claude und GPT-4) und vergleichen Sie. Bei Diskrepanzen wissen Sie, dass eine genauere Recherche nötig ist. Cubicle bietet pro Frage einen Multi-Modell-Modus, der genau das automatisiert.

Regel 5: Mandantenrelevante Antworten dokumentieren

Wenn eine KI-Antwort in Ihre Schriftsatz-Vorbereitung einfließt, dokumentieren Sie das. Datum, Frage, Antwort, Quellen, ggf. Hash des Modells. Im Streitfall ist das Ihre Verteidigungslinie. Cubicle protokolliert das automatisch in einem Audit-Log; bei ChatGPT-Konsumenten-Accounts gibt es das nicht.

Was Sie technisch erwarten dürfen

Eine professionelle Berufs-KI sollte mindestens vier Eigenschaften haben, die ChatGPT nicht hat:

  • Kuratierte Wissensbasis: Indexiert sind aktuelle Gesetze, Höchstgerichts-Urteile, BMF-Schreiben, Tarifverträge — nicht das halbe Internet.
  • Quellen-Verifier: Antworten ohne nachweisbare Quelle werden zurückgehalten oder markiert.
  • Stand-Aktualität: Das System weiß, welche Norm am Stichtag galt. Bei Gesetzesänderungen wird klar, welche Fassung relevant ist.
  • Audit-Log: Jede Antwort ist mit Zeitstempel, User, Workspace und Quellen-Fingerprint nachvollziehbar.

Diese vier Punkte trennen einen Spielzeug-Chatbot von einem Berufs-Werkzeug. Wenn Sie eine KI einkaufen, fragen Sie konkret danach — und lassen Sie sich keine Marketingphrasen geben.

Fazit

Halluzinationen sind technisch unvermeidbar in Sprachmodellen. Aber sie sind beherrschbar — durch RAG-Architektur, Quellen-Pflicht, Cross-Checks und Audit-Logging. Eine seriöse Berufs-KI nimmt Ihnen die meisten dieser Schritte ab. Was bleibt: Ihre eigene Skepsis und der gelegentliche Blick ins Original.

Die Kollegen, die mit KI ihre Schriftsätze schreiben und dann unverändert einreichen, machen sich verwundbar. Die, die KI als Recherche-Hebel benutzen und am Ende selbst entscheiden, sparen 30 bis 50 Prozent Zeit ohne neues Risiko.