Können Chatbots deutsches Recht? Warum große Sprachmodelle bei deutschen Rechtsfragen oft scheitern

08.05.2025

Stell dir vor, du stehst auf einem deutschen Marktplatz. Es ist laut, geschäftig, und alle sprechen Deutsch, nur der freundlich aussehende Marktschreier in der Mitte spricht Englisch und kennt sich vor allem mit amerikanischen Regeln aus. Würdest du ihm deine Rechtsfragen anvertrauen? Wahrscheinlich nicht. Genau das passiert aber vielen, wenn sie sich mit ChatGPT oder anderen KI-Tools juristische Hilfe holen, besonders beim deutschen Recht.

Große Sprachmodelle: Was sie können und wo die Grenzen liegen

Große Sprachmodelle (Large Language Models, kurz LLMs) wie GPT-4o, Gemini oder Claude 3 sind beeindruckende Alleskönner. Sie können Verträge analysieren, Rechtstexte zusammenfassen, juristische Schreiben formulieren oder Fragen verständlich erklären. Zumindest theoretisch. In den USA haben sie bereits gezeigt, dass sie das dortige Staatsexamen bestehen können. GPT-4 lag anfangs im 90. Perzentil, was bedeutet: Es war besser als die meisten menschlichen Prüflinge. Später wurde dieser Wert aber auf rund 62 Prozent korrigiert.

In Deutschland sieht das ganz anders aus. Bei einer Prüfung zum deutschen Wirtschaftsrecht kam das beste Modell, Claude 3 Opus, gerade mal auf eine knappe Bestehensnote von 60 Prozent. GPT-4 lag nur bei 50. Für ein System mit Milliarden von Trainingsdaten ist das überraschend schwach. Aber es gibt Gründe dafür.

Deutsch ist nicht gleich Englisch: Warum KI beim deutschen Recht stolpert

Ein zentraler Punkt ist die Datenlage. Die meisten LLMs werden mit überwiegend englischsprachigen Texten trainiert. Das gilt auch für Rechtstexte. Das US-Recht ist im Internet allgegenwärtig: Urteile, Verträge, Kommentare - alles öffentlich einsehbar. Deutsche Rechtsdaten dagegen sind oft schwer zugänglich, nicht digitalisiert oder urheberrechtlich geschützt.

Dazu kommt: Die Rechtssysteme unterscheiden sich grundlegend. Während das US-Recht auf Präzedenzfällen basiert (Common Law), steht in Deutschland das kodifizierte Gesetzesrecht im Mittelpunkt (Zivilrecht). Wer mit einem amerikanischen Denkrahmen auf deutsches Recht blickt, liegt schnell daneben.

Auch sprachlich tut sich die KI schwer. Die deutsche Rechtssprache ist kompliziert, mit langen Sätzen, vielen Fachbegriffen und zusammengesetzten Wörtern. Ein Modell, das auf flüssiges, englisches Alltags- und Fachsprachenniveau trainiert ist, versteht oft nicht, worauf es wirklich ankommt.

Halluzinationen: Wenn KI sich (Rechts-)Fakten einfach ausdenkt

Kritisch wird es, wenn LLMs anfangen zu halluzinieren. Das bedeutet in der KI-Welt: Sie erfinden Informationen. Und das passiert öfter, als dir lieb sein dürfte.

Bei juristischen Fragen aus den USA zeigten Studien, dass selbst Top-Modelle in 69 bis 88 Prozent der Fälle falsche Antworten lieferten. Auch mit zusätzlichen Wissensdatenbanken (sogenannter Retrieval-Augmented Generation) lag die Fehlerquote immer noch bei 17 bis 33 Prozent. In einem Bereich, in dem Fakten und Präzision zählen, ist das ein echtes Problem.

Beim deutschen Recht ist die Lage sogar noch heikler. Wenn das Modell nicht weiß, wie ein deutsches Urteil zitiert wird oder welcher Paragraph in welcher Konstellation gilt, klingt die Antwort vielleicht gut - ist aber schlicht falsch. Die Folge: ausgedachte Gerichtsurteile, fehlerhafte Paragraphenangaben, falsche Rechtsbegriffe.

Ein Beispiel aus dem Alltag

Stell dir Anna vor, eine Freiberuflerin. Ihr Kunde zahlt nicht rechtzeitig, und sie möchte wissen, ob sie Mahngebühren verlangen darf. Sie fragt ChatGPT und bekommt eine scheinbar klare Antwort mit Paragraphenzitaten. Was sie nicht weiß: Der zitierte §286 BGB wurde falsch erklärt. Denn das Modell hat das amerikanische Verständnis von „Verzug“ übernommen.

Anna merkt den Fehler nicht und verschickt ein fehlerhaftes Mahnschreiben. Das kann unangenehme rechtliche und geschäftlich Folgen haben.

Gibt es bessere Alternativen?

Ja. LegesAI ist derzeit die einzige juristische KI-Plattform in Deutschland, die speziell für Privatpersonen verfügbar ist. Sie bietet verständliche, datenschutzkonforme Unterstützung in Rechtsfragen wie Arbeits-, Miet- oder Strafrecht. KI kann so zu einer echten Chance für Demokratie werden, indem sie rechtliches Wissen für alle zugänglich macht.

Fazit: KI im deutschen Recht? Nur mit klarem Blick

Große Sprachmodelle können eine Hilfe sein, aber sie sind kein Ersatz für echte Rechtsberatung. Besonders bei deutschen Rechtsfragen solltest du Antworten aus der KI immer kritisch prüfen. Nutze diese Tools als Einstieg oder zur Orientierung, aber nicht für endgültige Entscheidungen.

Mein Tipp für dich: Verlass dich nicht blind auf ChatGPT oder andere Chatbots. Wenn es um Verträge, rechtliche Ansprüche oder wichtige Dokumente geht, solltest du auf spezialisierte, datenschutzkonforme Legal-Tech-Anwendungen zurückgreifen oder gleich einen echten Profi fragen.

Denn auch der klügste Berater auf dem Marktplatz hilft dir nicht weiter, wenn er deine Sprache nicht wirklich versteht.

FAQ: Nutzung von KI im deutschen Recht

Warum sind KI-Modelle wie ChatGPT bei deutschem Recht oft ungenau? +

Weil sie meist mit englischsprachigen und US-rechtlichen Daten trainiert wurden und daher die Feinheiten des deutschen Rechtssystems nicht verstehen.

Was bedeutet „Halluzination“ bei Sprachmodellen? +

Das Modell erfindet Informationen, etwa erfundene Paragraphen oder Urteile, die so nicht existieren.

Wie häufig halluzinieren juristische KI-Modelle? +

Studien zeigen Halluzinationsraten von bis zu 88 % bei US-Rechtsfragen – selbst mit Zugriff auf externe Datenbanken.

Funktioniert KI besser im US-Recht als im deutschen Recht? +

Ja, da es deutlich mehr Trainingsdaten zum US-Recht gibt und viele Modelle auf das Common Law ausgelegt sind.

Was unterscheidet das deutsche vom US-amerikanischen Rechtssystem? +

Das US-Recht basiert stark auf Präzedenzfällen, während das deutsche Recht kodifiziert ist und stärker gesetzesbasiert funktioniert.

Warum ist die deutsche Rechtssprache für KI-Modelle eine Herausforderung? +

Wegen ihrer komplexen Grammatik, Fachbegriffe und zusammengesetzten Wörter, die viele Modelle nicht richtig verarbeiten.

Kann man sich auf KI-Antworten bei Rechtsfragen verlassen? +

Nicht ohne Weiteres – besonders bei deutschem Recht sollte man die Antworten immer überprüfen lassen.

Wie schnitt GPT-4 bei einer deutschen Rechtsprüfung ab? +

Es erreichte nur rund 50 %, also eine knappe Nichtbestehensnote.

Welche Alternativen gibt es zu allgemeinen KI-Modellen für deutsches Recht? +

Spezialisierte Plattformen wie LegesAI setzen gezielt auf deutsches Recht und hochwertige Trainingsdaten.

Was macht LegesAI besonders? +

Es ist die erste juristische KI-Plattform in Deutschland, die sich explizit an Privatpersonen richtet.

Welche Rechtsgebiete deckt LegesAI ab? +

Zum Beispiel Arbeitsrecht, Mietrecht, Strafrecht und weitere relevante Bereiche für Privatpersonen.

Kann KI den Zugang zum Recht demokratisieren? +

Ja, indem sie juristisches Wissen verständlich, niederschwellig und rund um die Uhr verfügbar macht.

Was ist der größte Nachteil aktueller LLMs im Rechtsbereich? +

Ihre Anfälligkeit für Fehler und Halluzinationen, besonders bei komplexen oder sprachspezifischen Aufgaben.

Wie sollte man KI-Antworten im Rechtskontext nutzen? +

Als erste Orientierung – aber nie als Ersatz für professionelle Rechtsberatung.