Discrete Geometry und KI-Interpretierbarkeit – abstrakte Visualisierung hochdimensionaler Punktmengen

OpenAI widerlegt eine 80 Jahre alte Vermutung in der diskreten Geometrie. MIT Technology Review kürt Mechanistic Interpretability zur Breakthrough-Technologie 2026. Und ein Forscherteam zeigt, dass neuronale Netze intern einem geometrischen Prozess folgen, den Mathematiker seit den 1980er Jahren studieren. Drei Nachrichten, die auf den ersten Blick nichts miteinander zu tun haben. Auf den zweiten Blick erzählen sie dieselbe Geschichte: Die nächste Revolution in der KI kommt nicht aus der Informatik – sie kommt aus der reinen Mathematik. [1]

Die Branche feiert, dass KI Mathematik betreiben kann. Aber die eigentlich spannende Frage läuft in die andere Richtung: Welche mathematischen Werkzeuge können uns helfen, die KI selbst zu verstehen? Und warum ist ausgerechnet die diskrete Geometrie – ein Feld, das sich mit endlichen Punktmengen, Abständen und Konvexität in hochdimensionalen Räumen beschäftigt – der vielversprechendste Kandidat?

Das Interpretierbarkeits-Problem: Warum wir blind fliegen

Neuronale Netze sind Blackboxen. Das ist keine Metapher, das ist eine technische Tatsache. Ein Large Language Model wie Claude oder GPT verarbeitet Eingaben durch Milliarden von Parametern, die in Hunderten von Schichten organisiert sind. Zwischen Eingabe und Ausgabe liegen Billionen mathematischer Operationen. Kein Mensch kann nachvollziehen, warum ein bestimmter Output entsteht. [2]

Das war lange akzeptabel, solange KI Bilder von Katzen klassifizierte. Es ist nicht mehr akzeptabel, wenn KI medizinische Diagnosen stellt, Kreditentscheidungen trifft oder, wie im Fall von OpenAI, mathematische Beweise produziert, die neun Forscher 125 Seiten lang prüfen müssen. [3]

Die bisherigen Ansätze zur Erklärbarkeit – Attention Maps, Saliency Maps, SHAP-Werte – kratzen an der Oberfläche. Sie zeigen, welche Eingaben wichtig waren, aber nicht warum. Sie beschreiben Korrelationen, keine Kausalitäten. Mechanistic Interpretability geht einen Schritt weiter: Sie versucht, die internen Schaltkreise eines Modells zu kartieren, einzelne Features zu identifizieren und kausale Pfade vom Input zum Output nachzuzeichnen. Anthropic zeigte 2024, dass man in Claude Features finden kann, die konkreten Konzepten entsprechen – vom Golden Gate Bridge bis zu Michael Jordan. [4]

Aber selbst Mechanistic Interpretability stößt an eine fundamentale Grenze: Ihr fehlt ein mathematisches Framework, das erklärt, wie sich die Geometrie der Datenrepräsentationen durch die Schichten eines Netzes transformiert. Genau hier kommt die diskrete Geometrie ins Spiel.

Ricci Flow im Netz: Wenn Mathematik die Architektur erklärt

Im September 2025 veröffentlichten Moritz Hehl, Max von Renesse und Melanie Weber ein Paper, das die Brücke baut: „Neural Feature Geometry Evolves as Discrete Ricci Flow". [5] Die zentrale Erkenntnis: Die Art, wie tiefe neuronale Netze ihre internen Repräsentationen von Schicht zu Schicht transformieren, folgt einem geometrischen Prozess, der dem diskreten Ricci Flow entspricht.

Ricci Flow – das ist die Technik, mit der Grigori Perelman 2003 die Poincaré-Vermutung bewies, eines der Millennium-Probleme der Mathematik. Im kontinuierlichen Fall beschreibt Ricci Flow, wie sich die Krümmung einer Mannigfaltigkeit über die Zeit gleichmäßig verteilt. Die diskrete Variante operiert auf Graphen: Knoten, Kanten, lokale Krümmungsmaße.

Was Hehl und Kollegen zeigten: Wenn man die Eingabedaten eines neuronalen Netzes als geometrischen Graphen modelliert – Punkte im hochdimensionalen Raum, verbunden nach lokaler Ähnlichkeit – dann transformiert das Netz diesen Graphen von Schicht zu Schicht auf eine Weise, die dem diskreten Ricci Flow entspricht. Die Krümmung wird umverteilt. Cluster entstehen. Klassengrenzen schärfen sich. Nicht zufällig, sondern nach einem mathematisch präzisen Prinzip. [5]

Die Implikation ist enorm: Wenn wir wissen, dass neuronale Netze intern einem bekannten geometrischen Prozess folgen, können wir diesen Prozess mit den Werkzeugen der diskreten Geometrie analysieren. Statt eine Blackbox zu inspizieren, untersuchen wir einen geometrischen Fluss. Hehl und Kollegen validieren das an über 20.000 trainierten Netzen und leiten daraus sogar ein praktisches Design-Prinzip ab: ein geometrie-informiertes Early-Stopping-Heuristic, das erkennt, wann ein Netz „genug" gelernt hat.

Von Erdős bis OpenAI: Diskrete Geometrie als Schlüsseldisziplin

Am 20. Mai 2026 verkündete OpenAI, dass ein internes Reasoning-Modell die Erdős-Vermutung zum Unit-Distance-Problem widerlegt hat – eine 80 Jahre alte offene Frage in der diskreten Geometrie. [6] Die Frage klingt simpel: Wenn man n Punkte in der Ebene platziert, wie viele Paare können genau einen Einheitsabstand voneinander haben? Seit 1946 galt die Vermutung, dass Gitteranordnungen optimal sind.

Discrete Geometry Ricci Flow – Transformation geometrischer Graphen in neuronalen Netzen

Das OpenAI-Modell fand eine neue Familie von Konstruktionen, die das Gitter schlagen – unter Nutzung algebraischer Zahlentheorie und unendlicher Klassenkörpertürme. Will Sawin von Princeton machte den Wert explizit: δ ≥ 0,014, publiziert am selben Tag. [7]

Was die Schlagzeilen übersahen: Der Durchbruch demonstriert nicht nur, dass KI Mathematik betreiben kann. Er demonstriert, dass KI besonders gut darin ist, Verbindungen zwischen mathematischen Disziplinen herzustellen, die menschliche Mathematiker übersehen. Das Modell verband diskrete Geometrie mit algebraischer Zahlentheorie – ein Brückenschlag, den kein Spezialist der einen oder anderen Seite so vollzogen hatte.

Und genau diese Fähigkeit – die Synthese über Disziplingrenzen hinweg – ist es, die auch in der umgekehrten Richtung funktionieren könnte: Wenn KI diskrete Geometrie für mathematische Beweise nutzen kann, dann können Forscher diskrete Geometrie nutzen, um KI zu verstehen. Die Werkzeuge sind identisch: endliche Punktmengen, Abstandsmetriken, konvexe Hüllen, hochdimensionale Konfigurationen. Nur die Anwendungsrichtung dreht sich um.

Kolmogorov-Arnold Networks: Geometrie als Architekturprinzip

Parallel zur analytischen Anwendung diskreter Geometrie auf bestehende Netze gibt es einen zweiten Strang: Netzarchitekturen, die Interpretierbarkeit durch geometrische Prinzipien von Grund auf einbauen. Kolmogorov-Arnold Networks – KANs – sind das prominenteste Beispiel. [8]

KANs basieren auf dem Kolmogorov-Arnold-Darstellungssatz: Jede stetige Funktion mehrerer Variablen lässt sich als Komposition von stetigen Funktionen einer einzigen Variable darstellen. Statt die Gewichte zwischen Neuronen zu optimieren (wie bei klassischen MLPs), optimieren KANs die Aktivierungsfunktionen selbst – und machen diese als univariate Funktionen direkt lesbar und symbolisch regressierbar.

Der Clou: Die Zerlegung in eindimensionale Funktionen ist ein geometrisches Prinzip. Die Transformation hochdimensionaler Daten in Kompositionen niedrigdimensionaler Strukturen – genau das ist das Kerngeschäft der diskreten Geometrie. ICLR 2025 akzeptierte die KAN-Arbeit als Conference Paper. Seitdem explodiert die Forschung: Symbolic-KAN verbindet symbolische Primitive direkt mit dem Training. KA-GNNs erweitern das Prinzip auf Graph Neural Networks für Molekülanalyse. iCKANs wenden es auf Materialwissenschaften an. [9]

Die gemeinsame Linie: Überall dort, wo Interpretierbarkeit durch geometrische Strukturierung entsteht – nicht als nachträgliche Analyse, sondern als intrinsisches Architekturprinzip – steckt diskrete Geometrie dahinter. Die Frage ist nicht mehr, ob Mathematik KI erklärbar machen kann, sondern welche Teilgebiete am meisten beitragen.

Riemannsche Pullback-Metrik: Wie Netze diskret auf kontinuierlich rechnen

Ein dritter Forschungsstrang schließt den Kreis. Forscher analysierten die Riemannsche Pullback-Metrik über die Schichten neuronaler Netze und entdeckten: Die Netzwerkberechnung lässt sich in zwei fundamentale Operationen zerlegen – das Diskretisieren kontinuierlicher Eingabemerkmale und das Durchführen logischer Operationen auf diesen diskretisierten Variablen. [10]

Das bedeutet: Neuronale Netze machen intern genau das, was diskrete Geometrie formal beschreibt. Sie überführen kontinuierliche Mannigfaltigkeiten in diskrete Strukturen und operieren dann auf diesen Strukturen. Die diskrete Geometrie ist damit nicht nur ein Analysetool für neuronale Netze – sie beschreibt deren fundamentalen Rechenmechanismus.

Wer das versteht, sieht die Interpretierbarkeitsforschung in einem neuen Licht. Es geht nicht darum, einer opaken Maschinerie nachträglich Erklärungen abzuringen. Es geht darum, die mathematische Sprache zu finden, in der neuronale Netze ohnehin denken. Und diese Sprache ist die diskrete Geometrie.

Was das für die Praxis bedeutet

Die Verbindung von diskreter Geometrie und KI-Interpretierbarkeit ist keine rein akademische Übung. Sie hat konkrete Konsequenzen:

Für die KI-Sicherheit: Wenn wir die geometrische Evolution von Features durch ein Netz verstehen, können wir Anomalien erkennen – Schichten, in denen die Transformation vom erwarteten Ricci-Flow-Muster abweicht. Das ist ein potenzieller Frühindikator für adversariale Angriffe oder Halluzinationen.

Für das Modelldesign: Geometrie-informierte Heuristiken wie das Early-Stopping-Kriterium von Hehl et al. sind erst der Anfang. Wenn die optimale Feature-Transformation einem Ricci Flow entspricht, können wir Architekturen entwerfen, die diesen Flow direkt implementieren – statt ihn emergent entstehen zu lassen.

Für die Regulierung: Die EU AI Act verlangt Erklärbarkeit für Hochrisiko-KI-Systeme. Bisher war unklar, was das technisch bedeutet. Geometrische Interpretierbarkeit – die Analyse der diskreten Strukturen, die ein Modell intern aufbaut – könnte der erste Ansatz sein, der sowohl technisch rigoros als auch regulatorisch verwertbar ist. [4]

Für die Forschung: Die ICML 2026 Mechanistic Interpretability Workshop zeigt, dass die Community das Momentum erkennt. [11] Aber die Teilnehmerlisten sind noch überwiegend von Informatikern dominiert. Die Mathematiker – die diskreten Geometer, die Topologen, die algebraischen Geometer – fehlen weitgehend. Hier liegt die größte ungenutzte Chance.

Der blinde Fleck der KI-Industrie

Die KI-Industrie investiert Milliarden in größere Modelle, längere Kontextfenster und schnellere Inferenz. Sie investiert praktisch nichts in das mathematische Verständnis dessen, was diese Modelle intern tun. Das ist, als würde die Pharmaindustrie Medikamente verkaufen, ohne zu verstehen, wie sie im Körper wirken. Es funktioniert – bis es nicht mehr funktioniert.

Die diskrete Geometrie bietet keinen Silver Bullet. Sie bietet etwas Besseres: einen mathematisch fundierten Rahmen, der erklärt, warum neuronale Netze funktionieren – nicht nur dass sie funktionieren. Die Werkzeuge existieren. Die ersten Brücken sind gebaut. Was fehlt, ist die institutionelle Erkenntnis, dass die Antwort auf die Blackbox nicht in noch mehr Compute liegt, sondern in einer mathematischen Disziplin, die die meisten KI-Forscher im Studium übersprungen haben.

Erdős stellte 1946 eine Frage über Punkte und Abstände. 80 Jahre später beantwortet eine KI diese Frage – und liefert dabei den Hinweis, dass genau diese Art von Mathematik der Schlüssel sein könnte, die KI selbst zu entschlüsseln. Die Ironie ist perfekt. Die Frage ist, ob jemand zuhört.

Referenzen

  1. MIT Technology Review: Mechanistic Interpretability als Breakthrough Technology 2026, Januar 2026
    https://www.technologyreview.com/2026/01/12/1130003/mechanistic-interpretability-ai-research-models-2026-breakthrough-technologies/
  2. Chris Olah (Anthropic) über die Rätselhaftigkeit von KI-Modellen und die Notwendigkeit externer Kritik, Mai 2026
    https://www.anthropic.com/news/chris-olah-pope-leo-encyclical
  3. OpenAI: Ein KI-Modell widerlegt eine zentrale Vermutung in der diskreten Geometrie, Mai 2026
    https://openai.com/index/model-disproves-discrete-geometry-conjecture/
  4. Anthropic: Mechanistic Interpretability – Features und Schaltkreise in Claude identifizieren, 2024–2025
    https://www.emergentmind.com/topics/mechanistic-interpretability-in-ai
  5. Hehl, von Renesse, Weber: „Neural Feature Geometry Evolves as Discrete Ricci Flow", arXiv, September 2025
    https://arxiv.org/abs/2509.22362
  6. YouTube-Analyse: KI-bewiesener Durchbruch in der diskreten Geometrie – Erdős' Unit Distance Problem widerlegt, Mai 2026
    https://www.youtube.com/watch?v=gCHEFZDPVYs
  7. Will Sawin (Princeton): „An explicit lower bound for the unit distance problem", arXiv, Mai 2026
    https://arxiv.org/html/2605.20695v1
  8. Kolmogorov-Arnold Networks: Interpretierbare Alternative zu klassischen neuronalen Netzen, Phys.org, Dezember 2025
    https://phys.org/news/2025-12-kolmogorov-arnold-networks-bridge-ai.html
  9. Symbolic-KAN: Kolmogorov-Arnold Networks mit diskreter symbolischer Struktur für interpretierbares Lernen, arXiv, 2026
    https://arxiv.org/abs/2603.23854
  10. Emergent Riemannian Geometry: Diskrete Berechnungen auf kontinuierlichen Mannigfaltigkeiten in neuronalen Netzen, arXiv, 2025
    https://arxiv.org/pdf/2512.00196
  11. Call for Papers: Mechanistic Interpretability Workshop at ICML 2026
    https://mechinterpworkshop.com/cfp/