In Bearbeitung

KG4J — Knowledge Graphs for Justice

Forschungsprojekt zur Nutzung von Wissensgraphen im Bereich der Justiz.

Period : 2025 – 2029

Förderer : BELSPO

Rolle : Hauptforscher (Principal Investigator)

Budget : 392.798,60 €

Justiz · Wissensgraphen · Daten · KI

KG4J ist ein Projekt, das 2025 im Rahmen der P4Science-Ausschreibung der belgischen föderalen Wissenschaftspolitik (BELSPO) eingereicht wurde. Ich bin der Hauptforscher und Autor des Vorschlags.

Das Projekt zielt darauf ab, den Beitrag von Wissensgraphen zur Datenintegration am Nationalen Institut für Kriminalistik und Kriminologie (NICC) zu untersuchen und die Analysekapazitäten zu verbessern.

Das Konsortium bringt folgende Partner zusammen:

Offizielle Projektzusammenfassung:

Das Nationale Institut für Kriminalistik und Kriminologie (NICC) spielt eine wissenschaftliche Rolle im belgischen Strafjustizsystem. Einerseits bietet es forensische Expertise in Bereichen wie DNA, Toxikologie und Drogen an. Andererseits betreibt es kriminologische Forschung, zum Beispiel zu Rückfälligkeit und kriminellen Karrieren. Dafür verarbeitet es eine große Menge an Daten. Viele dieser Daten sind jedoch fragmentiert oder werden zu wenig genutzt. Wertvolle Informationen bleiben verborgen.

Vorschlag

Das Projekt Knowledge Graphs for Justice (KG4J) zielt darauf ab, dieses Problem zu lösen. Wie? Durch den Aufbau und die Nutzung von Datenanalysesystemen, die auf Graphentheorie, Wissensgraphen und künstlicher Intelligenz (KI), insbesondere großen Sprachmodellen (LLMs), basieren. Und durch die Festlegung einer Daten- und KI-Governance-Politik.

Was ist Graphentheorie?

Graphen sind eine natürliche Art, verbundene Daten darzustellen. Entitäten werden zu Knoten, die durch Beziehungen verbunden sind. Stellen Sie sich einen U-Bahn-Plan vor: Jede Station ist ein Knoten, jede Linie eine Beziehung. Was ist die kürzeste Entfernung zwischen zwei Stationen? Welche Station ist am besten vernetzt? Die Graphentheorie beantwortet diese Arten von Fragen.

Was ist ein Wissensgraph?

Das Hinzufügen semantischer Informationen – d. h. Definitionen von Bedeutung – verwandelt einen Graphen in einen Wissensgraphen. Sie werden maschinenlesbar, interpretierbar und abfragbar. Moderne KI-Systeme können sie dann nutzen, um Fragen zu beantworten.

Was ist ein großes Sprachmodell?

Ein LLM ist das Herzstück moderner Konversationsagenten. Es wurde darauf trainiert, menschliche Sprache basierend auf großen Textmengen vorherzusagen. Es kann mit uns in den Dialog treten und helfen, andere Aufgaben wie die Programmierung zu erledigen.

Was wir mit dieser Technologie tun werden

Das KG4J-Projekt wird Graphentheorie, Wissensgraphen und LLMs auf ausgewählte Anwendungsfälle anwenden, um den Wert vorhandener Daten zu erschließen und neue Möglichkeiten zu schaffen.

Kriminologische Forschung

Das NICC hat bereits einen Graphen verwendet, um Rückfälligkeit und kriminelle Karrieren anhand von getrennten Datenquellen zu untersuchen. Das Ziel ist es nun, diesen Graphen zu verarbeiten, um neue Muster zu entdecken. Und ihn in einen KI-angereicherten Wissensgraphen umzuwandeln. Dies wird fortgeschrittene Abfragen und eine einfachere Erkundung krimineller Trajektorien ermöglichen.

Forensische Expertise

Das NICC verarbeitet forensische Daten in der Regel taktisch, ohne anschließende Analyse, die die Elemente miteinander verbindet. Beispielsweise verknüpfen DNA-Datenbanken DNA-Profile zwischen Fällen und hören dann dort auf. Die Umwandlung dieser Daten in einen Graphen würde Muster der Mittäterschaft aufdecken und kriminelle Netzwerke entdecken. Die Verknüpfung von Beweisen unterstützt sowohl laufende Ermittlungen als auch die langfristige Kriminalpolitik.

Unstrukturierte Daten

Vernehmungsprotokolle, Expertennotizen, Aufzeichnungen: Die Menge an unstrukturierten Daten ist immens. Dank KI – und insbesondere LLMs – wird es möglich, diese in einen Wissensgraphen umzuwandeln. Dieser Graph kann dann Fragen zu diesen Inhalten beantworten.

Ziele

  1. Aufbau einer Wissensgraph-Infrastruktur (KGI), die kriminologische und forensische Daten integriert und über eine intuitive Benutzeroberfläche abfragbar ist.

  2. Demonstration von Anwendungsfällen: Rückfallstatistiken, Entdeckung neuer Muster und forensische Anwendungen.

  3. Entwicklung von Methoden zur Verarbeitung unstrukturierter Daten: Extraktion von Graphen aus Text, Diskursanalyse und Rekonstruktion krimineller Trajektorien mit den Konversationsfähigkeiten von LLMs.

  4. Festlegung eines Daten- und KI-Governance-Modells, das den institutionellen Werten und rechtlichen Anforderungen entspricht.

Fazit

Das Projekt KG4J wird es dem NICC ermöglichen, verstärkte kriminologische und forensische Erkenntnisse zu gewinnen. Es verbindet fragmentierte Daten, wertet vorhandene Daten auf, entwickelt neue Möglichkeiten über Graphen und KI und etabliert zuverlässige Praktiken im Bereich Daten und KI im Dienste der Justiz.