In uitvoering

KG4J — Knowledge Graphs for Justice

Onderzoeksproject gewijd aan het gebruik van knowledge graphs in de sector van justitie.

Periode : 2025 – 2029

Financier : BELSPO

Rol : Principal Investigator

Budget : 392.798,60 €

justitie · knowledge graphs · data · AI

KG4J is een project dat in 2025 werd ingediend in het kader van de P4Science oproep van het Federaal Wetenschapsbeleid (BELSPO). Ik ben de hoofdonderzoeker en de auteur van het voorstel.

Het project beoogt de bijdrage van knowledge graphs te verkennen voor data-integratie bij het Nationaal Instituut voor Criminalistiek en Criminologie (NICC), en de analysecapaciteiten te verbeteren.

Het consortium brengt de volgende partners samen:

Officieel projectoverzicht:

Het Nationaal Instituut voor Criminalistiek en Criminologie (NICC) speelt een wetenschappelijke rol in het Belgische strafrechtsysteem. Enerzijds verleent het forensische expertise op gebieden als DNA, toxicologie en drugs. Anderzijds voert het criminologisch onderzoek uit, bijvoorbeeld naar recidive en criminele carrières. Hiervoor verwerkt het een grote hoeveelheid gegevens. Veel van deze gegevens zijn echter gefragmenteerd of onderbenut. Waardevolle informatie blijft verborgen.

Voorstel

Het project Knowledge Graphs for Justice (KG4J) beoogt dit probleem op te lossen. Hoe? Door systemen voor data-analyse te bouwen en te exploiteren op basis van grafentheorie, knowledge graphs en artificiële intelligentie (AI), waaronder grote taalmodellen (LLM’s). En door een beleid voor data- en AI-governance te definiëren.

Wat is grafentheorie?

Grafen zijn een natuurlijke manier om verbonden gegevens weer te geven. Entiteiten worden knooppunten (nodes) verbonden door relaties. Stel je een metrokaart voor: elk station is een knooppunt, elke lijn een relatie. Wat is de kortste afstand tussen twee stations? Welk station is het meest verbonden? Grafentheorie beantwoordt dit soort vragen.

Wat is een knowledge graph?

De toevoeging van semantische informatie — d.w.z. definities van betekenis — transformeert een graaf in een knowledge graph. Ze worden machineleesbaar, interpreteerbaar en doorzoekbaar. Moderne AI-systemen kunnen ze dan exploiteren om vragen te beantwoorden.

Wat is een groot taalmodel?

Een LLM is de motor van moderne conversationele agenten. Het is getraind om menselijke spraak te voorspellen op basis van grote hoeveelheden tekst. Het kan met ons in gesprek gaan en helpen bij het voltooien van andere taken, zoals programmeren.

Wat we met deze technologie zullen doen

Het KG4J-project zal grafentheorie, knowledge graphs en LLM’s toepassen op geselecteerde use cases, om de waarde van bestaande gegevens te onthullen en nieuwe mogelijkheden te bieden.

Criminologisch onderzoek

Het NICC heeft al een graaf gebruikt om recidive en criminele carrières te onderzoeken op basis van niet-verbonden gegevensbronnen. Het doel is nu om deze graaf te verwerken om nieuwe patronen te ontdekken. En om deze te transformeren in een door AI verrijkte knowledge graph. Dit zal geavanceerde zoekopdrachten en een eenvoudigere verkenning van criminele trajecten mogelijk maken.

Forensische expertise

Het NICC verwerkt forensische gegevens meestal tactisch, zonder verdere analyse die de elementen met elkaar verbindt. DNA-databanken koppelen bijvoorbeeld DNA-profielen tussen zaken, en stoppen daar. Het transformeren van deze gegevens naar een graaf zou patronen van mede-daderschap onthullen. En criminele netwerken ontdekken. Het koppelen van bewijsmateriaal ondersteunt zowel lopende onderzoeken als het strafrechtelijk beleid op lange termijn.

Ongestructureerde gegevens

Transcripties van verhoren, nota’s van deskundigen, opnames: de hoeveelheid ongestructureerde gegevens is immens. Dankzij AI — en in het bijzonder LLM’s — wordt het mogelijk om deze om te zetten in een knowledge graph. Deze graaf kan dan vragen over deze inhoud beantwoorden.

Doelstellingen

  1. Bouwen van een knowledge graph infrastructuur (KGI) die criminologische en forensische gegevens integreert, doorzoekbaar via een intuïtieve interface.

  2. Demonstreren van use cases: statistieken over recidive, ontdekking van nieuwe patronen en forensische toepassingen.

  3. Ontwikkelen van methoden voor het verwerken van ongestructureerde gegevens: extractie van grafen uit tekst, discoursanalyse en reconstructie van criminele trajecten, met conversationele mogelijkheden van LLM’s.

  4. Definiëren van een data- en AI-governancemodel dat in overeenstemming is met institutionele waarden en wettelijke vereisten.

Conclusie

Het KG4J-project zal het NICC in staat stellen om versterkte criminologische en forensische intelligentie te produceren. Het verbindt gefragmenteerde gegevens, valoriseert bestaande gegevens, ontwikkelt nieuwe capaciteiten via grafen en AI, en stelt betrouwbare praktijken vast op het gebied van data en AI ten dienste van justitie.