In corso

KG4J — Knowledge Graphs for Justice

Progetto di ricerca dedicato all'uso dei grafi di conoscenza nel campo della giustizia.

Period : 2025 – 2029

Finanziatore : BELSPO

Ruolo : Investigatore principale

Budget : 392.798,60 €

giustizia · grafi di conoscenza · dati · IA

KG4J è un progetto presentato nel 2025 nell’ambito del bando P4Science della Politica Scientifica Federale Belga (BELSPO). Ne sono il ricercatore principale e l’autore della proposta.

Il progetto mira a esplorare il contributo dei grafi di conoscenza per l’integrazione dei dati presso l’Istituto Nazionale di Criminalistica e Criminologia (INCC) e il miglioramento delle capacità analitiche.

Il consorzio riunisce i seguenti partner:

Sintesi ufficiale del progetto:

L’Istituto Nazionale di Criminalistica e Criminologia (INCC) svolge un ruolo scientifico nel sistema di giustizia penale belga. Da un lato, fornisce competenza forense in settori quali DNA, tossicologia e droghe. Dall’altro, conduce ricerche criminologiche, ad esempio sulla recidiva e sulle carriere criminali. Per fare ciò, elabora una grande quantità di dati. Tuttavia, molti di questi dati sono frammentati o sottoutilizzati. Informazioni preziose rimangono nascoste.

Proposta

Il progetto Knowledge Graphs for Justice (KG4J) mira a risolvere questo problema. Come? Costruendo e sfruttando sistemi di analisi dei dati basati sulla teoria dei grafi, sui grafi di conoscenza e sull’intelligenza artificiale (IA), in particolare sui grandi modelli linguistici (LLM). E definendo una politica di governance dei dati e dell’IA.

Cos’è la teoria dei grafi?

I grafi sono un modo naturale per rappresentare dati connessi. Le entità diventano nodi collegati da relazioni. Immaginiamo una mappa della metropolitana: ogni stazione è un nodo, ogni linea una relazione. Qual è la distanza più breve tra due stazioni? Qual è la stazione più connessa? La teoria dei grafi risponde a questo tipo di domande.

Cos’è un grafo di conoscenza?

L’aggiunta di informazioni semantiche — cioè definizioni di significato — trasforma un grafo in un grafo di conoscenza. Diventano leggibili dalle macchine, interpretabili e interrogabili. I moderni sistemi di IA possono quindi sfruttarli per rispondere alle domande.

Cos’è un grande modello linguistico?

Un LLM è il motore dei moderni agenti conversazionali. È stato addestrato per prevedere il discorso umano a partire da grandi quantità di testo. Può dialogare con noi e aiutare a compiere altri compiti, come la programmazione.

Cosa faremo con questa tecnologia

Il progetto KG4J applicherà la teoria dei grafi, i grafi di conoscenza e gli LLM a casi d’uso selezionati, al fine di rivelare il valore dei dati esistenti e fornire nuove capacità.

Ricerca criminologica

L’INCC ha già utilizzato un grafo per esaminare la recidiva e le carriere criminali a partire da fonti di dati disconnesse. L’obiettivo ora è elaborare questo grafo per scoprire nuovi modelli. E trasformarlo in un grafo di conoscenza arricchito dall’IA. Ciò consentirà query avanzate e un’esplorazione più semplice delle traiettorie criminali.

Competenza forense

L’INCC generalmente elabora i dati forensi in modo tattico, senza analisi successive che colleghino gli elementi tra loro. Ad esempio, le banche dati del DNA collegano i profili del DNA tra i casi, e poi si fermano lì. Trasformare questi dati in un grafo permetterebbe di rivelare schemi di co-delinquenza. E scoprire reti criminali. Collegare le prove supporta sia le indagini in corso che la politica criminale a lungo termine.

Dati non strutturati

Trascrizioni di interrogatori, note di esperti, registrazioni: la quantità di dati non strutturati è immensa. Grazie all’IA — e in particolare agli LLM — diventa possibile convertirli in un grafo di conoscenza. Questo grafo potrà quindi rispondere a domande su questi contenuti.

Obiettivi

  1. Costruire un’infrastruttura di grafi di conoscenza (KGI) che integri dati criminologici e forensi, interrogabile tramite un’interfaccia intuitiva.

  2. Dimostrare casi d’uso: statistiche sulla recidiva, scoperta di nuovi modelli e applicazioni forensi.

  3. Sviluppare metodi di elaborazione dei dati non strutturati: estrazione di grafi dal testo, analisi del discorso e ricostruzione di traiettorie criminali, con capacità conversazionali degli LLM.

  4. Definire un modello di governance dei dati e dell’IA conforme ai valori istituzionali e ai requisiti legali.

Conclusione

Il progetto KG4J consentirà all’INCC di produrre un’intelligence criminologica e forense rafforzata. Collega i dati frammentati, valorizza i dati esistenti, sviluppa nuove capacità tramite grafi e IA, e stabilisce pratiche affidabili in materia di dati e IA al servizio della giustizia.