En curso

KG4J — Knowledge Graphs for Justice

Proyecto de investigación dedicado al uso de grafos de conocimiento en el ámbito de la justicia.

Period : 2025 – 2029

Financiador : BELSPO

Rol : Investigador principal

Budget : 392.798,60 €

justicia · grafos de conocimiento · datos · IA

KG4J es un proyecto presentado en 2025 en el marco de la convocatoria P4Science de la Política Científica Federal Belga (BELSPO). Soy el investigador principal y el autor de la propuesta.

El proyecto tiene como objetivo explorar la contribución de los grafos de conocimiento para la integración de datos en el Instituto Nacional de Criminalística y Criminología (INCC), y la mejora de las capacidades analíticas.

El consorcio reúne a los siguientes socios:

Resumen oficial del proyecto:

El Instituto Nacional de Criminalística y Criminología (INCC) desempeña un papel científico en el sistema de justicia penal belga. Por un lado, proporciona peritajes forenses en áreas como el ADN, la toxicología y las drogas. Por otro lado, lleva a cabo investigaciones criminológicas, por ejemplo, sobre la reincidencia y las carreras criminales. Para ello, procesa una gran cantidad de datos. Sin embargo, muchos de estos datos están fragmentados o infrautilizados. La información valiosa permanece oculta.

Propuesta

El proyecto Knowledge Graphs for Justice (KG4J) tiene como objetivo resolver este problema. ¿Cómo? Mediante la construcción y el aprovechamiento de sistemas de análisis de datos basados en la teoría de grafos, los grafos de conocimiento y la inteligencia artificial (IA), incluidos los grandes modelos de lenguaje (LLM). Y mediante la definición de una política de gobernanza de datos y de IA.

¿Qué es la teoría de grafos?

Los grafos son una forma natural de representar datos conectados. Las entidades se convierten en nodos unidos por relaciones. Imagine un plano de metro: cada estación es un nodo, cada línea una relación. ¿Cuál es la distancia más corta entre dos estaciones? ¿Cuál es la estación más conectada? La teoría de grafos responde a este tipo de preguntas.

¿Qué es un grafo de conocimiento?

La adición de información semántica —es decir, definiciones de significado— transforma un grafo en un grafo de conocimiento. Se vuelven legibles por máquina, interpretables y consultables. Los sistemas de IA modernos pueden entonces aprovecharlos para responder preguntas.

¿Qué es un gran modelo de lenguaje?

Un LLM es el motor de los agentes conversacionales modernos. Ha sido entrenado para predecir el discurso humano a partir de grandes cantidades de texto. Puede dialogar con nosotros y ayudar a realizar otras tareas, como la programación.

Qué haremos con esta tecnología

El proyecto KG4J aplicará la teoría de grafos, los grafos de conocimiento y los LLM a casos de uso seleccionados, con el fin de revelar el valor de los datos existentes y proporcionar nuevas capacidades.

Investigación criminológica

El INCC ya ha utilizado un grafo para examinar la reincidencia y las carreras criminales a partir de fuentes de datos desconectadas. El objetivo ahora es procesar este grafo para descubrir nuevos patrones. Y transformarlo en un grafo de conocimiento enriquecido por la IA. Esto permitirá consultas avanzadas y una exploración más sencilla de las trayectorias criminales.

Pericia forense

El INCC trata generalmente los datos forenses de forma táctica, sin análisis posteriores que vinculen los elementos entre sí. Por ejemplo, las bases de datos de ADN asocian perfiles de ADN entre casos y luego se detienen allí. Transformar estos datos en un grafo permitiría revelar patrones de codelincuencia y descubrir redes criminales. Vincular las pruebas apoya tanto las investigaciones en curso como la política criminal a largo plazo.

Datos no estructurados

Transcripciones de audiencias, notas de expertos, grabaciones: la cantidad de datos no estructurados es inmensa. Gracias a la IA —y particularmente a los LLM— se vuelve posible convertirlos en un grafo de conocimiento. Este grafo podrá entonces responder a preguntas sobre estos contenidos.

Objetivos

  1. Construir una infraestructura de grafos de conocimiento (KGI) que integre datos criminológicos y forenses, consultable a través de una interfaz intuitiva.

  2. Demostrar casos de uso: estadísticas sobre reincidencia, descubrimiento de nuevos patrones y aplicaciones forenses.

  3. Desarrollar métodos de procesamiento de datos no estructurados: extracción de grafos a partir del texto, análisis del discurso y reconstrucción de trayectorias criminales, con capacidades conversacionales de los LLM.

  4. Definir un modelo de gobernanza de datos y de IA conforme a los valores institucionales y a los requisitos legales.

Conclusión

El proyecto KG4J permitirá al INCC producir una inteligencia criminológica y forense reforzada. Conecta datos fragmentados, pone en valor los datos existentes, desarrolla nuevas capacidades a través de grafos e IA, y establece prácticas fiables en materia de datos e IA al servicio de la justicia.