Em curso

KG4J — Knowledge Graphs for Justice

Projeto de investigação dedicado à utilização de grafos de conhecimento no domínio da justiça.

Period : 2025 – 2029

Financiador : BELSPO

Papel : Investigador Principal

Budget : 392.798,60 €

justiça · grafos de conhecimento · dados · IA

O KG4J é um projeto submetido em 2025 no âmbito do concurso P4Science da Política Científica Federal Belga (BELSPO). Sou o investigador principal e autor da proposta.

O projeto visa explorar o contributo dos grafos de conhecimento para a integração de dados no Instituto Nacional de Criminalística e Criminologia (INCC), e a melhoria das capacidades de análise.

O consórcio reúne os seguintes parceiros:

Resumo oficial do projeto:

O Instituto Nacional de Criminalística e Criminologia (INCC) desempenha um papel científico no sistema de justiça penal belga. Por um lado, fornece competência forense em áreas como o ADN, a toxicologia e as drogas. Por outro lado, realiza investigação criminológica, por exemplo, sobre a reincidência e as carreiras criminosas. Para isso, processa uma grande quantidade de dados. No entanto, muitos destes dados estão fragmentados ou subutilizados. Informações valiosas permanecem ocultas.

Proposta

O projeto Knowledge Graphs for Justice (KG4J) visa resolver este problema. Como? Construindo e explorando sistemas de análise de dados baseados na teoria dos grafos, nos grafos de conhecimento e na inteligência artificial (IA), nomeadamente nos grandes modelos de linguagem (LLM). E definindo uma política de governação de dados e de IA.

O que é a teoria dos grafos?

Os grafos constituem um meio natural de representar dados ligados. As entidades tornam-se nós ligados por relações. Imagine um mapa do metro: cada estação é um nó, cada linha uma relação. Qual é a distância mais curta entre duas estações? Qual é a estação mais ligada? A teoria dos grafos responde a este tipo de questões.

O que é um grafo de conhecimento?

A adição de informações semânticas — ou seja, definições de significado — transforma um grafo num grafo de conhecimento. Tornam-se legíveis por máquina, interpretáveis e pesquisáveis. Os sistemas de IA modernos podem então explorá-los para responder a perguntas.

O que é um grande modelo de linguagem?

Um LLM é o motor dos modernos agentes conversacionais. Foi treinado para prever o discurso humano a partir de grandes quantidades de texto. Pode dialogar connosco e ajudar a realizar outras tarefas, como a programação.

O que faremos com esta tecnologia

O projeto KG4J aplicará a teoria dos grafos, os grafos de conhecimento e os LLM a casos de utilização selecionados, a fim de revelar o valor dos dados existentes e fornecer novas capacidades.

Investigação criminológica

O INCC já utilizou um grafo para examinar a reincidência e as carreiras criminosas a partir de fontes de dados desligadas. O objetivo agora é processar este grafo para descobrir novos padrões. E transformá-lo num grafo de conhecimento enriquecido por IA. Isso permitirá consultas avançadas e uma exploração mais simples das trajetórias criminosas.

Competência forense

O INCC geralmente processa os dados forenses de forma táctica, sem análise posterior que ligue os elementos entre si. Por exemplo, os bancos de dados de ADN associam perfis de ADN entre casos e param por aí. Transformar estes dados num grafo permitiria revelar padrões de co-delinquência e descobrir redes criminosas. Ligar as provas apoia tanto as investigações em curso como a política criminal a longo prazo.

Dados não estruturados

Transcrições de audiências, notas de peritos, gravações: a quantidade de dados não estruturados é imensa. Graças à IA — e particularmente aos LLM — torna-se possível convertê-los num grafo de conhecimento. Este grafo poderá então responder a perguntas sobre estes conteúdos.

Objetivos

  1. Construir uma infraestrutura de grafos de conhecimento (KGI) integrando dados criminológicos e forenses, pesquisável através de uma interface intuitiva.

  2. Demonstrar casos de utilização: estatísticas sobre a reincidência, descoberta de novos padrões e aplicações forenses.

  3. Desenvolver métodos de processamento de dados não estruturados: extração de grafos a partir do texto, análise de discurso e reconstrução de trajetórias criminais, com capacidades conversacionais dos LLM.

  4. Definir um modelo de governação de dados e de IA em conformidade com os valores institucionais e as exigências legais.

Conclusão

O projeto KG4J permitirá ao INCC produzir uma inteligência criminológica e forense reforçada. Liga os dados fragmentados, valoriza os dados existentes, desenvolve novas capacidades através de grafos e IA, e estabelece práticas fiáveis em matéria de dados e IA ao serviço da justiça.