进行中

KG4J — 司法知识图谱 (Knowledge Graphs for Justice)

致力于在司法领域应用知识图谱的研究项目。

Period : 2025 – 2029

资助方 : BELSPO

角色 : 首席研究员 (Principal Investigator)

Budget : 392,798.60 €

司法 · 知识图谱 · 数据 · 人工智能

KG4J 是一个在 2025 年提交的项目,属于比利时联邦科学政策事业部(BELSPOP4Science 呼吁的一部分。我是该项目的首席研究员及提案作者。

该项目旨在探索知识图谱对比利时国家刑事技术与犯罪学研究所 (INCC) 数据整合的贡献,以及提升分析能力。

联盟汇集了以下合作伙伴:

项目官方摘要:

国家刑事技术与犯罪学研究所 (INCC) 在比利时刑事司法系统中发挥着科学作用。一方面,它在 DNA、毒理学和毒品等领域提供法医药科学鉴定。另一方面,它进行犯罪学研究,例如有关累犯和犯罪生涯的研究。为此,它需要处理大量数据。然而,这些数据中的许多都是支离破碎或未被充分利用的。有价值的信息仍然处于隐藏状态。

提案

Knowledge Graphs for Justice (KG4J) 项目旨在解决这一问题。如何解决?通过构建和利用基于图论、知识图谱和人工智能(AI)——特别是大语言模型(LLM)的数据分析系统。并定义数据和 AI 治理政策。

什么是图论?

图是表示连接数据的自然方式。实体成为通过关系连接的节点。想象一下地铁线路图:每个站点都是一个节点,每条线路代表一种关系。两个站点之间的最短距离是多少?哪个站点最繁忙?图论回答了这些类型的问题。

什么是知识图谱?

添加语义信息(即含义的定义)可以将普通图转换为知识图谱。它们变得机器可读、可解释且可搜索。现代 AI 系统随后可以利用它们来回答问题。

什么是大语言模型?

LLM 是现代对话代理的引擎。它经过训练,能够根据大量的文本预测人类言语。它可以与我们对话,并帮助完成其他任务,如编程。

我们将利用这项技术做什么

KG4J 项目将把图论、知识图谱和 LLM 应用于选定的用例,以揭示现有数据的价值并提供新的能力。

犯罪学研究

INCC 已经利用图从互不相关的数源中研究了累犯和犯罪生涯。现在的目标是处理这个图以发现新的模式。并将其转化为由 AI 增强的知识图谱。这将允许高级查询和更简单的犯罪轨迹探索。

法医药科学鉴定

INCC 通常以战术方式处理法医数据,而没有进行后续的元素间关联分析。例如,DNA 数据库关联了案件之间的 DNA 档案,然后就止步于此。将这些数据转化为图将能够揭示共谋模式并发现犯罪网络。关联证据既支持正在进行的调查,也支持长期的刑事政策。

非结构化数据

听证会笔录、专家笔记、录音:非结构化数据的数量是巨大的。多亏了 AI——特别是 LLM——将它们转换为知识图谱成为可能。该图随后能够回答关于这些内容的问题。

目标

  1. 构建知识图谱基础设施 (KGI),整合犯罪学和法医数据,通过直观的界面进行查询。

  2. 演示用例:累犯统计、新模式发现和法医应用。

  3. 开发处理非结构化数据的方法:从文本中提取图、话语分析和犯罪轨迹重建,并具备 LLM 的对话能力。

  4. 定义符合机构价值观和法律要求的数据和 AI 治理模型。

结论

KG4J 项目将使 INCC 能够生成增强的犯罪学和法医药科学情报。它连接了碎片化的数据,发掘了现有数据的价值,通过图和 AI 开发了新的能力,并建立了服务于司法的可靠数据和 AI 实践。