В процессе
KG4J — Графы знаний для правосудия
Исследовательский проект, посвященный использованию графов знаний в сфере правосудия.
Period : 2025 – 2029
Финансирующий орган : BELSPO
Роль : Главный исследователь (PI)
Budget : 392 798,60 €
KG4J — это проект, представленный в 2025 году в рамках конкурса P4Science Федеральной службы по научной политике Бельгии (BELSPO). Я являюсь главным исследователем и автором предложения.
Проект направлен на изучение вклада графов знаний в интеграцию данных в Национальном институте криминалистики и криминологии (NICC) и расширение аналитических возможностей.
В консорциум входят следующие партнеры:
- Факультет информатики, UMONS, Бельгия
- Departement Computerwetenschappen, KU Leuven, Бельгия
- Louvain Research Institute in Management and Organizations, UCLouvain, Бельгия
- Department of Mathematics and Industrial Engineering, Polytechnique Montréal, Канада
- Department of Linguistics, Indiana University Bloomington, США
- Digital Transformation Office, Федеральная государственная служба юстиции, Федеральная государственная служба юстиции, Бельгия
- Elephant Bird Consulting, Elephant Bird Consulting, Бельгия
Официальное резюме проекта:
Национальный институт криминалистики и криминологии (NICC) играет научную роль в системе уголовного правосудия Бельгии. С одной стороны, он предоставляет судебно-медицинскую экспертизу в таких областях, как ДНК, токсикология и наркотики. С другой стороны, он проводит криминологические исследования, например, посвященные рецидивам и криминальной карьере. Для этого он обрабатывает огромный объем данных. Однако многие из этих данных фрагментированы или недостаточно используются. Ценная информация остается скрытой.
Предложение
Проект «Графы знаний для правосудия» (KG4J) направлен на решение этой проблемы. Как? Путем создания и эксплуатации систем анализа данных, основанных на теории графов, графах знаний и искусственном интеллекте (ИИ), включая большие языковые модели (LLM). А также путем определения политики управления данными и ИИ.
Что такое теория графов?
Графы — это естественный способ представления связанных данных. Сущности становятся узлами, соединенными связями. Представьте себе схему метро: каждая станция — это узел, каждая линия — связь. Какое кратчайшее расстояние между двумя станциями? Какая станция самая загруженная? Теория графов отвечает на подобные вопросы.
Что такое граф знаний?
Добавление семантической информации — то есть определений смысла — превращает граф в граф знаний. Они становятся машиночитаемыми, интерпретируемыми и доступными для поиска. Современные системы ИИ могут использовать их для ответов на вопросы.
Что такое большая языковая модель?
LLM — это «движок» современных диалоговых агентов. Она обучена предсказывать человеческую речь на основе огромного количества текстов. Она может вступать с нами в диалог и помогать в выполнении других задач, например, в программировании.
Что мы будем делать с этой технологией
Проект KG4J применит теорию графов, графы знаний и LLM к выбранным сценариям использования, чтобы раскрыть ценность существующих данных и предоставить новые возможности.
Криминологические исследования
NICC уже использовал граф для изучения рецидивов и криминальных траекторий на основе разрозненных источников данных. Цель сейчас — обработать этот граф для выявления новых закономерностей. И превратить его в граф знаний, дополненный ИИ. Это позволит выполнять сложные запросы и упростит исследование криминальных путей.
Судебно-медицинская экспертиза
NICC обычно обрабатывает судебно-медицинские данные тактически, без последующего анализа, связывающего элементы между собой. Например, базы данных ДНК связывают профили ДНК в разных делах, и на этом все заканчивается. Преобразование этих данных в граф позволило бы выявить схемы соучастия. И обнаружить преступные сети. Связывание доказательств поддерживает как текущие расследования, так и долгосрочную уголовную политику.
Неструктурированные данные
Стенограммы слушаний, заметки экспертов, записи: объем неструктурированных данных огромен. Благодаря ИИ — и особенно LLM — становится возможным конвертировать их в граф знаний. Этот граф сможет отвечать на вопросы об этом содержании.
Цели
-
Создать инфраструктуру графов знаний (KGI), интегрирующую криминологические и судебно-медицинские данные, доступную для поиска через интуитивно понятный интерфейс.
-
Продемонстрировать варианты использования: статистику рецидивов, выявление новых закономерностей и судебно-медицинское применение.
-
Разработать методы обработки неструктурированных данных: извлечение графов из текста, анализ дискурса и реконструкцию криминальных траекторий с использованием диалоговых возможностей LLM.
-
Определить модель управления данными и ИИ, соответствующую институциональным ценностям и юридическим требованиям.
Заключение
Проект KG4J позволит NICC производить более качественную криминологическую и судебно-медицинскую информацию. Он связывает фрагментированные данные, повышает ценность существующих данных, развивает новые возможности с помощью графов и ИИ и внедряет надежные практики работы с данными и ИИ на службе правосудия.
✦