進行中

KG4J — 司法のためのナレッジグラフ

司法分野におけるナレッジグラフの活用を目的とした研究プロジェクト。

Period : 2025 – 2029

資金提供者 : BELSPO

役割 : 主任研究員 (Principal Investigator)

Budget : 392,798.60 €

司法 · ナレッジグラフ · データ · AI

KG4Jは、ベルギー連邦科学政策局(BELSPO)のP4Science公募の一環として2025年に提出されたプロジェクトです。私はこのプロジェクトの主任研究員(Principal Investigator)であり、提案書の作成者でもあります。

本プロジェクトは、国立犯罪学・刑事司法研究所(INCC)におけるデータ統合のためのナレッジグラフの貢献を調査し、分析能力を向上させることを目的としています。

コンソーシアムには以下のパートナーが参加しています。

プロジェクト公式概要:

国立犯罪学・刑事司法研究所(INCC)は、ベルギーの刑事司法制度において科学的な役割を担っています。一方で、DNA、毒物学、薬物などの分野でフォレンジック(科学捜査)の専門知識を提供し、他方で、再犯や犯罪経歴などの犯罪学研究を行っています。そのために膨大なデータを処理していますが、データの多くは断片的であったり、十分に活用されていなかったりします。貴重な情報が隠れたままになっています。

提案

Knowledge Graphs for Justice(KG4J)プロジェクトは、この問題を解決することを目指しています。どのようにして? グラフ理論、ナレッジグラフ、そして大規模言語モデル(LLM)を含む人工知能(AI)に基づいたデータ分析システムを構築・活用することによってです。そして、データとAIのガバナンス政策を定義することによってです。

グラフ理論とは?

グラフは、つながりのあるデータを表現するための自然な方法です。エンティティ(実体)は関係によって結ばれたノード(節点)になります。地下鉄の路線図を想像してみてください。各駅がノードであり、各路線が関係です。2つの駅の間の最短距離は? 最も多くの路線がつながっている駅は? グラフ理論はこのような質問に答えます。

ナレッジグラフとは?

意味の定義、つまりセマンティック情報を追加することで、グラフはナレッジグラフに変わります。これにより、データは機械可読、解釈可能、かつ検索可能になります。現代のAIシステムは、これらを活用して質問に答えることができます。

大規模言語モデルとは?

LLMは、現代の対話型エージェントのエンジンです。膨大なテキストデータから人間の言語を予測するように訓練されています。私たちと対話し、プログラミングなどの他のタスクの達成を支援することができます。

このテクノロジーで何をするか

KG4Jプロジェクトは、選択されたユースケースにグラフ理論、ナレッジグラフ、およびLLMを適用し、既存データの価値を明らかにし、新たな能力を提供します。

犯罪学研究

INCCはすでに、切断されたデータソースから再犯や犯罪経歴を調査するためにグラフを使用してきました。現在の目標は、このグラフを処理して新しいパターンを発見すること、そしてそれをAIによって強化されたナレッジグラフに変換することです。これにより、高度なクエリや犯罪軌道のより簡単な探索が可能になります。

フォレンジック専門知識

INCCは通常、フォレンジックデータを戦術的に処理しており、要素同士を結びつけるその後の分析は行っていません。例えば、DNAデータベースは事件間でDNAプロファイルを関連付けますが、そこで止まってしまいます。これらのデータをグラフに変換することで、共犯パターンを明らかにし、犯罪ネットワークを発見することが可能になります。証拠を結びつけることは、進行中の捜査と長期的な刑事政策の両方をサポートします。

非構造化データ

聴取の書き起こし、専門家のメモ、録音など、非構造化データの量は膨大です。AI、特にLLMのおかげで、これらをナレッジグラフに変換することが可能になります。このグラフは、これらのコンテンツに関する質問に答えることができます。

目標

  1. 犯罪学およびフォレンジックデータを統合し、直感的なインターフェースを通じて検索可能なナレッジグラフ基盤(KGI)を構築する。

  2. 再犯統計、新しいパターンの発見、フォレンジック応用などのユースケースを実証する。

  3. LLMの対話能力を活用した、テキストからのグラフ抽出、談話分析、犯罪軌道の再構成など、非構造化データの処理方法を開発する。

  4. 組織の価値観と法的要件に一致した、データおよびAIのガバナンスモデルを定義する。

結論

KG4Jプロジェクトにより、INCCは強化された犯罪学およびフォレンジックインテリジェンスを生成できるようになります。断片化されたデータを結びつけ、既存データの価値を高め、グラフとAIを通じて新しい能力を開発し、司法に資するデータとAIの信頼できる慣行を確立します。