論文の概要: Automatic Construction of a Legal Citation Graph from 100 Million Ukrainian Court Decisions: Large-Scale Extraction, Topological Analysis, and Ontology-Driven Clustering
- arxiv url: http://arxiv.org/abs/2605.15362v1
- Date: Thu, 14 May 2026 19:42:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 17:44:16.277419
- Title: Automatic Construction of a Legal Citation Graph from 100 Million Ukrainian Court Decisions: Large-Scale Extraction, Topological Analysis, and Ontology-Driven Clustering
- Title(参考訳): 1億のウクライナ裁判所判決から得られた法定引用グラフの自動構築:大規模抽出,トポロジカル解析,オントロジー駆動クラスタリング
- Authors: Volodymyr Ovcharov,
- Abstract要約: ウクライナの裁判所決定から抽出された1070万件の訴訟の端は、司法の引用構造が監督なしで法域の境界をコードしていることを示している。
完全SRレジストリから最初の大規模引用グラフ(9950万全文、1.1TB)を構築する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Half a billion citation edges extracted from 100.7 million Ukrainian court decisions reveal that judicial citation structure encodes legal domain boundaries without supervision and predicts future legislative importance with near-perfect accuracy. We construct the first large-scale citation graph from the complete EDRSR registry (99.5 million full texts, 1.1 TB), extracting 502 million citation links across six types via regex on commodity hardware in approximately 5 hours, with precision of 1.00 on a 200-decision validation sample (95% Wilson CI: [0.982, 1.000]). Three principal findings emerge. (1) The degree distribution follows a power law (alpha = 1.57 +/- 0.008), placing the Ukrainian court network near the EU Court of Justice and below the US Supreme Court, with hub articles cited by millions of decisions. (2) Louvain community detection on the co-citation projection recovers legal domain boundaries (civil, criminal, administrative, commercial) with modularity Q = 0.44-0.55 and temporal stability (NMI = 0.83-0.86 across periods), constituting an automatically constructed legal ontology grounded in judicial practice. (3) Citation features predict top-1000 articles with AUC = 0.9984, substantially outperforming a naive frequency baseline (P@1000 = 0.655); temporal dynamics detect legislative regime changes as phase transitions and the 2022 invasion as a citation entropy spike (H: 11.02 -> 13.49) with emergent wartime legislation nodes. The citation-derived ontology is operationalized as the domain layer of a workflow memory system for LLM-assisted legal analysis, connecting to the ontology-controlled paradigm. The extraction pipeline, analysis code, and aggregated statistics are released as open data.
- Abstract(参考訳): ウクライナの裁判所で170万件の判決から抽出された50億件の引用エッジは、司法引用構造が監督なしで法域の境界を符号化し、ほぼ完全な精度で将来の立法上の重要性を予測していることを示している。
完全EDRSRレジストリ(9950万全文、1.1 TB)から最初の大規模引用グラフを構築し、約5時間で6種類の引用リンクを抽出し、200個の精度検証サンプル(95% Wilson CI: [0.982, 1.000])で1.00の精度で、商品ハードウェア上のレジェックスで5200万個の引用リンクを抽出した。
主な発見は3つある。
1) 学位の配分は権限法(alpha = 1.57 +/- 0.008)に従っており、ウクライナの裁判所ネットワークはEU司法裁判所の近くにあり、合衆国最高裁判所の下に置かれている。
2)共引用予測に基づくルービン共同体の検出は,モジュール性Q = 0.44-0.55 と時間安定性 (NMI = 0.83-0.86 期間) で法的領域境界(市民,刑事,行政,商業)を回復し,司法実務に根ざした法的なオントロジーを自動構築する。
(3)Citationの特徴は、AUC = 0.9984で上位1000項目を予測し(P@1000 = 0.655)、時間力学は相転移として立法体制の変化を検知し、2022年の侵略は引用エントロピースパイク(H: 11.02 -> 13.49)として、突発的な戦時法制ノードを持つ。
LLM法則解析のためのワークフローメモリシステムのドメイン層として、引用由来のオントロジーが動作し、オントロジー制御パラダイムに接続する。
抽出パイプライン、解析コード、集約された統計データをオープンデータとしてリリースする。
関連論文リスト
- Accurate Legal Reasoning at Scale: Neuro-Symbolic Offloading and Structural Auditability for Robust Legal Adjudication [0.0]
法文はしばしば計算法的条項を含み、その理解には複雑な論理が必要である。
我々は、LLMを1度だけ使用して、法的テキストを決定論的自律契約言語に翻訳する、ニューロシンボリックなアプローチであるAmortized Intelligenceを提案する。
DACLをベースとしたエージェントは, ほぼ完全な整合性を実現し, 確率論的モデルで観測される「放散崖」を緩和する。
論文 参考訳(メタデータ) (2026-05-04T11:13:59Z) - Towards Intelligent Legal Document Analysis: CNN-Driven Classification of Case Law Texts [1.3192560874022086]
本研究は,引用処理分類のための軽量かつ高精度なフレームワークを提案する。
単語認識型FastText埋め込みと1次元畳み込みニューラルネットワーク(CNN)との補間に基づく前処理を併用する。
提案システムは97.26%の分類精度と96.82%のマクロF1スコアを達成し,既存のベースラインを超えている。
論文 参考訳(メタデータ) (2026-04-20T00:14:11Z) - LAMUS: A Large-Scale Corpus for Legal Argument Mining from U.S. Caselaw using LLMs [0.5830619388189558]
本稿は、アメリカ合衆国最高裁判所の決定とテキサス州の刑事法定の意見から構築された、刑期レベルの法的議論採掘コーパスであるLAMUSを紹介する。
データセットは、大規模なケースコレクション、自動アノテーション、ターゲットとする人間のループ品質改善を組み合わせた、データ中心のパイプラインを使用して作成される。
論文 参考訳(メタデータ) (2026-03-09T12:01:42Z) - LegalOne: A Family of Foundation Models for Reliable Legal Reasoning [54.57434222018289]
我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。
LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。
LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
論文 参考訳(メタデータ) (2026-01-31T10:18:32Z) - Relative Scaling Laws for LLMs [91.73497548097775]
スケーリング法則は、追加のデータ、パラメータ、計算によって言語モデルがどのように改善されるかを記述する。
相対的なスケーリング法則を導入し、テスト分布間のパフォーマンスギャップをスケールで追跡する。
これらの結果は、スケーリングは全体的なパフォーマンスを改善するが、普遍的等化器ではないことを示している。
論文 参考訳(メタデータ) (2025-10-28T16:55:22Z) - Unilaw-R1: A Large Language Model for Legal Reasoning with Reinforcement Learning and Iterative Inference [15.567885200167913]
法的な推論に適した大規模言語モデルであるUnilaw-R1を紹介する。
軽量な7ビリオンパラメータスケールにより、Unilaw-R1はデプロイメントコストを大幅に削減する。
法律分野では、不十分な法的知識、信頼できない推論論理、弱いビジネス一般化の3つの主要な課題に取り組む。
論文 参考訳(メタデータ) (2025-10-11T07:17:22Z) - AI for Statutory Simplification: A Comprehensive State Legal Corpus and Labor Benchmark [5.268588811689132]
アメリカ合衆国のある州は、AIを使って州のコードの3分の1を削除したと主張している。
この領域でAI機能を評価するためのベンチマークデータセットであるLaborBenchを紹介します。
論文 参考訳(メタデータ) (2025-08-26T18:53:39Z) - AppealCase: A Dataset and Benchmark for Civil Case Appeal Scenarios [47.83822985839837]
本稿では,91件の民事事件の1万対の実世界と一致した第1インスタンスと第2インスタンスの文書からなるFiceCaseデータセットを提案する。
このデータセットには、判断の逆転、逆転理由、引用された法的規定、クレームレベルの決定、第2のインスタンスに新たな情報があるかどうかという5つの側面に沿った詳細なアノテーションも含まれている。
実験結果から, すべてのモデルが判定逆転予測タスクにおいて50%未満のF1スコアを達成し, 魅力シナリオの複雑さと課題を浮き彫りにしていることがわかった。
論文 参考訳(メタデータ) (2025-05-22T10:50:33Z) - CopyrightShield: Enhancing Diffusion Model Security against Copyright Infringement Attacks [61.06621533874629]
拡散モデルは、攻撃者が戦略的に修正された非侵害画像をトレーニングセットに注入する著作権侵害攻撃に弱い。
まず、上記の攻撃に対して防御するための防御フレームワーク、PhiliptyShieldを提案する。
実験により,PhiliptyShieldは2つの攻撃シナリオで有毒なサンプル検出性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-12-02T14:19:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。