論文の概要: VERDICT: Verifiable Evolving Reasoning with Directive-Informed Collegial Teams for Legal Judgment Prediction
- arxiv url: http://arxiv.org/abs/2603.19306v1
- Date: Fri, 13 Mar 2026 07:19:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:38.76462
- Title: VERDICT: Verifiable Evolving Reasoning with Directive-Informed Collegial Teams for Legal Judgment Prediction
- Title(参考訳): VERDICT: 法的判断予測のためのディレクティブ・インフォームド・コレージアルチームによる推論の検証
- Authors: Hui Liao, Chuan Qin, Yongwen Ren, Hao Li, Zhenya Huang, Yanyong Zhang, Chao Wang,
- Abstract要約: LJP(Lawal Judgment Prediction)は、事件事実から適用可能な法律記事、告訴、刑罰条件を予測する。
仮想コレギアルパネルをシミュレートする自己修復型協調型マルチエージェントフレームワークであるVERDICTを提案する。
- 参考スコア(独自算出の注目度): 37.517774304242444
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Legal Judgment Prediction (LJP) predicts applicable law articles, charges, and penalty terms from case facts. Beyond accuracy, LJP calls for intrinsically interpretable and legally grounded reasoning that can reconcile statutory rules with precedent-informed standards. However, existing methods often behave as static, one-shot predictors, providing limited procedural support for verifiable reasoning and little capability to adapt as jurisprudential practice evolves. We propose VERDICT, a self-refining collaborative multi-agent framework that simulates a virtual collegial panel. VERDICT assigns specialized agents to complementary roles (e.g., fact structuring, legal retrieval, opinion drafting, and supervisory verification) and coordinates them in a traceable draft--verify--revise workflow with explicit Pass/Reject feedback, producing verifiable reasoning traces and revision rationales. To capture evolving case experience, we further introduce a Hybrid Jurisprudential Memory (HJM) grounded in the Micro-Directive Paradigm, which stores precedent standards and continually distills validated multi-agent verification trajectories into updated Micro-Directives for continual learning across cases. We evaluate VERDICT on CAIL2018 and a newly constructed CJO2025 dataset with a strict future time-split for temporal generalization. VERDICT achieves state-of-the-art performance on CAIL2018 and demonstrates strong generalization on CJO2025. To facilitate reproducibility and further research, we release our code and the dataset at https://anonymous.4open.science/r/ARR-4437.
- Abstract(参考訳): LJP(Lawal Judgment Prediction)は、事件事実から適用可能な法律記事、告訴、刑罰条件を予測する。
正確性以外にも、LJPは法定規則を前例のない基準と整合させることができる、本質的に解釈可能で法的根拠のある推論を要求している。
しかし、既存の手法は静的で一発の予測器として振る舞うことが多く、検証可能な推論の手続き的サポートが限られており、法学的な実践が進むにつれて適応する能力がほとんどない。
仮想コレギアルパネルをシミュレートする自己修復型協調型マルチエージェントフレームワークであるVERDICTを提案する。
VERDICTは、特別なエージェントを補完的な役割(例えば、事実構造化、法的検索、意見草案作成、監督的検証)に割り当て、明示的なPass/Rejectフィードバックによるトレーサブルなドラフト-検証-修正ワークフローでそれらをコーディネートし、検証可能な推論トレースとリビジョン論理を生成する。
ケースエクスペリエンスの進展を捉えるために,マイクロディレクティブパラダイムを基盤としたHJM(Hybrid Jurisprudential Memory)を導入する。
本稿では,CAIL2018におけるVERDICTと,時間的一般化のための厳密な時間分割を備えたCJO2025データセットについて評価する。
VERDICTはCAIL2018で最先端のパフォーマンスを達成し、CJO2025上で強力な一般化を示す。
再現性とさらなる研究を容易にするため、コードとデータセットをhttps://anonymous.4open.science/r/ARR-4437で公開します。
関連論文リスト
- LawThinker: A Deep Research Legal Agent in Dynamic Environments [51.782293183431676]
ローシンカー(LawThinker)は、アメリカ合衆国の法律研究者。
あらゆる知識探索のステップの後に、検証をアトミックな操作として実施する。
LawThinkerは、直接的な推論よりも24%改善している。
論文 参考訳(メタデータ) (2026-02-12T15:19:11Z) - LegalOne: A Family of Foundation Models for Reliable Legal Reasoning [54.57434222018289]
我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。
LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。
LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
論文 参考訳(メタデータ) (2026-01-31T10:18:32Z) - AR-BENCH: Benchmarking Legal Reasoning with Judgment Error Detection, Classification and Correction [30.1142279338937]
法的判断は、事件状況の複雑さと法的概念の抽象的な性質による誤りを含むことがある。
現在の法的AI研究は、判断予測や法的文書生成のようなタスクに焦点を当てている。
本稿では,モデルの診断的推論と信頼性を法的に評価することを目的とした新しいタスクAPPELLATE REVIEWを紹介する。
論文 参考訳(メタデータ) (2026-01-30T09:22:32Z) - Preventing the Collapse of Peer Review Requires Verification-First AI [49.995126139461085]
我々は、真理結合、すなわち、過度に科学的真理をトラックする場所のスコアの厳密さを提案する。
プロキシ・ソブリン評価に向けた相転移を駆動する2つの力の形式化を行う。
論文 参考訳(メタデータ) (2026-01-23T17:17:32Z) - AppellateGen: A Benchmark for Appellate Legal Judgment Generation [30.9030336647868]
7,351対のケースペアからなる第2のインスタンス法定判断生成のためのベンチマークであるAppellateGenを紹介する。
このタスクは、最初の評決と明らかな更新について推論することで、法的に拘束力のある判断を起草するモデルを必要とする。
本稿では,SOPに基づく法的マルチエージェントシステム(SLMAS)を提案し,その生成過程を個別の課題識別,検索,起草の段階に分解する。
論文 参考訳(メタデータ) (2026-01-04T02:15:17Z) - Hybrid Retrieval-Augmented Generation Agent for Trustworthy Legal Question Answering in Judicial Forensics [30.232667436008978]
司法設定に適した混成法的QAエージェントを提示する。
検索強化世代(RAG)とマルチモデルアンサンブルを統合し、信頼性、監査性、継続的なアップグレード可能なカウンセラーを提供する。
論文 参考訳(メタデータ) (2025-11-03T15:30:58Z) - RLJP: Legal Judgment Prediction via First-Order Logic Rule-enhanced with Large Language Models [58.69183479148083]
法的判断予測(LJP)は、法的AIにおいて重要な課題である。
既存のLJPモデルは、高いパフォーマンスのために司法上の前例と法的な知識を統合している。
しかし彼らは、厳密な論理分析を必要とする法的判断の重要な要素である法的推論論理を無視している。
本稿では、一階述語論理(FOL)形式と比較学習(CL)に基づく規則強化された法的判断予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-27T14:50:21Z) - ECtHR-PCR: A Dataset for Precedent Understanding and Prior Case Retrieval in the European Court of Human Rights [1.3723120574076126]
我々は欧州人権裁判所(ECtHR)の判断に基づく事前事例検索データセットを開発する。
我々は、様々な負のサンプリング戦略を用いて、様々な語彙と密度の検索手法をベンチマークする。
PCRでは,難易度に基づく陰性サンプリングが有効でないことがわかった。
論文 参考訳(メタデータ) (2024-03-31T08:06:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。