論文の概要: Falkor-IRAC: Graph-Constrained Generation for Verified Legal Reasoning in Indian Judicial AI
- arxiv url: http://arxiv.org/abs/2605.14665v2
- Date: Fri, 15 May 2026 05:54:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 17:44:16.252332
- Title: Falkor-IRAC: Graph-Constrained Generation for Verified Legal Reasoning in Indian Judicial AI
- Title(参考訳): Falkor-IRAC:インドの司法AIにおける検証法推論のためのグラフ制約付き生成
- Authors: Joy Bose,
- Abstract要約: 本稿では,インド法定AIのためのグラフ制約付き生成フレームワークであるFalkor-IRACを提案する。
IRAC(Issue, Rule, Analysis, Conclusion)知識グラフ上の構造化推論の基盤となる。
有能な前例、時代遅れの法的な引用、そしてサポートされない推論チェーンは、LLMベースの法的なAIにおいて永続的な障害モードのままである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Legal reasoning is not semantic similarity search. A court judgment encodes constrained symbolic reasoning: precedent propagation, procedural state transitions, and statute-bound inference. These are properties that vector-based retrieval-augmented generation (RAG) cannot faithfully represent. Hallucinated precedents, outdated statute citations, and unsupported reasoning chains remain persistent failure modes in LLM-based legal AI, with real consequences for access to justice in high-caseload jurisdictions such as India. This paper presents Falkor-IRAC, a graph-constrained generation framework for Indian legal AI that grounds generation in structured reasoning over an IRAC (Issue, Rule, Analysis, Conclusion) knowledge graph. Judgments from the Supreme Court and High Courts of India are ingested as IRAC node structures enriched with procedural state transitions, precedent relationships, and statutory references, stored in FalkorDB for low-latency agentic traversal. At inference time, LLM-generated answers are accepted only if a valid supporting path can be traced through the graph, a check performed by a falsifiability oracle called the Verifier Agent. The system also detects doctrinal conflicts as a first-class output rather than silently resolving them. Falkor-IRAC is evaluated using graph-native metrics: citation grounding accuracy, path validity rate, hallucinated precedent rate, and conflict detection rate. These metrics are argued to be more appropriate for legal reasoning evaluation than BLEU and ROUGE. On a proof-of-concept corpus of 51 Supreme Court judgments, the Verifier Agent correctly validated citations on completed queries and correctly rejected fabricated citations. Evaluation against vector-only RAG baselines is left for future work. The companion InIRAC dataset, 500+ structured Indian court judgments with IRAC annotations, is released alongside this paper.
- Abstract(参考訳): 法的推論は意味的類似性探索ではない。
裁判所判決は、前例の伝播、手続き的状態遷移、および法制上の推論という、制約された象徴的推論を符号化する。
これらはベクトルベース検索拡張生成(RAG)が忠実に表現できない性質である。
LLMベースの法的なAIでは、前例、時代遅れの法的な引用、そして未解決の推論チェーンが永続的な障害モードのままであり、インドのような高額の司法管轄区域における司法へのアクセスに本当の結果をもたらす。
本稿では、IRAC(Issue, Rule, Analysis, Conclusion)知識グラフ上の構造化推論を基盤とした、インド法定AIのためのグラフ制約付き生成フレームワークであるFalkor-IRACを提案する。
最高裁判所とインド高等裁判所の判決は、低遅延のエージェント・トラバーサルのためにFalkorDBに格納されている、手続き的状態遷移、先例的な関係、および法定参照に富むIRACノード構造として摂取される。
推測時、LLM生成された回答は、有効な支持パスがグラフを通してトレースできる場合にのみ受け入れられる。
このシステムは、静かに解決するのではなく、第一級出力として教義上の矛盾を検出する。
Falkor-IRACは、引用基底精度、経路妥当性率、幻覚前例率、コンフリクト検出率というグラフネイティブな指標を用いて評価される。
これらの指標はBLEUやROUGEよりも法的な推論評価に適していると主張されている。
51の最高裁判所判決のコンセプトコーパスの証明において、検証エージェントは、完了したクエリに関する引用を正しく検証し、偽造された引用を正しく拒否した。
ベクトルのみのRAGベースラインに対する評価は今後の研究に残されている。
InIRACデータセット、500以上の構造化されたインド裁判所判決とIRACアノテーションが同伴する。
関連論文リスト
- Accurate Legal Reasoning at Scale: Neuro-Symbolic Offloading and Structural Auditability for Robust Legal Adjudication [0.0]
法文はしばしば計算法的条項を含み、その理解には複雑な論理が必要である。
我々は、LLMを1度だけ使用して、法的テキストを決定論的自律契約言語に翻訳する、ニューロシンボリックなアプローチであるAmortized Intelligenceを提案する。
DACLをベースとしたエージェントは, ほぼ完全な整合性を実現し, 確率論的モデルで観測される「放散崖」を緩和する。
論文 参考訳(メタデータ) (2026-05-04T11:13:59Z) - IMPACT-CYCLE: A Contract-Based Multi-Agent System for Claim-Level Supervisory Correction of Long-Video Semantic Memory [73.22944697933603]
既存のパイプラインは不透明でエンドツーエンドの出力を生成し、検査の中間状態は公開しない。
IMPACT-Cycleは,マルチモーダル反復クレームレベルのメンテナンスとして,長時間ビデオ理解を再構築するマルチエージェントシステムである。
論文 参考訳(メタデータ) (2026-04-22T03:03:33Z) - CaseFacts: A Benchmark for Legal Fact-Checking and Precedent Retrieval [5.305110876082343]
CaseFactsは、アメリカ合衆国最高裁判所の判例に対する法的主張を検証するためのベンチマークである。
データセットは、Supported、Refuted、Overruledに分類される6,294のクレームで構成されている。
論文 参考訳(メタデータ) (2026-01-23T23:41:46Z) - Preventing the Collapse of Peer Review Requires Verification-First AI [49.995126139461085]
我々は、真理結合、すなわち、過度に科学的真理をトラックする場所のスコアの厳密さを提案する。
プロキシ・ソブリン評価に向けた相転移を駆動する2つの力の形式化を行う。
論文 参考訳(メタデータ) (2026-01-23T17:17:32Z) - Gaming the Judge: Unfaithful Chain-of-Thought Can Undermine Agent Evaluation [76.5533899503582]
大規模言語モデル(LLM)は、エージェントのパフォーマンスを評価するために、ますます裁判官として使われている。
このパラダイムは、エージェントのチェーン・オブ・シークレット(CoT)推論が内部の推論と環境状態の両方を忠実に反映していることを暗黙的に仮定している。
我々は、操作された推論だけで、様々なWebタスクにまたがる800の軌跡に対して、最先端のVLM審査員の偽陽性率を最大90%向上させることができることを実証した。
論文 参考訳(メタデータ) (2026-01-21T06:07:43Z) - Domain-Partitioned Hybrid RAG for Legal Reasoning: Toward Modular and Explainable Legal AI for India [5.022547031373416]
インドにおける法律研究は、法律、憲法の規定、刑法、司法の前例にまたがる、長く異質な文書をナビゲートすることを含む。
最近の検索拡張生成(RAG)アプローチは、接地を改善するが、マルチホップ推論に苦慮している。
インドにおける法律研究に特化して設計されたドメイン分割ハイブリッドRAGと知識グラフアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-12-23T20:22:39Z) - HalluGraph: Auditable Hallucination Detection for Legal RAG Systems via Knowledge Graph Alignment [0.0]
本稿では,コンテキスト,クエリ,応答から抽出した知識グラフ間の構造的アライメントを通じて幻覚を定量化するグラフ理論フレームワークであるHaluGraphを紹介する。
提案手法は,文中のエンティティが元文書に現れるかどうかを計測し,コンテキストによってアサートされた関係がサポートされていることを検証した,有界で解釈可能なメトリクスをtextitEntity Grounding (EG) に生成する。
論文 参考訳(メタデータ) (2025-12-01T13:31:06Z) - Evaluating Legal Reasoning Traces with Legal Issue Tree Rubrics [49.3262123849242]
LEGIT(LEGal Issue Trees)は,新しい大規模(24Kインスタンス)の専門家レベルの法的推論データセットである。
我々は、裁判判決を、当事者の議論と裁判所の結論の階層的な木に変換する。
論文 参考訳(メタデータ) (2025-11-30T18:32:43Z) - Hybrid Retrieval-Augmented Generation Agent for Trustworthy Legal Question Answering in Judicial Forensics [30.232667436008978]
司法設定に適した混成法的QAエージェントを提示する。
検索強化世代(RAG)とマルチモデルアンサンブルを統合し、信頼性、監査性、継続的なアップグレード可能なカウンセラーを提供する。
論文 参考訳(メタデータ) (2025-11-03T15:30:58Z) - RLJP: Legal Judgment Prediction via First-Order Logic Rule-enhanced with Large Language Models [58.69183479148083]
法的判断予測(LJP)は、法的AIにおいて重要な課題である。
既存のLJPモデルは、高いパフォーマンスのために司法上の前例と法的な知識を統合している。
しかし彼らは、厳密な論理分析を必要とする法的判断の重要な要素である法的推論論理を無視している。
本稿では、一階述語論理(FOL)形式と比較学習(CL)に基づく規則強化された法的判断予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-27T14:50:21Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。