論文の概要: Domain-Partitioned Hybrid RAG for Legal Reasoning: Toward Modular and Explainable Legal AI for India
- arxiv url: http://arxiv.org/abs/2602.23371v1
- Date: Tue, 23 Dec 2025 20:22:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:07.933219
- Title: Domain-Partitioned Hybrid RAG for Legal Reasoning: Toward Modular and Explainable Legal AI for India
- Title(参考訳): ドメイン分割型ハイブリッドRAG : インドにおけるモジュール型および説明可能な法AIを目指して
- Authors: Rakshita Goel, S Pranav Kumar, Anmol Agrawal, Divyan Poddar, Pratik Narang, Dhruv Kumar,
- Abstract要約: インドにおける法律研究は、法律、憲法の規定、刑法、司法の前例にまたがる、長く異質な文書をナビゲートすることを含む。
最近の検索拡張生成(RAG)アプローチは、接地を改善するが、マルチホップ推論に苦慮している。
インドにおける法律研究に特化して設計されたドメイン分割ハイブリッドRAGと知識グラフアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 5.022547031373416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Legal research in India involves navigating long and heterogeneous documents spanning statutes, constitutional provisions, penal codes, and judicial precedents, where purely keyword-based or embedding-only retrieval systems often fail to support structured legal reasoning. Recent retrieval augmented generation (RAG) approaches improve grounding but struggle with multi-hop reasoning, citation chaining, and cross-domain dependencies inherent to legal texts. We propose a domain partitioned hybrid RAG and Knowledge Graph architecture designed specifically for Indian legal research. The system integrates three specialized RAG pipelines covering Supreme Court case law, statutory and constitutional texts, and the Indian Penal Code, each optimized for domain specific retrieval. To enable relational reasoning beyond semantic similarity, we construct a Neo4j based Legal Knowledge Graph capturing structured relationships among cases, statutes, IPC sections, judges, and citations. An LLM driven agentic orchestrator dynamically routes queries across retrieval modules and the knowledge graph, fusing evidence into grounded and citation aware responses. We evaluate the system using a 40 question synthetic legal question answer benchmark curated from authoritative Indian legal sources and assessed via an LLM as a Judge framework. Results show that the hybrid architecture achieves a 70 percent pass rate, substantially outperforming a RAG only baseline at 37.5 percent, with marked improvements in completeness and legal reasoning quality. These findings demonstrate that combining domain partitioned retrieval with structured relational knowledge provides a scalable and interpretable foundation for advanced legal AI systems in the Indian judicial context.
- Abstract(参考訳): インドにおける法律研究は、法律、憲法規定、刑法、司法の先例にまたがる長く異質な文書をナビゲートすることを含む。
近年の検索拡張生成 (RAG) アプローチは, 法的テキストに固有のマルチホップ推論, 引用連鎖, ドメイン間の依存関係に悩まされている。
インドにおける法律研究に特化して設計されたドメイン分割ハイブリッドRAGと知識グラフアーキテクチャを提案する。
このシステムは、最高裁判所の判例法、法と憲法のテキストを含む3つの特殊なRAGパイプラインと、それぞれドメイン固有の検索に最適化されたインディアン刑法を統合している。
意味的類似性を超えた関係推論を可能にするために,Neo4jベースの法知識グラフを構築し,事例,法令,IPCセクション,審査員,引用の構造化された関係を抽出する。
LLM駆動のエージェントオーケストレータは、検索モジュールと知識グラフをまたいだクエリを動的にルーティングし、証拠を根拠付きおよび引用対応に融合させる。
インドの権威ある法典から算出した40問の総合的法的質問応答ベンチマークを用いて,LLMを審査枠組みとして評価した。
その結果、ハイブリッドアーキテクチャは70%のパスレートを実現し、RAGのみのベースラインを37.5%で上回り、完全性と法的な推論品質が著しく向上した。
これらの結果は、ドメイン分割検索と構造化された関係知識を組み合わせることで、インドの司法的文脈における高度な法的AIシステムのためのスケーラブルで解釈可能な基盤を提供することを示した。
関連論文リスト
- LegalOne: A Family of Foundation Models for Reliable Legal Reasoning [54.57434222018289]
我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。
LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。
LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
論文 参考訳(メタデータ) (2026-01-31T10:18:32Z) - SAMVAD: A Multi-Agent System for Simulating Judicial Deliberation Dynamics in India [0.0]
本稿では,インドの司法制度の枠組み内での審議プロセスのシミュレーションを目的とした,革新的なマルチエージェントシステム (MAS) であるSAMVADを紹介する。
我々の制度は、裁判官、検察官、弁護人、複数の行政官(司法ベンチを模擬する)など、主要な司法職を代表するエージェントで構成されている。
この研究の主な貢献は、インドにおけるランドマークな法律文書のドメイン固有の知識基盤に根ざした、検索型拡張世代(RAG)の統合である。
論文 参考訳(メタデータ) (2025-09-04T01:04:44Z) - Augmented Question-guided Retrieval (AQgR) of Indian Case Law with LLM, RAG, and Structured Summaries [0.0]
本稿では,関連事例の検索を容易にするためにLarge Language Models (LLMs) を提案する。
提案手法は,Retrieval Augmented Generation (RAG) と,インドの事例法に最適化された構造化要約を組み合わせたものである。
本システムは,関連事例法をより効果的に識別するために,事実シナリオに基づく対象の法的質問を生成する。
論文 参考訳(メタデータ) (2025-07-23T05:24:44Z) - Incorporating Legal Structure in Retrieval-Augmented Generation: A Case Study on Copyright Fair Use [44.99833362998488]
本稿では,米国著作権法におけるフェアユース・ドクトリンに合わせて,ドメイン固有のRetrieval-Augmented Generationの実装を提案する。
DMCA削除の頻度の増加とコンテンツクリエーターにとってアクセス可能な法的支援の欠如により、我々は、セマンティック検索と法知識グラフと裁判所引用ネットワークを組み合わせて、検索品質と推論信頼性を向上させる構造的アプローチを提案する。
論文 参考訳(メタデータ) (2025-05-04T15:53:49Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - Bridging Legal Knowledge and AI: Retrieval-Augmented Generation with Vector Stores, Knowledge Graphs, and Hierarchical Non-negative Matrix Factorization [6.0045906216050815]
大規模言語モデル(LLM)を利用したエージェント生成AI - 検索型生成(RAG)、知識グラフ(KG)、ベクトルストア(VS)
この技術は、膨大な非構造化または半構造化データセット内の関係を推測するのに優れている。
非負行列因子化(Non-Negative Matrix Factorization, NMF)により構築されたRAG, VS, KGを統合した生成AIシステムを導入する。
論文 参考訳(メタデータ) (2025-02-27T18:35:39Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。