論文の概要: LexPath: A domain-oriented multi-path framework for legal article retrieval
- arxiv url: http://arxiv.org/abs/2605.30205v1
- Date: Thu, 28 May 2026 16:43:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 00:00:30.96144
- Title: LexPath: A domain-oriented multi-path framework for legal article retrieval
- Title(参考訳): LexPath: 法的物品検索のためのドメイン指向マルチパスフレームワーク
- Authors: Weixuan Liu, Qingfeng Zhuge, Xuyang Chen,
- Abstract要約: textscLexPathは、法的物品検索のためのドメイン指向のマルチパスフレームワークである。
textscLexPathは、語彙、密度、ハイブリッド、適応的な検索強化された生成ベースラインを一貫して上回る。
- 参考スコア(独自算出の注目度): 8.207321254335524
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Legal article retrieval is critical for building traceable and reliable legal AI systems, where conclusions must be grounded in specific legal articles. However, existing open-domain retrieval methods rely heavily on surface-level lexical or semantic similarity, making it difficult for them to distinguish legally relevant articles from those that are textually similar but legally inapplicable or misaligned with the user's underlying intent. To bridge this gap, we propose \textsc{LexPath}, a domain-oriented multi-path framework comprising a multi-path retrieval module and an intent-aware reranking module. The retrieval module combines two complementary legal-specific paths to collect candidate articles: an IRAC-guided sparse path that expands queries with legally informative keywords, and a structure-guided dense path trained with hard negatives derived from legal hierarchy and citation relations. Then, the reranking module further refines the candidate ranking by incorporating the intent consistency score between queries and legal articles. We evaluate \textsc{LexPath} on two publicly available benchmarks focusing on general-public queries and a self-constructed benchmark targeting domain-professional scenarios. Experimental results demonstrate that \textsc{LexPath} consistently outperforms lexical, dense, hybrid, and adaptive retrieval-augmented generation (RAG) baselines. Ablation studies further verify the effectiveness of each component.
- Abstract(参考訳): 法的な記事の検索は、特定の法的な記事に結論を下さなければならない、トレース可能で信頼性の高い法的なAIシステムを構築するために重要である。
しかし、既存のオープンドメイン検索手法は、表面レベルの語彙や意味的類似性に大きく依存しているため、法的に類似しているが法的に適用できない、あるいはユーザの基本的な意図と不一致しているものと、法的に関連のある記事とを区別することは困難である。
このギャップを埋めるために、マルチパス検索モジュールとインテント対応リグレードモジュールからなるドメイン指向マルチパスフレームワークである \textsc{LexPath} を提案する。
検索モジュールは2つの補完的な法定経路を組み合わせて候補記事の収集を行う: IRAC誘導スパースパスは、法的に有意なキーワードでクエリを拡張する。
そして、リランクモジュールは、クエリと法定項目間の意図整合スコアを組み込むことで、候補ランキングをさらに洗練する。
一般向けクエリに焦点をあてた2つの公開ベンチマークと,ドメインプロフェッショナルシナリオを対象とした自己構築型ベンチマークについて, <textsc{LexPath} の評価を行った。
実験の結果, <textsc{LexPath} は語彙, 密度, ハイブリッド, 適応型検索拡張生成(RAG) のベースラインを一貫して上回っていることがわかった。
アブレーション研究は各成分の有効性をさらに検証する。
関連論文リスト
- Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction [127.64173950476702]
エージェントが直接、汎用端末ツールを用いて、生コーパスを直接検索する直接コーパス間相互作用(DCI)について検討する。
このアプローチではオフラインインデックスを必要とせず、ローカルコーパスの進化に自然に適応する。
IRベンチマークとエンドツーエンドのエージェント検索タスク全体にわたって、この単純なセットアップは、強いスパース、密度、リランクベースラインよりも大幅に優れています。
論文 参考訳(メタデータ) (2026-05-03T19:13:11Z) - JUÁ -- A Benchmark for Information Retrieval in Brazilian Legal Text Collections [3.6360100966162787]
ポルトガル語の法的な情報検索は、利用可能なデータセットが文書タイプ、クエリスタイル、関連性定義で大きく異なるため、体系的に評価することが依然として困難である。
我々はブラジルの法定検索のための公開ベンチマークであるJUを、異種法定コレクション間でより再現性が高く、同等の評価をサポートするように設計された。
論文 参考訳(メタデータ) (2026-04-07T17:10:54Z) - MoDora: Tree-Based Semi-Structured Document Analysis System [62.01015188258797]
半構造化文書は、様々な不規則なレイアウトで配置された様々なインターリーブされたデータ要素を統合する。
MoDora は半構造化文書解析のための LLM を利用したシステムである。
実験では、MoDoraは5.97%-61.07%の精度でベースラインを上回っている。
論文 参考訳(メタデータ) (2026-02-26T14:48:49Z) - Domain-Partitioned Hybrid RAG for Legal Reasoning: Toward Modular and Explainable Legal AI for India [5.022547031373416]
インドにおける法律研究は、法律、憲法の規定、刑法、司法の前例にまたがる、長く異質な文書をナビゲートすることを含む。
最近の検索拡張生成(RAG)アプローチは、接地を改善するが、マルチホップ推論に苦慮している。
インドにおける法律研究に特化して設計されたドメイン分割ハイブリッドRAGと知識グラフアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-12-23T20:22:39Z) - LLM-guided Hierarchical Retrieval [54.73080745446999]
LATTICEは階層的な検索フレームワークであり、LLMは対数探索の複雑さで大きなコーパスを推論し、ナビゲートすることができる。
LLM誘導探索における中心的な課題は、モデルの関連性判断がノイズが多く、文脈に依存し、階層性に気付かないことである。
我々のフレームワークは、推論集約型BRIGHTベンチマークで最先端のゼロショット性能を実現する。
論文 参考訳(メタデータ) (2025-10-15T07:05:17Z) - Poly-Vector Retrieval: Reference and Content Embeddings for Legal Documents [0.0]
法的文脈では、ユーザーは自分のコンテンツではなく、ラベルやあだ名によってしばしばノルムを参照する。
本稿では,各法則に複数の異なる埋め込みを割り当てるポリレトリヴァルについて述べる。
ラベル中心のクエリの検索精度を大幅に向上し、内部および外部の参照を解決できる。
論文 参考訳(メタデータ) (2025-04-09T17:54:11Z) - UnifieR: A Unified Retriever for Large-Scale Retrieval [84.61239936314597]
大規模な検索は、クエリを与えられた巨大なコレクションから関連ドキュメントをリコールすることである。
事前学習型言語モデル(PLM)に基づく最近の検索手法は,高密度ベクターあるいはレキシコンに基づくパラダイムに大別することができる。
本論文では,高密度ベクトルとレキシコンに基づく検索を2つの表現能力を持つ1つのモデルで統合する学習フレームワークUnifieRを提案する。
論文 参考訳(メタデータ) (2022-05-23T11:01:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。