論文の概要: Section-Weighted Hybrid Approach for Legal Case Retrieval
- arxiv url: http://arxiv.org/abs/2606.03138v1
- Date: Tue, 02 Jun 2026 04:27:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.761592
- Title: Section-Weighted Hybrid Approach for Legal Case Retrieval
- Title(参考訳): 判例検索のための分節重み付きハイブリッドアプローチ
- Authors: Rajith Arulanandam, Nisansa de Silva,
- Abstract要約: 判例検索のための2段階のセクションアウェアフレームワークを提案する。
まず、決定論的大言語モデルを用いて、事実、問題、決定、推論に生の判断を分割する。
上位結果について、システムは関連セクションのテキストを簡潔で根拠のある合理化とパーティー・スタンス・ラベルで返します。
- 参考スコア(独自算出の注目度): 1.117876753894891
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Finding truly analogous precedents requires capturing legal reasoning beyond surface word overlap. We present a two-stage, section-aware framework for legal case retrieval that first segments raw judgments into facts, issues, decision, and reasoning using a deterministic large language model (LLM) offline. In Stage 1, we combine parallel lexical (BM25) and semantic (dense ANN) whole-document searches via Reciprocal Rank Fusion (RRF) to form a high-recall candidate pool. In Stage 2, we perform fine-grained, like-for-like comparisons (e.g., query reasoning vs. candidate reasoning). To address the scale mismatch between unbounded lexical scores and cosine similarities, we apply query-wise Z-score normalization before aggregating signals with learned section weights. For the top results, the system returns the relevant section text with a concise, grounded rationale and party-stance labels. We evaluate on a jurisdiction-scale benchmark, demonstrating consistent gains over strong lexical and neural baselines while maintaining high candidate coverage
- Abstract(参考訳): 真に類似した前例を見つけるには、表面的な単語重複を越えて法的理由を捉える必要がある。
本稿では,まず,決定論的大言語モデル(LLM)をオフラインで使用して,事実,問題,決定,推論に生の判断を分割する2段階の判例検索フレームワークを提案する。
ステージ1では,並列語彙 (BM25) と意味 (Dense ANN) を相互ランクフュージョン (RRF) で組み合わせ,ハイリコール候補プールを形成する。
ステージ2では、きめ細かい類似した比較を行う(例えば、クエリ推論と候補推論)。
非有界語彙スコアとコサイン類似度のスケールミスマッチに対処するために、学習された部分重み付き信号の集約前にクエリワイズZスコア正規化を適用する。
上位結果について、システムは関連セクションのテキストを簡潔で根拠のある合理化とパーティー・スタンス・ラベルで返します。
我々は、高い候補範囲を維持しつつ、強い語彙的、神経的ベースラインよりも一貫した利得を示す、管轄範囲のベンチマークで評価する。
関連論文リスト
- LexPath: A domain-oriented multi-path framework for legal article retrieval [8.207321254335524]
textscLexPathは、法的物品検索のためのドメイン指向のマルチパスフレームワークである。
textscLexPathは、語彙、密度、ハイブリッド、適応的な検索強化された生成ベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2026-05-28T16:43:17Z) - RAG-Match: Retrieval-Augmented Knowledge Injection and Hierarchical Reasoning for Calibrated Semantic Relevance [7.479411337919752]
textscRAG-Matchは、知識を付加した事前学習、階層的推論アライメント、および関係モデリングのための嗜好に基づく決定キャリブレーションを統合する3段階のフレームワークである。
実世界の検索関連ベンチマークによる実験結果から,textscRAG-Match は複数のランキング指標で強い LLM ベースのベースラインを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2026-05-25T06:42:39Z) - LAMUS: A Large-Scale Corpus for Legal Argument Mining from U.S. Caselaw using LLMs [0.5830619388189558]
本稿は、アメリカ合衆国最高裁判所の決定とテキサス州の刑事法定の意見から構築された、刑期レベルの法的議論採掘コーパスであるLAMUSを紹介する。
データセットは、大規模なケースコレクション、自動アノテーション、ターゲットとする人間のループ品質改善を組み合わせた、データ中心のパイプラインを使用して作成される。
論文 参考訳(メタデータ) (2026-03-09T12:01:42Z) - LLM-guided Hierarchical Retrieval [54.73080745446999]
LATTICEは階層的な検索フレームワークであり、LLMは対数探索の複雑さで大きなコーパスを推論し、ナビゲートすることができる。
LLM誘導探索における中心的な課題は、モデルの関連性判断がノイズが多く、文脈に依存し、階層性に気付かないことである。
我々のフレームワークは、推論集約型BRIGHTベンチマークで最先端のゼロショット性能を実現する。
論文 参考訳(メタデータ) (2025-10-15T07:05:17Z) - RLJP: Legal Judgment Prediction via First-Order Logic Rule-enhanced with Large Language Models [58.69183479148083]
法的判断予測(LJP)は、法的AIにおいて重要な課題である。
既存のLJPモデルは、高いパフォーマンスのために司法上の前例と法的な知識を統合している。
しかし彼らは、厳密な論理分析を必要とする法的判断の重要な要素である法的推論論理を無視している。
本稿では、一階述語論理(FOL)形式と比較学習(CL)に基づく規則強化された法的判断予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-27T14:50:21Z) - JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文 参考訳(メタデータ) (2024-10-31T18:43:12Z) - Mitigating Boundary Ambiguity and Inherent Bias for Text Classification in the Era of Large Language Models [24.085614720512744]
本研究では,大規模言語モデル (LLM) がテキスト分類における選択肢の数や配置の変化に対して脆弱であることを示す。
重要なボトルネックは、曖昧な決定境界と、特定のトークンや位置に対する固有のバイアスから生じます。
我々のアプローチは、ペア比較が境界のあいまいさと固有のバイアスを効果的に緩和できるという経験的観察に基づいている。
論文 参考訳(メタデータ) (2024-06-11T06:53:19Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - UnifieR: A Unified Retriever for Large-Scale Retrieval [84.61239936314597]
大規模な検索は、クエリを与えられた巨大なコレクションから関連ドキュメントをリコールすることである。
事前学習型言語モデル(PLM)に基づく最近の検索手法は,高密度ベクターあるいはレキシコンに基づくパラダイムに大別することができる。
本論文では,高密度ベクトルとレキシコンに基づく検索を2つの表現能力を持つ1つのモデルで統合する学習フレームワークUnifieRを提案する。
論文 参考訳(メタデータ) (2022-05-23T11:01:59Z) - Building Legal Case Retrieval Systems with Lexical Matching and
Summarization using A Pre-Trained Phrase Scoring Model [1.9275428660922076]
本研究は,2019年法律情報抽出・販売コンペティションの判例検索課題に対処する手法を提案する。
我々のアプローチは、要約が検索に重要であるという考え方に基づいている。
コンペティションのベンチマークにおけるタスクの最先端の結果を達成しました。
論文 参考訳(メタデータ) (2020-09-29T15:10:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。