論文の概要: IL-PCSR: Legal Corpus for Prior Case and Statute Retrieval
- arxiv url: http://arxiv.org/abs/2511.00268v1
- Date: Fri, 31 Oct 2025 21:39:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.703772
- Title: IL-PCSR: Legal Corpus for Prior Case and Statute Retrieval
- Title(参考訳): IL-PCSR: 判例と法令検索のための法定コーパス
- Authors: Shounak Paul, Dhananjay Ghumare, Pawan Goyal, Saptarshi Ghosh, Ashutosh Modi,
- Abstract要約: IL-PCR(Indian Legal corpus for Prior Case and Statute Retrieval)は、両方のタスクのためのモデルを開発するための共通のテストベッドを提供するユニークなコーパスである。
語彙モデルや意味モデル,GNNに基づくアンサンブルなど,タスクのベースラインモデルについて広範な実験を行った。
- 参考スコア(独自算出の注目度): 18.08433101210216
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Identifying/retrieving relevant statutes and prior cases/precedents for a given legal situation are common tasks exercised by law practitioners. Researchers to date have addressed the two tasks independently, thus developing completely different datasets and models for each task; however, both retrieval tasks are inherently related, e.g., similar cases tend to cite similar statutes (due to similar factual situation). In this paper, we address this gap. We propose IL-PCR (Indian Legal corpus for Prior Case and Statute Retrieval), which is a unique corpus that provides a common testbed for developing models for both the tasks (Statute Retrieval and Precedent Retrieval) that can exploit the dependence between the two. We experiment extensively with several baseline models on the tasks, including lexical models, semantic models and ensemble based on GNNs. Further, to exploit the dependence between the two tasks, we develop an LLM-based re-ranking approach that gives the best performance.
- Abstract(参考訳): 法律実務者が実施する一般的な業務は、関連する法令の特定・検索と、所定の法的状況に対する先例・先例の検索である。
現在まで、研究者は2つのタスクに個別に対処しているため、各タスクごとに全く異なるデータセットとモデルを開発するが、どちらの検索タスクも本質的に関連している。
本稿では,このギャップに対処する。
本研究は, IL-PCR (Indian Legal corpus for Prior Case and Statute Retrieval) を提案する。
語彙モデルや意味モデル,GNNに基づくアンサンブルなど,タスクのベースラインモデルについて広範な実験を行った。
さらに,2つのタスク間の依存性を生かして,最高の性能を実現するLLMベースのリグレードアプローチを開発する。
関連論文リスト
- Reinforcing Compositional Retrieval: Retrieving Step-by-Step for Composing Informative Contexts [67.67746334493302]
大規模言語モデル(LLM)は、多くのタスクにまたがる顕著な機能を示してきたが、複雑なタスクを扱うために外部のコンテキストに依存していることが多い。
我々は、このプロセスをマルコフ決定プロセス(MDP)としてモデル化するトリエンコーダシーケンシャルレトリバーを提案する。
提案手法は,サンプル間の依存関係を明示的にモデル化することの重要性を強調し,ベースラインを一貫して大幅に上回ることを示す。
論文 参考訳(メタデータ) (2025-04-15T17:35:56Z) - A Reproducibility Study of Graph-Based Legal Case Retrieval [1.6819960041696331]
CaseLinkは、法的なケース検索のためのグラフベースの方法である。
CaseLinkは、ドキュメントのスタンドアロンレベルを超えるケースの高次の関係をキャプチャする。
新たな成果を再現する上での課題が最近強調されている。
論文 参考訳(メタデータ) (2025-04-11T10:04:12Z) - How Vital is the Jurisprudential Relevance: Law Article Intervened Legal Case Retrieval and Matching [31.378981566988063]
法的ケース検索(LCR)は、与えられたクエリに基づいて、同等の法的ケースを自動的に検索することを目的としている。
これに対処するためには、司法ドメイン内の独自の法的・合理的な類似性を評価するのが難しい課題だ。
上記の課題を解決するために, LCM-LAI というエンド・ツー・エンドのモデルを提案する。
論文 参考訳(メタデータ) (2025-02-25T15:29:07Z) - Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。
既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。
データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文 参考訳(メタデータ) (2024-10-09T06:26:39Z) - LawLLM: Law Large Language Model for the US Legal System [43.13850456765944]
我々は,米国法域に特化して設計されたマルチタスクモデルであるLawLLM(Law Large Language Model)を紹介する。
類似症例検索(SCR)、PCR(Precedent Case Recommendation)、LJP(Lawal Judgment Prediction)においてLawLLMが優れている
そこで本研究では,各タスクに対して,生の法定データをトレーニング可能な形式に変換する,カスタマイズされたデータ前処理手法を提案する。
論文 参考訳(メタデータ) (2024-07-27T21:51:30Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model
Collaboration [52.57055162778548]
法的判断予測(LJP)は、法律AIにおいてますます重要な課題となっている。
先行は、同様の事実を持つ以前の訴訟であり、国家法制度におけるその後の事件の判断の基礎となっている。
近年のディープラーニングの進歩により、LJPタスクの解決に様々なテクニックが使えるようになった。
論文 参考訳(メタデータ) (2023-10-13T16:47:20Z) - Resources for Brewing BEIR: Reproducible Reference Models and an
Official Leaderboard [47.73060223236792]
BEIRは18種類のドメイン/タスクの組み合わせで情報検索モデルを評価するためのベンチマークデータセットである。
我々の研究は、ベンチマークが完全な潜在能力を達成できない2つの欠点に対処しています。
論文 参考訳(メタデータ) (2023-06-13T00:26:18Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - THUIR@COLIEE-2020: Leveraging Semantic Understanding and Exact Matching
for Legal Case Retrieval and Entailment [41.51705651274111]
本稿では,訴訟の検索と包含に関する課題に取り組むための方法論を提案する。
私たちは2つの訴訟法タスク、すなわち、法的事件の検索タスクと法的事件の関連タスクに参加しました。
いずれのタスクにおいても,セマンティック理解のためのニューラルモデルと,正確なマッチングのための従来の検索モデルを採用しました。
論文 参考訳(メタデータ) (2020-12-24T04:59:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。