論文の概要: LegalSearchLM: Rethinking Legal Case Retrieval as Legal Elements Generation
- arxiv url: http://arxiv.org/abs/2505.23832v1
- Date: Wed, 28 May 2025 09:02:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.548411
- Title: LegalSearchLM: Rethinking Legal Case Retrieval as Legal Elements Generation
- Title(参考訳): 法律検索LM: 判例検索を法定要素生成として再考
- Authors: Chaeeun Kim, Jinu Lee, Wonseok Hwang,
- Abstract要約: 韓国初の大規模判例検索ベンチマークであるLEGAR BENCHを,1.2万件以上のクエリで411種類の犯罪タイプをカバーした。
また、クエリーケースに対して法的要素推論を行い、ターゲットケースに基礎を置くコンテンツを直接生成する検索モデルであるLegalSearchLMを提案する。
- 参考スコア(独自算出の注目度): 5.243460995467895
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Legal Case Retrieval (LCR), which retrieves relevant cases from a query case, is a fundamental task for legal professionals in research and decision-making. However, existing studies on LCR face two major limitations. First, they are evaluated on relatively small-scale retrieval corpora (e.g., 100-55K cases) and use a narrow range of criminal query types, which cannot sufficiently reflect the complexity of real-world legal retrieval scenarios. Second, their reliance on embedding-based or lexical matching methods often results in limited representations and legally irrelevant matches. To address these issues, we present: (1) LEGAR BENCH, the first large-scale Korean LCR benchmark, covering 411 diverse crime types in queries over 1.2M legal cases; and (2) LegalSearchLM, a retrieval model that performs legal element reasoning over the query case and directly generates content grounded in the target cases through constrained decoding. Experimental results show that LegalSearchLM outperforms baselines by 6-20% on LEGAR BENCH, achieving state-of-the-art performance. It also demonstrates strong generalization to out-of-domain cases, outperforming naive generative models trained on in-domain data by 15%.
- Abstract(参考訳): クエリーケースから関連事例を検索する法律ケース検索(LCR)は、研究と意思決定における法律専門家の基本的な課題である。
しかし、LCRに関する既存の研究は2つの大きな限界に直面している。
まず、比較的小規模な検索コーパス(例:100-55K)で評価され、現実の法的な検索シナリオの複雑さを十分に反映できないような、限られた範囲の刑事クエリタイプを使用する。
第二に、組込み法や語彙マッチング法への依存は、しばしば限定的な表現と法的に無関係な一致をもたらす。
これらの問題に対処するため,(1)韓国初の大規模LCRベンチマークであるLEGAR BENCHは,1.2万件を超えるクエリで411種類の異なる犯罪タイプをカバーし,(2)検索LMは,クエリケースに対して法的要素推論を行い,制約付き復号化によって対象事例に根ざしたコンテンツを直接生成する検索モデルである。
実験の結果,LegalSearchLMはLEGAR BENCHを6-20%上回り,最先端性能を実現していることがわかった。
また、ドメイン外ケースへの強力な一般化を示し、ドメイン内データでトレーニングされたナイーブな生成モデルを15%向上させる。
関連論文リスト
- AppealCase: A Dataset and Benchmark for Civil Case Appeal Scenarios [47.83822985839837]
本稿では,91件の民事事件の1万対の実世界と一致した第1インスタンスと第2インスタンスの文書からなるFiceCaseデータセットを提案する。
このデータセットには、判断の逆転、逆転理由、引用された法的規定、クレームレベルの決定、第2のインスタンスに新たな情報があるかどうかという5つの側面に沿った詳細なアノテーションも含まれている。
実験結果から, すべてのモデルが判定逆転予測タスクにおいて50%未満のF1スコアを達成し, 魅力シナリオの複雑さと課題を浮き彫りにしていることがわかった。
論文 参考訳(メタデータ) (2025-05-22T10:50:33Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - How Vital is the Jurisprudential Relevance: Law Article Intervened Legal Case Retrieval and Matching [31.378981566988063]
法的ケース検索(LCR)は、与えられたクエリに基づいて、同等の法的ケースを自動的に検索することを目的としている。
これに対処するためには、司法ドメイン内の独自の法的・合理的な類似性を評価するのが難しい課題だ。
上記の課題を解決するために, LCM-LAI というエンド・ツー・エンドのモデルを提案する。
論文 参考訳(メタデータ) (2025-02-25T15:29:07Z) - Evaluating LLM-based Approaches to Legal Citation Prediction: Domain-specific Pre-training, Fine-tuning, or RAG? A Benchmark and an Australian Law Case Study [9.30538764385435]
大規模言語モデル (LLM) は法的タスクに強い可能性を示しているが、法的な引用予測の問題は未解明のままである。
AusLaw Citation Benchmarkは,オーストラリアで55万の法的事例と18,677のユニークな引用からなる実世界のデータセットである。
次に、さまざまなソリューションに対して、システマティックなベンチマークを実施します。
その結果, 一般および法定LLMは独立解として十分ではなく, ほぼゼロに近い性能を示した。
論文 参考訳(メタデータ) (2024-12-09T07:46:14Z) - Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。
既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。
データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文 参考訳(メタデータ) (2024-10-09T06:26:39Z) - LeCaRDv2: A Large-Scale Chinese Legal Case Retrieval Dataset [20.315416393247247]
大規模法ケース検索データセットLeCaRDv2(バージョン2)を紹介する。
800のクエリと430万件の刑事事件文書から抽出された55,192の候補で構成されている。
評価,ペナルティ,手順の3つの重要な側面を考慮し,既存の関連基準を充実させる。
データセットのすべてのケースは、刑事法を専門とする複数の法律専門家によって注釈付けされています。
論文 参考訳(メタデータ) (2023-10-26T17:32:55Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - U-CREAT: Unsupervised Case Retrieval using Events extrAcTion [2.2385755093672044]
本稿では, IL-PCR (Indian Legal Prior Case Retrieval) コーパスのための新しいベンチマーク(英語)を提案する。
判例検索におけるイベントの役割について検討し,教師なし検索手法に基づくパイプラインU-CREATを提案する。
提案手法はBM25に比べて性能が著しく向上し,検索精度が大幅に向上することがわかった。
論文 参考訳(メタデータ) (2023-07-11T13:51:12Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Legal Element-oriented Modeling with Multi-view Contrastive Learning for
Legal Case Retrieval [3.909749182759558]
本稿では,多視点コントラスト学習目標を用いた訴訟検索のための対話型ネットワークを提案する。
ケースビューコントラスト学習は、関連する訴訟表現の間の隠れた空間距離を最小化する。
ケースの法的な要素を検出するために、法的な要素の知識を意識した指標を用いています。
論文 参考訳(メタデータ) (2022-10-11T06:47:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。