論文の概要: ReaKase-8B: Legal Case Retrieval via Knowledge and Reasoning Representations with LLMs
- arxiv url: http://arxiv.org/abs/2510.26178v1
- Date: Thu, 30 Oct 2025 06:35:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.683043
- Title: ReaKase-8B: Legal Case Retrieval via Knowledge and Reasoning Representations with LLMs
- Title(参考訳): ReaKase-8B:LLMによる知識と推論による判例検索
- Authors: Yanran Tang, Ruihong Qiu, Xue Li, Zi Huang,
- Abstract要約: ReaKase-8Bフレームワークは、抽出された法的事実、法的問題、法的関係のトリプレット、および効果的な訴訟検索のための法的推論を活用するために提案されている。
COLIEE 2022とCOLIEE 2023による2つのベンチマークデータセットの実験により、我々の知識と拡張埋め込みの推論が検索性能を大幅に向上することを示した。
- 参考スコア(独自算出の注目度): 37.688405624086315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Legal case retrieval (LCR) is a cornerstone of real-world legal decision making, as it enables practitioners to identify precedents for a given query case. Existing approaches mainly rely on traditional lexical models and pretrained language models to encode the texts of legal cases. Yet there are rich information in the relations among different legal entities as well as the crucial reasoning process that uncovers how legal facts and legal issues can lead to judicial decisions. Such relational reasoning process reflects the distinctive characteristics of each case that can distinguish one from another, mirroring the real-world judicial process. Naturally, incorporating such information into the precise case embedding could further enhance the accuracy of case retrieval. In this paper, a novel ReaKase-8B framework is proposed to leverage extracted legal facts, legal issues, legal relation triplets and legal reasoning for effective legal case retrieval. ReaKase-8B designs an in-context legal case representation learning paradigm with a fine-tuned large language model. Extensive experiments on two benchmark datasets from COLIEE 2022 and COLIEE 2023 demonstrate that our knowledge and reasoning augmented embeddings substantially improve retrieval performance over baseline models, highlighting the potential of integrating legal reasoning into legal case retrieval systems. The code has been released on https://github.com/yanran-tang/ReaKase-8B.
- Abstract(参考訳): 訴訟検索(LCR)は、あるクエリーケースの先例を実践者が特定できるようにするために、現実の法的意思決定の基盤となる。
既存のアプローチは主に、訴訟のテキストをエンコードするために、従来の語彙モデルと事前訓練された言語モデルに依存している。
しかし、異なる法律団体間の関係には豊富な情報があり、法的な事実や法的問題がどのように司法決定に繋がるかを明らかにする決定的な理由づけプロセスもある。
このような関係推論過程は、現実の司法過程を反映して、互いに区別できる各事件の特徴を反映している。
当然、そのような情報を正確なケース埋め込みに組み込むことで、ケース検索の精度をさらに高めることができる。
本稿では, 抽出された法的事実, 法的問題, 法的関係三重項, 法的推論を有効に活用するための新しいReaKase-8Bフレームワークを提案する。
ReaKase-8Bは、微調整された大言語モデルを用いた、コンテキスト内における判例表現学習パラダイムを設計する。
COLIEE 2022とCOLIEE 2023の2つのベンチマークデータセットに対する大規模な実験は、我々の知識と拡張埋め込みの推論がベースラインモデルよりも検索性能を大幅に向上することを示し、法的な推論を訴訟検索システムに統合する可能性を強調している。
コードはhttps://github.com/yanran-tang/ReaKase-8Bで公開されている。
関連論文リスト
- ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation [56.79698529022327]
法的な主張は、事件における原告の要求を言及し、法的理由づけと事件解決を導くのに不可欠である。
本稿では,その事例の事実に基づく法的クレーム生成の問題について考察する。
われわれは,中国法定クレーム生成タスクの最初のデータセットであるClaymGen-CNを構築した。
論文 参考訳(メタデータ) (2025-08-24T07:19:25Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - Learning Interpretable Legal Case Retrieval via Knowledge-Guided Case Reformulation [22.85652668826498]
本稿では,大言語モデル(LLM)に基づく法的な知識誘導型事例修正手法であるKELLERを紹介する。
犯罪や法律記事に関する専門的な法的知識を取り入れることで、大規模な言語モデルにより、原訴訟を犯罪の簡潔なサブファクトに正確に修正することができる。
論文 参考訳(メタデータ) (2024-06-28T08:59:45Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - Leveraging Large Language Models for Relevance Judgments in Legal Case Retrieval [16.29803062332164]
本稿では,大規模言語モデルによる専門家による関連判断の生成を支援する,数ショットのアプローチを提案する。
提案手法は,人間のアノテータのワークフローを模倣して,判断過程をいくつかの段階に分解する。
また、解釈可能なデータラベリングを保証し、関連性評価プロセスにおける透明性と明確性を提供します。
論文 参考訳(メタデータ) (2024-03-27T09:46:56Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Legal Element-oriented Modeling with Multi-view Contrastive Learning for
Legal Case Retrieval [3.909749182759558]
本稿では,多視点コントラスト学習目標を用いた訴訟検索のための対話型ネットワークを提案する。
ケースビューコントラスト学習は、関連する訴訟表現の間の隠れた空間距離を最小化する。
ケースの法的な要素を検出するために、法的な要素の知識を意識した指標を用いています。
論文 参考訳(メタデータ) (2022-10-11T06:47:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。