論文の概要: A Reproducibility Study of Graph-Based Legal Case Retrieval
- arxiv url: http://arxiv.org/abs/2504.08400v1
- Date: Fri, 11 Apr 2025 10:04:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-14 14:17:25.666318
- Title: A Reproducibility Study of Graph-Based Legal Case Retrieval
- Title(参考訳): グラフに基づく判例検索の再現性の検討
- Authors: Gregor Donabauer, Udo Kruschwitz,
- Abstract要約: CaseLinkは、法的なケース検索のためのグラフベースの方法である。
CaseLinkは、ドキュメントのスタンドアロンレベルを超えるケースの高次の関係をキャプチャする。
新たな成果を再現する上での課題が最近強調されている。
- 参考スコア(独自算出の注目度): 1.6819960041696331
- License:
- Abstract: Legal retrieval is a widely studied area in Information Retrieval (IR) and a key task in this domain is retrieving relevant cases based on a given query case, often done by applying language models as encoders to model case similarity. Recently, Tang et al. proposed CaseLink, a novel graph-based method for legal case retrieval, which models both cases and legal charges as nodes in a network, with edges representing relationships such as references and shared semantics. This approach offers a new perspective on the task by capturing higher-order relationships of cases going beyond the stand-alone level of documents. However, while this shift in approaching legal case retrieval is a promising direction in an understudied area of graph-based legal IR, challenges in reproducing novel results have recently been highlighted, with multiple studies reporting difficulties in reproducing previous findings. Thus, in this work we reproduce CaseLink, a graph-based legal case retrieval method, to support future research in this area of IR. In particular, we aim to assess its reliability and generalizability by (i) first reproducing the original study setup and (ii) applying the approach to an additional dataset. We then build upon the original implementations by (iii) evaluating the approach's performance when using a more sophisticated graph data representation and (iv) using an open large language model (LLM) in the pipeline to address limitations that are known to result from using closed models accessed via an API. Our findings aim to improve the understanding of graph-based approaches in legal IR and contribute to improving reproducibility in the field. To achieve this, we share all our implementations and experimental artifacts with the community.
- Abstract(参考訳): 法的な検索は、情報検索(IR)において広く研究されている分野であり、この領域の重要なタスクは、与えられたクエリケースに基づいて関連するケースを検索することである。
最近,Tangらは,ネットワーク内のノードとしてケースと法定電荷の両方をモデル化し,参照や共有セマンティクスなどの関係を表すエッジを備えた,新たなグラフベースの判例検索手法であるCaseLinkを提案している。
このアプローチは、文書のスタンドアローンレベルを超えるケースの高次関係をキャプチャすることで、タスクに対する新たな視点を提供する。
しかし、この法ケース検索へのシフトは、グラフベースの法IRの未調査領域において有望な方向であるが、新しい結果を再現する上での課題が近年強調され、過去の結果を再現する上での困難が報告されている。
そこで本研究では,この領域における今後の研究を支援するために,グラフベースの判例検索手法であるCaseLinkを再現する。
特に,信頼性と一般化性を評価することを目的としている。
一 元々の学習体制を最初に再現し、
(ii) 追加のデータセットにアプローチを適用する。
その後、私たちはオリジナルの実装を構築します。
三 より洗練されたグラフデータ表現を用いて、アプローチの性能を評価すること。
(iv) パイプライン内でオープンな大規模言語モデル(LLM)を使用して、API経由でアクセスされたクローズドモデルを使用することによって生じる制限に対処する。
本研究の目的は、法的なIRにおけるグラフベースのアプローチの理解を改善し、この分野における再現性の向上に寄与することである。
これを実現するために、私たちはすべての実装と実験的な成果物をコミュニティと共有しています。
関連論文リスト
- Chain-of-Retrieval Augmented Generation [72.06205327186069]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z) - JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文 参考訳(メタデータ) (2024-10-31T18:43:12Z) - A Survey of Low-shot Vision-Language Model Adaptation via Representer Theorem [38.84662767814454]
限られた訓練データの条件下で対処する主な課題は、パラメータ効率のよい方法で事前訓練された視覚言語モデルを微調整する方法である。
本稿では,既存の手法を統合化し,それらの性質を同定し,詳細な比較を支援するための統一的な計算フレームワークを提案する。
実演として、カーネルヒルベルト空間(RKHS)における表現子間のクラス間相関をモデル化し、既存の手法を拡張した。
論文 参考訳(メタデータ) (2024-10-15T15:22:30Z) - Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。
既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。
データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文 参考訳(メタデータ) (2024-10-09T06:26:39Z) - LawLLM: Law Large Language Model for the US Legal System [43.13850456765944]
我々は,米国法域に特化して設計されたマルチタスクモデルであるLawLLM(Law Large Language Model)を紹介する。
類似症例検索(SCR)、PCR(Precedent Case Recommendation)、LJP(Lawal Judgment Prediction)においてLawLLMが優れている
そこで本研究では,各タスクに対して,生の法定データをトレーニング可能な形式に変換する,カスタマイズされたデータ前処理手法を提案する。
論文 参考訳(メタデータ) (2024-07-27T21:51:30Z) - CaseGNN++: Graph Contrastive Learning for Legal Case Retrieval with Graph Augmentation [25.574138465986977]
法律ケース検索(LCR)は、特定のクエリケースに関連するケースを見つけることを目的とした、専門的な情報検索タスクである。
CaseGNN++は、エッジ情報とラベルデータを同時に利用してLCRモデルの潜在可能性を発見するために提案されている。
論文 参考訳(メタデータ) (2024-05-20T05:16:52Z) - Leveraging Large Language Models for Relevance Judgments in Legal Case Retrieval [18.058942674792604]
本稿では,訴訟の関連判断に適した新規な数ショットワークフローを提案する。
LLMと人的専門家の関連判断を比較することで,信頼性の高い関連判断が得られたことを実証的に示す。
論文 参考訳(メタデータ) (2024-03-27T09:46:56Z) - How Does Generative Retrieval Scale to Millions of Passages? [68.98628807288972]
各種コーパス尺度における生成的検索手法の実証的研究を行った。
我々は8.8Mパスのコーパスで数百万のパスに生成検索をスケールし、モデルサイズを最大11Bパラメータまで評価する。
生成的検索は、小さなコーパス上の最先端のデュアルエンコーダと競合するが、数百万のパスへのスケーリングは依然として重要で未解決の課題である。
論文 参考訳(メタデータ) (2023-05-19T17:33:38Z) - Incorporating Relevance Feedback for Information-Seeking Retrieval using
Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。
異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文 参考訳(メタデータ) (2022-10-19T16:19:37Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。