Fugu-MT 論文翻訳(概要): ECtHR-PCR: A Dataset for Precedent Understanding and Prior Case Retrieval in the European Court of Human Rights

論文の概要: ECtHR-PCR: A Dataset for Precedent Understanding and Prior Case Retrieval in the European Court of Human Rights

arxiv url: http://arxiv.org/abs/2404.00596v1
Date: Sun, 31 Mar 2024 08:06:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-04 02:50:30.115766
Title: ECtHR-PCR: A Dataset for Precedent Understanding and Prior Case Retrieval in the European Court of Human Rights
Title（参考訳）: ECtHR-PCR : 欧州人権裁判所における先行的理解と先行事例検索のためのデータセット
Authors: T. Y. S. S Santosh, Rashid Gustav Haddad, Matthias Grabmair,
Abstract要約: 我々は欧州人権裁判所(ECtHR)の判断に基づく事前事例検索データセットを開発する。我々は、様々な負のサンプリング戦略を用いて、様々な語彙と密度の検索手法をベンチマークする。 PCRでは,難易度に基づく陰性サンプリングが有効でないことがわかった。
参考スコア（独自算出の注目度）: 1.3723120574076126
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In common law jurisdictions, legal practitioners rely on precedents to construct arguments, in line with the doctrine of \emph{stare decisis}. As the number of cases grow over the years, prior case retrieval (PCR) has garnered significant attention. Besides lacking real-world scale, existing PCR datasets do not simulate a realistic setting, because their queries use complete case documents while only masking references to prior cases. The query is thereby exposed to legal reasoning not yet available when constructing an argument for an undecided case as well as spurious patterns left behind by citation masks, potentially short-circuiting a comprehensive understanding of case facts and legal principles. To address these limitations, we introduce a PCR dataset based on judgements from the European Court of Human Rights (ECtHR), which explicitly separate facts from arguments and exhibit precedential practices, aiding us to develop this PCR dataset to foster systems' comprehensive understanding. We benchmark different lexical and dense retrieval approaches with various negative sampling strategies, adapting them to deal with long text sequences using hierarchical variants. We found that difficulty-based negative sampling strategies were not effective for the PCR task, highlighting the need for investigation into domain-specific difficulty criteria. Furthermore, we observe performance of the dense models degrade with time and calls for further research into temporal adaptation of retrieval models. Additionally, we assess the influence of different views , Halsbury's and Goodhart's, in practice in ECtHR jurisdiction using PCR task.
Abstract（参考訳）: 一般的な司法管轄区域では、法律実務者は「emph{stare decisis}」の教義に従って、議論を構築するための先例に頼っている。近年, 症例数の増加に伴い, PCR (prefer case search) が注目されている。既存のPCRデータセットは、現実的な設定をシミュレートしない。なぜなら、クエリは完全なケースドキュメントを使用し、前のケースへの参照をマスキングするだけである。したがって、このクエリは、未決定の事件の議論を構築する際に、また引用マスクが残した急激なパターンを構築する際には、法的理由付けに晒され、ケース事実と法的原則の包括的な理解をショートサーキットする可能性がある。これらの制約に対処するため、欧州人権裁判所(ECtHR)の判断に基づくPCRデータセットを導入し、議論から事実を明確に分離し、先例的なプラクティスを示し、システムの包括的な理解を促進するためにこのPCRデータセットの開発を支援する。我々は、様々な負のサンプリング戦略を用いて、様々な語彙と密度の検索手法をベンチマークし、階層的変種を用いて長文列に適応する。難易度に基づく陰性サンプリングはPCRタスクには有効ではなく,ドメイン固有の難易度基準の調査の必要性を強調した。さらに,高次モデルの性能は時間とともに低下し,検索モデルの時間適応に関するさらなる研究が求められている。さらに, PCR タスクを用いたECtHR 管轄区域において, Halsbury's と Goodhart's の異なる視点の影響について検討した。

関連論文リスト

Segment First, Retrieve Better: Realistic Legal Search via Rhetorical Role-Based Queries [3.552993426200889]
TraceRetrieverは、ケース情報を限定して運用することで、現実世界の法的検索を反映する。我々のパイプラインはBM25、Vector Database、Cross-Encoderモデルを統合し、Reciprocal Rank Fusionによる最初の結果を組み合わせています。修辞アノテーションは、インドの判断に基づいて訓練された階層的BiLSTM CRF分類器を用いて生成される。
論文参考訳（メタデータ） (2025-08-01T14:49:33Z)
LLM-based Embedders for Prior Case Retrieval [9.770692788739868]
先行事例検索(英: Prior Case Search, PCR)は、最も関係のある訴訟を自動的に識別することを目的とした情報検索タスクである。最先端のディープラーニングIR法は2つの主要な課題のため、PCRでは成功していない。データプライバシの懸念から、利用可能なPCRデータセットのサイズは制限されることが多く、ディープラーニングベースのモデルを効果的にトレーニングすることは困難である。
論文参考訳（メタデータ） (2025-07-24T14:36:10Z)
Augmented Question-guided Retrieval (AQgR) of Indian Case Law with LLM, RAG, and Structured Summaries [0.0]
本稿では,関連事例の検索を容易にするためにLarge Language Models (LLMs) を提案する。提案手法は,Retrieval Augmented Generation (RAG) と,インドの事例法に最適化された構造化要約を組み合わせたものである。本システムは,関連事例法をより効果的に識別するために,事実シナリオに基づく対象の法的質問を生成する。
論文参考訳（メタデータ） (2025-07-23T05:24:44Z)
A Reproducibility Study of Graph-Based Legal Case Retrieval [1.6819960041696331]
CaseLinkは、法的なケース検索のためのグラフベースの方法である。 CaseLinkは、ドキュメントのスタンドアロンレベルを超えるケースの高次の関係をキャプチャする。新たな成果を再現する上での課題が最近強調されている。
論文参考訳（メタデータ） (2025-04-11T10:04:12Z)
LeCoPCR: Legal Concept-guided Prior Case Retrieval for European Court of Human Rights cases [1.3723120574076126]
本稿では,特定のクエリケース事実から法的概念の形で意図を明示的に生成する手法であるLeCoPCRを提案する。我々は、DPP(Determinantal Point Process)を用いた推論部から重要な法的概念を抽出し、品質と多様性のバランスをとるために、弱い監督アプローチを採用する。
論文参考訳（メタデータ） (2025-01-23T22:10:00Z)
Few-shot Policy (de)composition in Conversational Question Answering [54.259440408606515]
本稿では,大規模言語モデル(LLM)を用いて数ショット設定でポリシーコンプライアンスを検出するニューラルシンボリックフレームワークを提案する。提案手法は,回答すべきサブクエストを抽出し,文脈情報から真理値を割り当て,与えられたポリシーから論理文の集合を明示的に生成することで,政策コンプライアンスに関する会話に対して健全な理由を示す。本手法は,PCDおよび会話機械読解ベンチマークであるShARCに適用し,タスク固有の微調整を伴わずに競合性能を示す。
論文参考訳（メタデータ） (2025-01-20T08:40:15Z)
Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文参考訳（メタデータ） (2024-10-09T06:26:39Z)
Contrastive Learning to Improve Retrieval for Real-world Fact Checking [84.57583869042791]
ファクト・チェッキング・リランカ(Contrastive Fact-Checking Reranker, CFR)を提案する。我々はAVeriTeCデータセットを活用し、証拠文書からの人間による回答とクレームのサブクエストを注釈付けする。データセットの精度は6%向上した。
論文参考訳（メタデータ） (2024-10-07T00:09:50Z)
LawLLM: Law Large Language Model for the US Legal System [43.13850456765944]
我々は,米国法域に特化して設計されたマルチタスクモデルであるLawLLM(Law Large Language Model)を紹介する。類似症例検索(SCR)、PCR(Precedent Case Recommendation)、LJP(Lawal Judgment Prediction)においてLawLLMが優れているそこで本研究では,各タスクに対して,生の法定データをトレーニング可能な形式に変換する,カスタマイズされたデータ前処理手法を提案する。
論文参考訳（メタデータ） (2024-07-27T21:51:30Z)
Query Performance Prediction using Relevance Judgments Generated by Large Language Models [53.97064615557883]
自動生成関連判定(QPP-GenRE)を用いたQPPフレームワークを提案する。 QPP-GenREは、QPPを独立したサブタスクに分解し、ランクリスト内の各項目の関連性を所定のクエリに予測する。これにより、生成した関連判断を擬似ラベルとして利用して、任意のIR評価尺度を予測することができる。
論文参考訳（メタデータ） (2024-04-01T09:33:05Z)
Query-driven Relevant Paragraph Extraction from Legal Judgments [1.2562034805037443]
法律専門家は、クエリに直接対処する情報をピンポイントするために、長い法的判断をナビゲートすることに悩まされることが多い。本稿では,クエリに基づく法的判断から関連する段落を抽出する作業に焦点をあてる。本稿では,欧州人権裁判所(ECtHR)のケース・ロー・ガイドを用いて,この課題のための特別なデータセットを構築した。
論文参考訳（メタデータ） (2024-03-31T08:03:39Z)
DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文参考訳（メタデータ） (2024-03-27T10:40:14Z)
MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文参考訳（メタデータ） (2023-10-24T08:17:11Z)
U-CREAT: Unsupervised Case Retrieval using Events extrAcTion [2.2385755093672044]
本稿では, IL-PCR (Indian Legal Prior Case Retrieval) コーパスのための新しいベンチマーク(英語)を提案する。判例検索におけるイベントの役割について検討し,教師なし検索手法に基づくパイプラインU-CREATを提案する。提案手法はBM25に比べて性能が著しく向上し,検索精度が大幅に向上することがわかった。
論文参考訳（メタデータ） (2023-07-11T13:51:12Z)
Provably Efficient UCB-type Algorithms For Learning Predictive State Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。 PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文参考訳（メタデータ） (2023-07-01T18:35:21Z)
The Legal Argument Reasoning Task in Civil Procedure [2.079168053329397]
我々は,米国民事訴訟の領域から新たなNLPタスクとデータセットを提示する。データセットの各インスタンスは、ケースの一般的な導入、特定の質問、可能な解決策引数で構成されている。
論文参考訳（メタデータ） (2022-11-05T17:41:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。