Fugu-MT 論文翻訳(概要): MUSER: A Multi-View Similar Case Retrieval Dataset

論文の概要: MUSER: A Multi-View Similar Case Retrieval Dataset

arxiv url: http://arxiv.org/abs/2310.15602v1
Date: Tue, 24 Oct 2023 08:17:11 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-25 20:02:55.921608
Title: MUSER: A Multi-View Similar Case Retrieval Dataset
Title（参考訳）: MUSER: マルチビュー類似のケース検索データセット
Authors: Qingquan Li and Yiran Hu and Feng Yao and Chaojun Xiao and Zhiyuan Liu and Maosong Sun and Weixing Shen
Abstract要約: 類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
参考スコア（独自算出の注目度）: 65.36779942237357
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Similar case retrieval (SCR) is a representative legal AI application that plays a pivotal role in promoting judicial fairness. However, existing SCR datasets only focus on the fact description section when judging the similarity between cases, ignoring other valuable sections (e.g., the court's opinion) that can provide insightful reasoning process behind. Furthermore, the case similarities are typically measured solely by the textual semantics of the fact descriptions, which may fail to capture the full complexity of legal cases from the perspective of legal knowledge. In this work, we present MUSER, a similar case retrieval dataset based on multi-view similarity measurement and comprehensive legal element with sentence-level legal element annotations. Specifically, we select three perspectives (legal fact, dispute focus, and law statutory) and build a comprehensive and structured label schema of legal elements for each of them, to enable accurate and knowledgeable evaluation of case similarities. The constructed dataset originates from Chinese civil cases and contains 100 query cases and 4,024 candidate cases. We implement several text classification algorithms for legal element prediction and various retrieval methods for retrieving similar cases on MUSER. The experimental results indicate that incorporating legal elements can benefit the performance of SCR models, but further efforts are still required to address the remaining challenges posed by MUSER. The source code and dataset are released at https://github.com/THUlawtech/MUSER.
Abstract（参考訳）: 類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。しかし、既存のSCRデータセットは、事件間の類似性を判断する際にのみ事実記述セクションに焦点をあてており、背景にある洞察力のある推論プロセスを提供する他の価値あるセクション(例えば裁判所の意見)を無視している。さらに、ケースの類似性は、典型的には事実記述のテクスト的意味論のみによって測定され、法的知識の観点からは、訴訟の完全な複雑さを捉えることができない可能性がある。本稿では,多視点類似度測定に基づく類似事例検索データセットであるmuserと,文レベルの法的要素アノテーションを用いた包括的法的要素を提案する。具体的には,3つの視点(法的事実,紛争焦点,法規)を選択し,それぞれに法的要素の包括的かつ構造化されたラベルスキーマを構築し,ケース類似性の正確かつ理解可能な評価を可能にする。構築されたデータセットは、中国の民事事件から始まり、100のクエリケースと4,024の候補ケースを含んでいる。法的な要素予測のためのテキスト分類アルゴリズムと,MUSER上の類似事例を検索するための様々な検索手法を実装した。実験結果から, 法的要素を組み込むことでSCRモデルの性能向上が期待できるが, MUSERがもたらした課題に対処するためには, さらなる努力が必要であることが示唆された。ソースコードとデータセットはhttps://github.com/thulawtech/muserで公開されている。

関連論文リスト

CaseFacts: A Benchmark for Legal Fact-Checking and Precedent Retrieval [5.305110876082343]
CaseFactsは、アメリカ合衆国最高裁判所の判例に対する法的主張を検証するためのベンチマークである。データセットは、Supported、Refuted、Overruledに分類される6,294のクレームで構成されている。
論文参考訳（メタデータ） (2026-01-23T23:41:46Z)
AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文参考訳（メタデータ） (2025-02-28T19:14:48Z)
How Vital is the Jurisprudential Relevance: Law Article Intervened Legal Case Retrieval and Matching [31.378981566988063]
法的ケース検索(LCR)は、与えられたクエリに基づいて、同等の法的ケースを自動的に検索することを目的としている。これに対処するためには、司法ドメイン内の独自の法的・合理的な類似性を評価するのが難しい課題だ。上記の課題を解決するために, LCM-LAI というエンド・ツー・エンドのモデルを提案する。
論文参考訳（メタデータ） (2025-02-25T15:29:07Z)
Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文参考訳（メタデータ） (2024-10-09T06:26:39Z)
SparseCL: Sparse Contrastive Learning for Contradiction Retrieval [87.02936971689817]
コントラディション検索(Contradiction Search)とは、クエリの内容に明示的に異を唱える文書を識別し、抽出することである。類似性探索やクロスエンコーダモデルといった既存の手法には、大きな制限がある。文間の微妙で矛盾したニュアンスを保存するために特別に訓練された文埋め込みを利用するSparseCLを導入する。
論文参考訳（メタデータ） (2024-06-15T21:57:03Z)
DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文参考訳（メタデータ） (2024-03-27T10:40:14Z)
An Intent Taxonomy of Legal Case Retrieval [43.22489520922202]
訴訟検索は、訴訟文書に焦点をあてた特別情報検索(IR)タスクである。判例検索の新しい階層的意図分類法を提案する。判例検索において,検索意図の違いによるユーザの行動と満足度に有意な差が認められた。
論文参考訳（メタデータ） (2023-07-25T07:27:32Z)
SAILER: Structure-aware Pre-trained Language Model for Legal Case Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文参考訳（メタデータ） (2023-04-22T10:47:01Z)
Exploiting Contrastive Learning and Numerical Evidence for Confusing Legal Judgment Prediction [46.71918729837462]
訴訟の事実記述文を考慮し、法的判断予測は、事件の告訴、法律記事、刑期を予測することを目的としている。従来の研究では、標準的なクロスエントロピー分類損失と異なる分類誤差を区別できなかった。本稿では,モコに基づく教師付きコントラスト学習を提案する。さらに,事前学習した数値モデルにより符号化された抽出された犯罪量による事実記述の表現をさらに強化する。
論文参考訳（メタデータ） (2022-11-15T15:53:56Z)
Legal Element-oriented Modeling with Multi-view Contrastive Learning for Legal Case Retrieval [3.909749182759558]
本稿では,多視点コントラスト学習目標を用いた訴訟検索のための対話型ネットワークを提案する。ケースビューコントラスト学習は、関連する訴訟表現の間の隠れた空間距離を最小化する。ケースの法的な要素を検出するために、法的な要素の知識を意識した指標を用いています。
論文参考訳（メタデータ） (2022-10-11T06:47:23Z)
Aspect Classification for Legal Depositions [0.0]
責任だけでなく、出来事、事故、身体状態、治療についても知ることが重要である。法的規定は、先延ばしの証言の一部として議論される様々な側面から成り立っている。本手法はF1スコアの0.83を達成している。
論文参考訳（メタデータ） (2020-09-09T18:00:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。