Fugu-MT 論文翻訳(概要): LeCaRDv2: A Large-Scale Chinese Legal Case Retrieval Dataset

論文の概要: LeCaRDv2: A Large-Scale Chinese Legal Case Retrieval Dataset

arxiv url: http://arxiv.org/abs/2310.17609v1
Date: Thu, 26 Oct 2023 17:32:55 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-27 18:35:53.247747
Title: LeCaRDv2: A Large-Scale Chinese Legal Case Retrieval Dataset
Title（参考訳）: lecardv2:中国の大規模訴訟検索データセット
Authors: Haitao Li, Yunqiu Shao, Yueyue Wu, Qingyao Ai, Yixiao Ma, Yiqun Liu
Abstract要約: 大規模法ケース検索データセットLeCaRDv2(バージョン2)を紹介する。 800のクエリと430万件の刑事事件文書から抽出された55,192の候補で構成されている。評価,ペナルティ,手順の3つの重要な側面を考慮し,既存の関連基準を充実させる。データセットのすべてのケースは、刑事法を専門とする複数の法律専門家によって注釈付けされています。
参考スコア（独自算出の注目度）: 20.315416393247247
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: As an important component of intelligent legal systems, legal case retrieval plays a critical role in ensuring judicial justice and fairness. However, the development of legal case retrieval technologies in the Chinese legal system is restricted by three problems in existing datasets: limited data size, narrow definitions of legal relevance, and naive candidate pooling strategies used in data sampling. To alleviate these issues, we introduce LeCaRDv2, a large-scale Legal Case Retrieval Dataset (version 2). It consists of 800 queries and 55,192 candidates extracted from 4.3 million criminal case documents. To the best of our knowledge, LeCaRDv2 is one of the largest Chinese legal case retrieval datasets, providing extensive coverage of criminal charges. Additionally, we enrich the existing relevance criteria by considering three key aspects: characterization, penalty, procedure. This comprehensive criteria enriches the dataset and may provides a more holistic perspective. Furthermore, we propose a two-level candidate set pooling strategy that effectively identify potential candidates for each query case. It's important to note that all cases in the dataset have been annotated by multiple legal experts specializing in criminal law. Their expertise ensures the accuracy and reliability of the annotations. We evaluate several state-of-the-art retrieval models at LeCaRDv2, demonstrating that there is still significant room for improvement in legal case retrieval. The details of LeCaRDv2 can be found at the anonymous website https://github.com/anonymous1113243/LeCaRDv2.
Abstract（参考訳）: インテリジェントな法制度の重要な構成要素として、訴訟検索は司法の正義と公正の確保に重要な役割を果たしている。しかし,中国法体系における判例検索技術の発展は,データサイズ制限,法的な関連性の限定的定義,データサンプリングに使用される素案プール戦略の3つの問題によって制限されている。これらの問題を緩和するために、大規模な法律ケース検索データセット(バージョン2)であるLeCaRDv2を紹介します。 800のクェリと430万件の刑事事件文書から抽出された55,192人の候補者からなる。私たちの知る限りでは、LeCaRDv2は中国最大の訴訟検索データセットの1つであり、刑事容疑の広範な報道を提供する。さらに、評価、ペナルティ、手続きの3つの重要な側面を考慮し、既存の関連基準を強化する。この包括的な基準はデータセットを豊かにし、より包括的な視点を提供する。さらに,各クエリケースの候補を効果的に識別する2段階の候補セットプーリング戦略を提案する。データセットのすべてのケースは、刑事法を専門とする複数の法律専門家によって注釈付けされています。彼らの専門知識はアノテーションの正確性と信頼性を保証する。我々はLeCaRDv2におけるいくつかの最先端検索モデルを評価し、訴訟検索に改善の余地があることを実証した。 LeCaRDv2の詳細は匿名ウェブサイトhttps://github.com/anonymous1113243/LeCaRDv2で確認できる。

関連論文リスト

ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation [56.79698529022327]
法的な主張は、事件における原告の要求を言及し、法的理由づけと事件解決を導くのに不可欠である。本稿では,その事例の事実に基づく法的クレーム生成の問題について考察する。われわれは,中国法定クレーム生成タスクの最初のデータセットであるClaymGen-CNを構築した。
論文参考訳（メタデータ） (2025-08-24T07:19:25Z)
ASP2LJ : An Adversarial Self-Play Laywer Augmented Legal Judgment Framework [21.003203706712643]
法的判断予測 (LJP) は、関連する法的費用、条件、罰金を含む司法結果を予測することを目的としている。現在のデータセットは、真正ケースから派生したもので、高い人間のアノテーションコストと不均衡な分布に悩まされている。本稿では, ASP2LJ という法定法定法定フレームワークを提案する。我々の枠組みは、裁判官が進化した弁護士の議論を参照することを可能にし、司法決定の客観性、公正性、合理性を改善する。
論文参考訳（メタデータ） (2025-06-11T06:55:40Z)
LegalSearchLM: Rethinking Legal Case Retrieval as Legal Elements Generation [5.243460995467895]
韓国初の大規模判例検索ベンチマークであるLEGAR BENCHを,1.2万件以上のクエリで411種類の犯罪タイプをカバーした。また、クエリーケースに対して法的要素推論を行い、ターゲットケースに基礎を置くコンテンツを直接生成する検索モデルであるLegalSearchLMを提案する。
論文参考訳（メタデータ） (2025-05-28T09:02:41Z)
AppealCase: A Dataset and Benchmark for Civil Case Appeal Scenarios [47.83822985839837]
本稿では,91件の民事事件の1万対の実世界と一致した第1インスタンスと第2インスタンスの文書からなるFiceCaseデータセットを提案する。このデータセットには、判断の逆転、逆転理由、引用された法的規定、クレームレベルの決定、第2のインスタンスに新たな情報があるかどうかという5つの側面に沿った詳細なアノテーションも含まれている。実験結果から, すべてのモデルが判定逆転予測タスクにおいて50%未満のF1スコアを達成し, 魅力シナリオの複雑さと課題を浮き彫りにしていることがわかった。
論文参考訳（メタデータ） (2025-05-22T10:50:33Z)
AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文参考訳（メタデータ） (2025-02-28T19:14:48Z)
Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文参考訳（メタデータ） (2024-10-09T06:26:39Z)
Learning Interpretable Legal Case Retrieval via Knowledge-Guided Case Reformulation [22.85652668826498]
本稿では,大言語モデル(LLM)に基づく法的な知識誘導型事例修正手法であるKELLERを紹介する。犯罪や法律記事に関する専門的な法的知識を取り入れることで、大規模な言語モデルにより、原訴訟を犯罪の簡潔なサブファクトに正確に修正することができる。
論文参考訳（メタデータ） (2024-06-28T08:59:45Z)
DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文参考訳（メタデータ） (2024-03-27T10:40:14Z)
MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文参考訳（メタデータ） (2023-10-24T08:17:11Z)
An Intent Taxonomy of Legal Case Retrieval [43.22489520922202]
訴訟検索は、訴訟文書に焦点をあてた特別情報検索(IR)タスクである。判例検索の新しい階層的意図分類法を提案する。判例検索において,検索意図の違いによるユーザの行動と満足度に有意な差が認められた。
論文参考訳（メタデータ） (2023-07-25T07:27:32Z)
SAILER: Structure-aware Pre-trained Language Model for Legal Case Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文参考訳（メタデータ） (2023-04-22T10:47:01Z)
Legal Element-oriented Modeling with Multi-view Contrastive Learning for Legal Case Retrieval [3.909749182759558]
本稿では,多視点コントラスト学習目標を用いた訴訟検索のための対話型ネットワークを提案する。ケースビューコントラスト学習は、関連する訴訟表現の間の隠れた空間距離を最小化する。ケースの法的な要素を検出するために、法的な要素の知識を意識した指標を用いています。
論文参考訳（メタデータ） (2022-10-11T06:47:23Z)
LEVEN: A Large-Scale Chinese Legal Event Detection Dataset [82.44096140591675]
大規模な中国のLegal eVENt検出データセットであるLEVENを,8,116件の法的文書と150,977件の人為的注釈付きイベントを108件のイベントタイプで紹介した。 LEVENは法定事象検出データセットとしては最大であり、他のデータスケールの数十倍の規模を持ち、LEDメソッドのトレーニングと評価を著しく促進する。
論文参考訳（メタデータ） (2022-03-16T11:40:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。