論文の概要: Mining Legal Arguments to Study Judicial Formalism
- arxiv url: http://arxiv.org/abs/2512.11374v1
- Date: Fri, 12 Dec 2025 08:37:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.705659
- Title: Mining Legal Arguments to Study Judicial Formalism
- Title(参考訳): 司法形式主義研究のための法定条項のマイニング
- Authors: Tomáš Koref, Lena Held, Mahammad Namazov, Harun Kumru, Yassine Thlija, Christoph Burchard, Ivan Habernal,
- Abstract要約: この研究は、司法推論を自動で検出・分類する手法を開発することで、中欧・東欧における形式的判断(CEE)について論じている。
我々はチェコの2つの最高裁判所から、9,183段落のエキスパートアノテーションによる272の判決のMADONデータセットを作成します。
ModernBERT、Llama 3.1、従来の機能ベースの機械学習を組み合わせた3段階のパイプラインは、決定分類に有望な結果をもたらす。
- 参考スコア(独自算出の注目度): 7.685444048563301
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Courts must justify their decisions, but systematically analyzing judicial reasoning at scale remains difficult. This study refutes claims about formalistic judging in Central and Eastern Europe (CEE) by developing automated methods to detect and classify judicial reasoning in Czech Supreme Courts' decisions using state-of-the-art natural language processing methods. We create the MADON dataset of 272 decisions from two Czech Supreme Courts with expert annotations of 9,183 paragraphs with eight argument types and holistic formalism labels for supervised training and evaluation. Using a corpus of 300k Czech court decisions, we adapt transformer LLMs for Czech legal domain by continued pretraining and experiment with methods to address dataset imbalance including asymmetric loss and class weighting. The best models successfully detect argumentative paragraphs (82.6\% macro-F1), classify traditional types of legal argument (77.5\% macro-F1), and classify decisions as formalistic/non-formalistic (83.2\% macro-F1). Our three-stage pipeline combining ModernBERT, Llama 3.1, and traditional feature-based machine learning achieves promising results for decision classification while reducing computational costs and increasing explainability. Empirically, we challenge prevailing narratives about CEE formalism. This work shows that legal argument mining enables reliable judicial philosophy classification and shows the potential of legal argument mining for other important tasks in computational legal studies. Our methodology is easily replicable across jurisdictions, and our entire pipeline, datasets, guidelines, models, and source codes are available at https://github.com/trusthlt/madon.
- Abstract(参考訳): 裁判所はその決定を正当化しなければならないが、体系的に大規模に法的理由を解析することは依然として困難である。
この研究は、チェコ最高裁判所の判断において、最先端の自然言語処理手法を用いて、司法推論を自動で検出・分類する手法を開発することで、中欧および東欧における形式的判断(CEE)について論じている。
我々は,チェコの2つの最高裁判所から,9,183段落のエキスパートアノテーションと8つの議論型,および教師付きトレーニングと評価のための全体論的フォーマリズムラベルを用いて,272の判断のMADONデータセットを作成する。
300kのチェコの裁判所決定コーパスを用いて、チェコの法域に対してトランスフォーマーLLMを事前訓練し、非対称な損失やクラス重み付けを含むデータセットの不均衡に対処する方法を実験する。
最良のモデルは、議論的段落 (82.6\% macro-F1) を検知し、従来の法的議論のタイプ (77.5\% macro-F1) を分類し、決定を形式的/非形式的 (83.2\% macro-F1) に分類する。
ModernBERT、Llama 3.1、従来の特徴ベース機械学習を組み合わせた3段階パイプラインは、計算コストを削減し、説明可能性を高めるとともに、決定分類の有望な結果を得る。
実証的に、我々はCEE形式主義に関する一般的な物語に挑戦する。
この研究は、法的議論のマイニングが信頼できる司法哲学の分類を可能にし、計算法的研究における他の重要なタスクに対する法的議論のマイニングの可能性を示している。
私たちの方法論は管轄区域で容易に複製可能で、パイプライン全体、データセット、ガイドライン、モデル、ソースコードはhttps://github.com/trusthlt/madon.comで公開されています。
関連論文リスト
- ReaKase-8B: Legal Case Retrieval via Knowledge and Reasoning Representations with LLMs [37.688405624086315]
ReaKase-8Bフレームワークは、抽出された法的事実、法的問題、法的関係のトリプレット、および効果的な訴訟検索のための法的推論を活用するために提案されている。
COLIEE 2022とCOLIEE 2023による2つのベンチマークデータセットの実験により、我々の知識と拡張埋め込みの推論が検索性能を大幅に向上することを示した。
論文 参考訳(メタデータ) (2025-10-30T06:35:36Z) - The Judge Variable: Challenging Judge-Agnostic Legal Judgment Prediction [0.0]
本研究では,法的意思決定における人間裁判官の役割について検討する。
機械学習を使って、フランスの控訴裁判所で児童の身体的保護結果を予測する。
論文 参考訳(メタデータ) (2025-07-18T08:28:53Z) - RLJP: Legal Judgment Prediction via First-Order Logic Rule-enhanced with Large Language Models [58.69183479148083]
法的判断予測(LJP)は、法的AIにおいて重要な課題である。
既存のLJPモデルは、高いパフォーマンスのために司法上の前例と法的な知識を統合している。
しかし彼らは、厳密な論理分析を必要とする法的判断の重要な要素である法的推論論理を無視している。
本稿では、一階述語論理(FOL)形式と比較学習(CL)に基づく規則強化された法的判断予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-27T14:50:21Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - LLM vs. Lawyers: Identifying a Subset of Summary Judgments in a Large UK
Case Law Dataset [0.0]
本研究は, 英国裁判所判決の大規模コーパスから, 判例, 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、
我々は、ケンブリッジ法コーパス356,011英国の裁判所決定を用いて、大きな言語モデルは、キーワードに対して重み付けされたF1スコアが0.94対0.78であると判断する。
我々は,3,102件の要約判断事例を同定し抽出し,その分布を時間的範囲の様々な英国裁判所にマップできるようにする。
論文 参考訳(メタデータ) (2024-03-04T10:13:30Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Mining Legal Arguments in Court Decisions [43.09204050756282]
我々は,欧州人権裁判所の手続において,法的議論のための新たな注釈体系を開発する。
第2に、373の判決の大規模なコーパスをコンパイルし、注釈を付ける。
第三に、法的なNLPドメインにおける最先端モデルよりも優れた引数マイニングモデルを訓練する。
論文 参考訳(メタデータ) (2022-08-12T08:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。