論文の概要: Unlocking Legal Knowledge: A Multilingual Dataset for Judicial Summarization in Switzerland
- arxiv url: http://arxiv.org/abs/2410.13456v3
- Date: Thu, 18 Sep 2025 12:48:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 13:12:58.887505
- Title: Unlocking Legal Knowledge: A Multilingual Dataset for Judicial Summarization in Switzerland
- Title(参考訳): 法的知識のアンロック:スイスにおける司法要約のための多言語データセット
- Authors: Luca Rolshoven, Vishvaksenan Rasiah, Srinanda Brügger Bose, Sarah Hostettler, Lara Burkhalter, Matthias Stürmer, Joel Niklaus,
- Abstract要約: 我々はスイス連邦最高裁判所の20万件の判決を含むスイスのランドマーク決定要約データセットを紹介する。
我々は、オープンモデルを微調整し、それらをより大きな汎用および推論調整 LLM と比較する。
細調整されたモデルは語彙的類似性において良好に機能し、大きなモデルはより法的に正確で一貫性のある要約を生成する。
- 参考スコア(独自算出の注目度): 7.350131318516811
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Legal research depends on headnotes: concise summaries that help lawyers quickly identify relevant cases. Yet, many court decisions lack them due to the high cost of manual annotation. To address this gap, we introduce the Swiss Landmark Decisions Summarization (SLDS) dataset containing 20K rulings from the Swiss Federal Supreme Court, each with headnotes in German, French, and Italian. SLDS has the potential to significantly improve access to legal information and transform legal research in Switzerland. We fine-tune open models (Qwen2.5, Llama 3.2, Phi-3.5) and compare them to larger general-purpose and reasoning-tuned LLMs, including GPT-4o, Claude 3.5 Sonnet, and the open-source DeepSeek R1. Using an LLM-as-a-Judge framework, we find that fine-tuned models perform well in terms of lexical similarity, while larger models generate more legally accurate and coherent summaries. Interestingly, reasoning-focused models show no consistent benefit, suggesting that factual precision is more important than deep reasoning in this task. We release SLDS under a CC BY 4.0 license to support future research in cross-lingual legal summarization.
- Abstract(参考訳): 法律研究は、弁護士が関連する事件を素早く特定するのに役立つ簡潔な要約(concise summaries)という見出しに依存する。
しかし、多くの裁判所の判断は、手作業によるアノテーションのコストが高いために欠落している。
このギャップに対処するために、スイス連邦最高裁判所の20万件の判決を含むスイスのランドマーク決定要約(SLDS)データセットを紹介します。
SLDSは、法的情報へのアクセスを大幅に改善し、スイスにおける法的研究を変革する可能性がある。
我々は、オープンモデル(Qwen2.5、Llama 3.2、Phi-3.5)をGPT-4o、Claude 3.5 Sonnet、オープンソースのDeepSeek R1など、より汎用的で推論調整されたLLMと比較する。
LLM-as-a-Judge フレームワークを用いることで、細調整されたモデルは語彙的類似性の観点からうまく機能し、大きなモデルはより法的に正確で一貫性のある要約を生成する。
興味深いことに、推論に焦点を当てたモデルは一貫した利益を示さず、このタスクにおける深い推論よりも事実的精度の方が重要であることを示唆している。
SLDSをCC BY 4.0ライセンスでリリースし、言語間法的な要約の今後の研究を支援する。
関連論文リスト
- BriefMe: A Legal NLP Benchmark for Assisting with Legal Briefs [4.501619011158408]
法務NLPで過小評価されている法的作業の核心は、法務ブリーフィングの執筆と編集である。
法的なブリーフィングに焦点を当てた新しいデータセットであるBRIEFMEを紹介する。
言語モデルには3つのタスクが含まれており、議論の要約、議論の完了、事例検索というブリーフを書く際に、法的専門家を支援する。
論文 参考訳(メタデータ) (2025-06-07T01:33:44Z) - LEXam: Benchmarking Legal Reasoning on 340 Law Exams [61.344330783528015]
LEXamは、様々な科目と学位レベルの116の法学校コースにまたがる340の法試験から派生した、新しいベンチマークである。
このデータセットは、英語とドイツ語で4,886の法試験の質問で構成されており、その中には2,841の長文のオープンエンドの質問と2,045のマルチチョイスの質問が含まれている。
論文 参考訳(メタデータ) (2025-05-19T08:48:12Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。
われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。
InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文 参考訳(メタデータ) (2024-06-21T06:19:03Z) - LLM vs. Lawyers: Identifying a Subset of Summary Judgments in a Large UK
Case Law Dataset [0.0]
本研究は, 英国裁判所判決の大規模コーパスから, 判例, 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、
我々は、ケンブリッジ法コーパス356,011英国の裁判所決定を用いて、大きな言語モデルは、キーワードに対して重み付けされたF1スコアが0.94対0.78であると判断する。
我々は,3,102件の要約判断事例を同定し抽出し,その分布を時間的範囲の様々な英国裁判所にマップできるようにする。
論文 参考訳(メタデータ) (2024-03-04T10:13:30Z) - The Ethics of Automating Legal Actors [58.81546227716182]
我々は、裁判官の役割の自動化は、特に一般的な法体系において、難しい倫理的課題を提起すると主張している。
我々の主張は、単に法律を適用するのではなく、法律を積極的に形成する際の裁判官の社会的役割から従う。
モデルが人間レベルの能力を達成できたとしても、法的プロセスの自動化に固有の倫理的懸念は残るだろう。
論文 参考訳(メタデータ) (2023-12-01T13:48:46Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Automated Argument Generation from Legal Facts [6.057773749499076]
法律体系に提出される事件の数は、ある国の法律専門家の数よりもはるかに多い。
本研究では,訴訟分析の過程において,法的専門家を支援することに焦点を当てた。
実験結果から,ベストパフォーマンスメソッドから生成された引数は,ベンチマークセットのゴールド標準アノテーションと平均63%の重なりを持つことがわかった。
論文 参考訳(メタデータ) (2023-10-09T12:49:35Z) - Interpretable Long-Form Legal Question Answering with
Retrieval-Augmented Large Language Models [10.834755282333589]
長文の法的問合せデータセットは、専門家によるフランス語の法的質問1,868件からなる。
実験結果から,自動評価指標について有望な性能を示した。
LLeQAは、専門家によって注釈付けされた唯一の包括的なロングフォームLQAデータセットの1つであり、重要な現実世界の問題を解決するために研究を加速するだけでなく、特殊な領域におけるNLPモデルを評価するための厳密なベンチマークとしても機能する可能性がある。
論文 参考訳(メタデータ) (2023-09-29T08:23:19Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - JUSTICE: A Benchmark Dataset for Supreme Court's Judgment Prediction [0.0]
我々は、自然言語処理(NLP)研究やその他のデータ駆動アプリケーションで容易に利用できるように、SCOTUS裁判所の高品質なデータセットを作成することを目指している。
先進的なNLPアルゴリズムを用いて以前の訴訟を分析することにより、訓練されたモデルは裁判所の判断を予測し、分類することができる。
論文 参考訳(メタデータ) (2021-12-06T23:19:08Z) - Swiss-Judgment-Prediction: A Multilingual Legal Judgment Prediction
Benchmark [4.533408938245527]
法的判断予測(LJP)データセットは、英語、フランス語、中国語でリリースされた。
我々はスイス連邦最高裁判所から、多言語(ドイツ語、フランス語、イタリア語)のダイアクロニック(2000-2020)コーパス85Kの症例を公表した。
我々は、BERT入力(テキスト)長制限を克服するBERTの2つの変種を含む、最先端のBERTベースの手法を評価する。
論文 参考訳(メタデータ) (2021-10-02T13:50:21Z) - Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。
判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文 参考訳(メタデータ) (2021-05-09T09:39:25Z) - How Does NLP Benefit Legal System: A Summary of Legal Artificial
Intelligence [81.04070052740596]
法律人工知能(Legal AI)は、人工知能、特に自然言語処理の技術を適用して、法的領域におけるタスクに役立てることに焦点を当てている。
本稿では,LegalAIにおける研究の歴史,現状,今後の方向性について紹介する。
論文 参考訳(メタデータ) (2020-04-25T14:45:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。