Fugu-MT 論文翻訳(概要): Unlocking Legal Knowledge: A Multilingual Dataset for Judicial Summarization in Switzerland

論文の概要: Unlocking Legal Knowledge: A Multilingual Dataset for Judicial Summarization in Switzerland

arxiv url: http://arxiv.org/abs/2410.13456v1
Date: Thu, 17 Oct 2024 11:34:07 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:36.884476
Title: Unlocking Legal Knowledge: A Multilingual Dataset for Judicial Summarization in Switzerland
Title（参考訳）: 法的知識のアンロック:スイスにおける司法要約のための多言語データセット
Authors: Luca Rolshoven, Vishvaksenan Rasiah, Srinanda Brügger Bose, Matthias Stürmer, Joel Niklaus,
Abstract要約: ヘッドノートの自動作成は、スイスだけで何十万もの意思決定を、より容易に行えるものにする可能性がある。これを開始するために、スイスリード決定要約データセットを紹介します。この言語横断的な資料にはドイツ語、フランス語、イタリア語の18K裁判所判決とドイツ語の見出しが記載されている。我々の分析では、プロプライエタリなモデルはゼロショットとワンショット設定でよく機能するが、微調整された小さなモデルは依然として強力な競争力を持つ。
参考スコア（独自算出の注目度）: 3.9716689953391904
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Legal research is a time-consuming task that most lawyers face on a daily basis. A large part of legal research entails looking up relevant caselaw and bringing it in relation to the case at hand. Lawyers heavily rely on summaries (also called headnotes) to find the right cases quickly. However, not all decisions are annotated with headnotes and writing them is time-consuming. Automated headnote creation has the potential to make hundreds of thousands of decisions more accessible for legal research in Switzerland alone. To kickstart this, we introduce the Swiss Leading Decision Summarization ( SLDS) dataset, a novel cross-lingual resource featuring 18K court rulings from the Swiss Federal Supreme Court (SFSC), in German, French, and Italian, along with German headnotes. We fine-tune and evaluate three mT5 variants, along with proprietary models. Our analysis highlights that while proprietary models perform well in zero-shot and one-shot settings, fine-tuned smaller models still provide a strong competitive edge. We publicly release the dataset to facilitate further research in multilingual legal summarization and the development of assistive technologies for legal professionals
Abstract（参考訳）: 法律研究は、ほとんどの弁護士が日々直面する時間を要する課題である。法的な研究の大部分は、関連する訴訟を調査し、その事件を手元に持ってくることである。弁護士は、適切なケースを素早く見つけるために、要約(見出しとも呼ばれる)に強く依存する。しかし、すべての決定が見出しで注釈付けされ、それらを書くのに時間がかかります。ヘッドノートの自動作成は、スイスだけで何十万もの意思決定を、より容易に行えるものにする可能性がある。これを開始するために、スイス連邦最高裁判所(SFSC)による18K裁判所判決と、ドイツ語、フランス語、イタリア語の見出しを含む新たな言語間リソースであるSwiss Leading Decision Summarization(SLDS)データセットを紹介した。プロプライエタリモデルとともに、3つのmT5変種を微調整し評価する。我々の分析では、プロプライエタリなモデルはゼロショットとワンショット設定でよく機能するが、微調整された小さなモデルは依然として強力な競争力を持つ。我々は、多言語法的要約のさらなる研究を促進するためのデータセットを公開し、法律専門家のための補助技術の開発を行っている。

関連論文リスト

Mining Legal Arguments to Study Judicial Formalism [7.685444048563301]
この研究は、司法推論を自動で検出・分類する手法を開発することで、中欧・東欧における形式的判断(CEE)について論じている。我々はチェコの2つの最高裁判所から、9,183段落のエキスパートアノテーションによる272の判決のMADONデータセットを作成します。 ModernBERT、Llama 3.1、従来の機能ベースの機械学習を組み合わせた3段階のパイプラインは、決定分類に有望な結果をもたらす。
論文参考訳（メタデータ） (2025-12-12T08:37:53Z)
ReaKase-8B: Legal Case Retrieval via Knowledge and Reasoning Representations with LLMs [37.688405624086315]
ReaKase-8Bフレームワークは、抽出された法的事実、法的問題、法的関係のトリプレット、および効果的な訴訟検索のための法的推論を活用するために提案されている。 COLIEE 2022とCOLIEE 2023による2つのベンチマークデータセットの実験により、我々の知識と拡張埋め込みの推論が検索性能を大幅に向上することを示した。
論文参考訳（メタデータ） (2025-10-30T06:35:36Z)
GLARE: Agentic Reasoning for Legal Judgment Prediction [60.13483016810707]
法学分野では、法的判断予測(LJP)がますます重要になっている。既存の大規模言語モデル (LLM) には、法的な知識が不足しているため、推論に不十分な重大な問題がある。 GLAREは,異なるモジュールを呼び出し,重要な法的知識を動的に獲得するエージェント的法的推論フレームワークである。
論文参考訳（メタデータ） (2025-08-22T13:38:12Z)
BriefMe: A Legal NLP Benchmark for Assisting with Legal Briefs [4.501619011158408]
法務NLPで過小評価されている法的作業の核心は、法務ブリーフィングの執筆と編集である。法的なブリーフィングに焦点を当てた新しいデータセットであるBRIEFMEを紹介する。言語モデルには3つのタスクが含まれており、議論の要約、議論の完了、事例検索というブリーフを書く際に、法的専門家を支援する。
論文参考訳（メタデータ） (2025-06-07T01:33:44Z)
LEXam: Benchmarking Legal Reasoning on 340 Law Exams [61.344330783528015]
LEXamは、様々な科目と学位レベルの116の法学校コースにまたがる340の法試験から派生した、新しいベンチマークである。このデータセットは、英語とドイツ語で4,886の法試験の質問で構成されており、その中には2,841の長文のオープンエンドの質問と2,045のマルチチョイスの質問が含まれている。
論文参考訳（メタデータ） (2025-05-19T08:48:12Z)
AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文参考訳（メタデータ） (2025-02-28T19:14:48Z)
InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。 InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文参考訳（メタデータ） (2024-06-21T06:19:03Z)
DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文参考訳（メタデータ） (2024-03-27T10:40:14Z)
LLM vs. Lawyers: Identifying a Subset of Summary Judgments in a Large UK Case Law Dataset [0.0]
本研究は, 英国裁判所判決の大規模コーパスから, 判例, 判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、判例、我々は、ケンブリッジ法コーパス356,011英国の裁判所決定を用いて、大きな言語モデルは、キーワードに対して重み付けされたF1スコアが0.94対0.78であると判断する。我々は,3,102件の要約判断事例を同定し抽出し,その分布を時間的範囲の様々な英国裁判所にマップできるようにする。
論文参考訳（メタデータ） (2024-03-04T10:13:30Z)
The Ethics of Automating Legal Actors [58.81546227716182]
我々は、裁判官の役割の自動化は、特に一般的な法体系において、難しい倫理的課題を提起すると主張している。我々の主張は、単に法律を適用するのではなく、法律を積極的に形成する際の裁判官の社会的役割から従う。モデルが人間レベルの能力を達成できたとしても、法的プロセスの自動化に固有の倫理的懸念は残るだろう。
論文参考訳（メタデータ） (2023-12-01T13:48:46Z)
LeCaRDv2: A Large-Scale Chinese Legal Case Retrieval Dataset [20.315416393247247]
大規模法ケース検索データセットLeCaRDv2(バージョン2)を紹介する。 800のクエリと430万件の刑事事件文書から抽出された55,192の候補で構成されている。評価,ペナルティ,手順の3つの重要な側面を考慮し,既存の関連基準を充実させる。データセットのすべてのケースは、刑事法を専門とする複数の法律専門家によって注釈付けされています。
論文参考訳（メタデータ） (2023-10-26T17:32:55Z)
MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文参考訳（メタデータ） (2023-10-24T08:17:11Z)
Automated Argument Generation from Legal Facts [6.057773749499076]
法律体系に提出される事件の数は、ある国の法律専門家の数よりもはるかに多い。本研究では,訴訟分析の過程において,法的専門家を支援することに焦点を当てた。実験結果から,ベストパフォーマンスメソッドから生成された引数は,ベンチマークセットのゴールド標準アノテーションと平均63%の重なりを持つことがわかった。
論文参考訳（メタデータ） (2023-10-09T12:49:35Z)
Interpretable Long-Form Legal Question Answering with Retrieval-Augmented Large Language Models [10.834755282333589]
長文の法的問合せデータセットは、専門家によるフランス語の法的質問1,868件からなる。実験結果から,自動評価指標について有望な性能を示した。 LLeQAは、専門家によって注釈付けされた唯一の包括的なロングフォームLQAデータセットの1つであり、重要な現実世界の問題を解決するために研究を加速するだけでなく、特殊な領域におけるNLPモデルを評価するための厳密なベンチマークとしても機能する可能性がある。
論文参考訳（メタデータ） (2023-09-29T08:23:19Z)
SAILER: Structure-aware Pre-trained Language Model for Legal Case Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文参考訳（メタデータ） (2023-04-22T10:47:01Z)
JUSTICE: A Benchmark Dataset for Supreme Court's Judgment Prediction [0.0]
我々は、自然言語処理(NLP)研究やその他のデータ駆動アプリケーションで容易に利用できるように、SCOTUS裁判所の高品質なデータセットを作成することを目指している。先進的なNLPアルゴリズムを用いて以前の訴訟を分析することにより、訓練されたモデルは裁判所の判断を予測し、分類することができる。
論文参考訳（メタデータ） (2021-12-06T23:19:08Z)
Swiss-Judgment-Prediction: A Multilingual Legal Judgment Prediction Benchmark [4.533408938245527]
法的判断予測(LJP)データセットは、英語、フランス語、中国語でリリースされた。我々はスイス連邦最高裁判所から、多言語(ドイツ語、フランス語、イタリア語)のダイアクロニック(2000-2020)コーパス85Kの症例を公表した。我々は、BERT入力(テキスト)長制限を克服するBERTの2つの変種を含む、最先端のBERTベースの手法を評価する。
論文参考訳（メタデータ） (2021-10-02T13:50:21Z)
Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文参考訳（メタデータ） (2021-05-09T09:39:25Z)
How Does NLP Benefit Legal System: A Summary of Legal Artificial Intelligence [81.04070052740596]
法律人工知能(Legal AI)は、人工知能、特に自然言語処理の技術を適用して、法的領域におけるタスクに役立てることに焦点を当てている。本稿では,LegalAIにおける研究の歴史,現状,今後の方向性について紹介する。
論文参考訳（メタデータ） (2020-04-25T14:45:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。