論文の概要: Unlocking Legal Knowledge: A Multilingual Dataset for Judicial Summarization in Switzerland
- arxiv url: http://arxiv.org/abs/2410.13456v1
- Date: Thu, 17 Oct 2024 11:34:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-18 13:22:36.310998
- Title: Unlocking Legal Knowledge: A Multilingual Dataset for Judicial Summarization in Switzerland
- Title(参考訳): 法的知識のアンロック:スイスにおける司法要約のための多言語データセット
- Authors: Luca Rolshoven, Vishvaksenan Rasiah, Srinanda Brügger Bose, Matthias Stürmer, Joel Niklaus,
- Abstract要約: ヘッドノートの自動作成は、スイスだけで何十万もの意思決定を、より容易に行えるものにする可能性がある。
これを開始するために、スイスリード決定要約データセットを紹介します。
この言語横断的な資料にはドイツ語、フランス語、イタリア語の18K裁判所判決とドイツ語の見出しが記載されている。
我々の分析では、プロプライエタリなモデルはゼロショットとワンショット設定でよく機能するが、微調整された小さなモデルは依然として強力な競争力を持つ。
- 参考スコア(独自算出の注目度): 3.9716689953391904
- License:
- Abstract: Legal research is a time-consuming task that most lawyers face on a daily basis. A large part of legal research entails looking up relevant caselaw and bringing it in relation to the case at hand. Lawyers heavily rely on summaries (also called headnotes) to find the right cases quickly. However, not all decisions are annotated with headnotes and writing them is time-consuming. Automated headnote creation has the potential to make hundreds of thousands of decisions more accessible for legal research in Switzerland alone. To kickstart this, we introduce the Swiss Leading Decision Summarization ( SLDS) dataset, a novel cross-lingual resource featuring 18K court rulings from the Swiss Federal Supreme Court (SFSC), in German, French, and Italian, along with German headnotes. We fine-tune and evaluate three mT5 variants, along with proprietary models. Our analysis highlights that while proprietary models perform well in zero-shot and one-shot settings, fine-tuned smaller models still provide a strong competitive edge. We publicly release the dataset to facilitate further research in multilingual legal summarization and the development of assistive technologies for legal professionals
- Abstract(参考訳): 法律研究は、ほとんどの弁護士が日々直面する時間を要する課題である。
法的な研究の大部分は、関連する訴訟を調査し、その事件を手元に持ってくることである。
弁護士は、適切なケースを素早く見つけるために、要約(見出しとも呼ばれる)に強く依存する。
しかし、すべての決定が見出しで注釈付けされ、それらを書くのに時間がかかります。
ヘッドノートの自動作成は、スイスだけで何十万もの意思決定を、より容易に行えるものにする可能性がある。
これを開始するために、スイス連邦最高裁判所(SFSC)による18K裁判所判決と、ドイツ語、フランス語、イタリア語の見出しを含む新たな言語間リソースであるSwiss Leading Decision Summarization(SLDS)データセットを紹介した。
プロプライエタリモデルとともに、3つのmT5変種を微調整し評価する。
我々の分析では、プロプライエタリなモデルはゼロショットとワンショット設定でよく機能するが、微調整された小さなモデルは依然として強力な競争力を持つ。
我々は、多言語法的要約のさらなる研究を促進するためのデータセットを公開し、法律専門家のための補助技術の開発を行っている。
関連論文リスト
- InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。
われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。
InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文 参考訳(メタデータ) (2024-06-21T06:19:03Z) - LLM vs. Lawyers: Identifying a Subset of Summary Judgments in a Large UK
Case Law Dataset [0.0]
本研究は, 英国裁判所判決の大規模コーパスから, 判例, 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、
我々は、ケンブリッジ法コーパス356,011英国の裁判所決定を用いて、大きな言語モデルは、キーワードに対して重み付けされたF1スコアが0.94対0.78であると判断する。
我々は,3,102件の要約判断事例を同定し抽出し,その分布を時間的範囲の様々な英国裁判所にマップできるようにする。
論文 参考訳(メタデータ) (2024-03-04T10:13:30Z) - The Ethics of Automating Legal Actors [58.81546227716182]
我々は、裁判官の役割の自動化は、特に一般的な法体系において、難しい倫理的課題を提起すると主張している。
我々の主張は、単に法律を適用するのではなく、法律を積極的に形成する際の裁判官の社会的役割から従う。
モデルが人間レベルの能力を達成できたとしても、法的プロセスの自動化に固有の倫理的懸念は残るだろう。
論文 参考訳(メタデータ) (2023-12-01T13:48:46Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Automated Argument Generation from Legal Facts [6.057773749499076]
法律体系に提出される事件の数は、ある国の法律専門家の数よりもはるかに多い。
本研究では,訴訟分析の過程において,法的専門家を支援することに焦点を当てた。
実験結果から,ベストパフォーマンスメソッドから生成された引数は,ベンチマークセットのゴールド標準アノテーションと平均63%の重なりを持つことがわかった。
論文 参考訳(メタデータ) (2023-10-09T12:49:35Z) - Interpretable Long-Form Legal Question Answering with
Retrieval-Augmented Large Language Models [10.834755282333589]
長文の法的問合せデータセットは、専門家によるフランス語の法的質問1,868件からなる。
実験結果から,自動評価指標について有望な性能を示した。
LLeQAは、専門家によって注釈付けされた唯一の包括的なロングフォームLQAデータセットの1つであり、重要な現実世界の問題を解決するために研究を加速するだけでなく、特殊な領域におけるNLPモデルを評価するための厳密なベンチマークとしても機能する可能性がある。
論文 参考訳(メタデータ) (2023-09-29T08:23:19Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - JUSTICE: A Benchmark Dataset for Supreme Court's Judgment Prediction [0.0]
我々は、自然言語処理(NLP)研究やその他のデータ駆動アプリケーションで容易に利用できるように、SCOTUS裁判所の高品質なデータセットを作成することを目指している。
先進的なNLPアルゴリズムを用いて以前の訴訟を分析することにより、訓練されたモデルは裁判所の判断を予測し、分類することができる。
論文 参考訳(メタデータ) (2021-12-06T23:19:08Z) - Swiss-Judgment-Prediction: A Multilingual Legal Judgment Prediction
Benchmark [4.533408938245527]
法的判断予測(LJP)データセットは、英語、フランス語、中国語でリリースされた。
我々はスイス連邦最高裁判所から、多言語(ドイツ語、フランス語、イタリア語)のダイアクロニック(2000-2020)コーパス85Kの症例を公表した。
我々は、BERT入力(テキスト)長制限を克服するBERTの2つの変種を含む、最先端のBERTベースの手法を評価する。
論文 参考訳(メタデータ) (2021-10-02T13:50:21Z) - Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。
判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文 参考訳(メタデータ) (2021-05-09T09:39:25Z) - How Does NLP Benefit Legal System: A Summary of Legal Artificial
Intelligence [81.04070052740596]
法律人工知能(Legal AI)は、人工知能、特に自然言語処理の技術を適用して、法的領域におけるタスクに役立てることに焦点を当てている。
本稿では,LegalAIにおける研究の歴史,現状,今後の方向性について紹介する。
論文 参考訳(メタデータ) (2020-04-25T14:45:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。