論文の概要: Swiss-Judgment-Prediction: A Multilingual Legal Judgment Prediction
Benchmark
- arxiv url: http://arxiv.org/abs/2110.00806v1
- Date: Sat, 2 Oct 2021 13:50:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-06 12:45:53.640717
- Title: Swiss-Judgment-Prediction: A Multilingual Legal Judgment Prediction
Benchmark
- Title(参考訳): Swiss-Judgment-Prediction: 多言語法的判断予測ベンチマーク
- Authors: Joel Niklaus, Ilias Chalkidis, Matthias St\"urmer
- Abstract要約: 法的判断予測(LJP)データセットは、英語、フランス語、中国語でリリースされた。
我々はスイス連邦最高裁判所から、多言語(ドイツ語、フランス語、イタリア語)のダイアクロニック(2000-2020)コーパス85Kの症例を公表した。
我々は、BERT入力(テキスト)長制限を克服するBERTの2つの変種を含む、最先端のBERTベースの手法を評価する。
- 参考スコア(独自算出の注目度): 4.533408938245527
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many jurisdictions, the excessive workload of courts leads to high delays.
Suitable predictive AI models can assist legal professionals in their work, and
thus enhance and speed up the process. So far, Legal Judgment Prediction (LJP)
datasets have been released in English, French, and Chinese. We publicly
release a multilingual (German, French, and Italian), diachronic (2000-2020)
corpus of 85K cases from the Federal Supreme Court of Switzerland (FSCS). We
evaluate state-of-the-art BERT-based methods including two variants of BERT
that overcome the BERT input (text) length limitation (up to 512 tokens).
Hierarchical BERT has the best performance (approx. 68-70% Macro-F1-Score in
German and French). Furthermore, we study how several factors (canton of
origin, year of publication, text length, legal area) affect performance. We
release both the benchmark dataset and our code to accelerate future research
and ensure reproducibility.
- Abstract(参考訳): 多くの管轄区域において、裁判所の過度な労働負荷は高い遅延をもたらす。
適切な予測AIモデルは、法律専門家の作業を支援することで、プロセスの強化と高速化を可能にする。
これまでのところ、法律判断予測(ljp)データセットは英語、フランス語、中国語でリリースされている。
我々は、スイス連邦最高裁判所(fscs)の85k件からなる多言語(ドイツ語、フランス語、イタリア語)のコーパス(2000-2020)を公開する。
BERT入力(テキスト)長制限(最大512トークン)を克服するBERTの2つの変種を含む、最先端のBERTベースの手法を評価する。
階層BERTは最高のパフォーマンス(ドイツ語とフランス語で約68-70%のマクロF1スコア)を持つ。
さらに,いくつかの要因 (原産地, 出版年, テキスト長, 法領域) が業績に与える影響について検討した。
ベンチマークデータセットとコードの両方をリリースし、将来の研究を加速し、再現性を確保します。
関連論文リスト
- Unlocking Legal Knowledge: A Multilingual Dataset for Judicial Summarization in Switzerland [3.9716689953391904]
ヘッドノートの自動作成は、スイスだけで何十万もの意思決定を、より容易に行えるものにする可能性がある。
これを開始するために、スイスリード決定要約データセットを紹介します。
この言語横断的な資料にはドイツ語、フランス語、イタリア語の18K裁判所判決とドイツ語の見出しが記載されている。
我々の分析では、プロプライエタリなモデルはゼロショットとワンショット設定でよく機能するが、微調整された小さなモデルは依然として強力な競争力を持つ。
論文 参考訳(メタデータ) (2024-10-17T11:34:07Z) - Multilingual Contrastive Decoding via Language-Agnostic Layers Skipping [60.458273797431836]
対照的なレイヤ(DoLa)によるデコーディングは、大規模言語モデルの生成品質を改善するために設計されている。
このアプローチは英語以外のタスクではうまくいきません。
モデルの前方通過における言語遷移に関する従来の解釈可能性の研究から着想を得て,改良されたコントラスト復号アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-15T15:14:01Z) - LLM vs. Lawyers: Identifying a Subset of Summary Judgments in a Large UK
Case Law Dataset [0.0]
本研究は, 英国裁判所判決の大規模コーパスから, 判例, 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、
我々は、ケンブリッジ法コーパス356,011英国の裁判所決定を用いて、大きな言語モデルは、キーワードに対して重み付けされたF1スコアが0.94対0.78であると判断する。
我々は,3,102件の要約判断事例を同定し抽出し,その分布を時間的範囲の様々な英国裁判所にマップできるようにする。
論文 参考訳(メタデータ) (2024-03-04T10:13:30Z) - Automated Argument Generation from Legal Facts [6.057773749499076]
法律体系に提出される事件の数は、ある国の法律専門家の数よりもはるかに多い。
本研究では,訴訟分析の過程において,法的専門家を支援することに焦点を当てた。
実験結果から,ベストパフォーマンスメソッドから生成された引数は,ベンチマークセットのゴールド標準アノテーションと平均63%の重なりを持つことがわかった。
論文 参考訳(メタデータ) (2023-10-09T12:49:35Z) - ALJP: An Arabic Legal Judgment Prediction in Personal Status Cases Using
Machine Learning Models [0.2678472239880052]
本研究では,ディープラーニング(DL)と自然言語処理(NLP)技術を用いて,アラビア語のケーススクリプトから判定結果を予測するシステムを開発した。
TF-IDFや word2vec などの表現技術を用いて,サポートベクトルマシン(SVM),ロジスティック回帰(LR),長短短期記憶(LSTM),双方向長短期記憶(BiLSTM)などの異なる機械学習モデルを用いる。
論文 参考訳(メタデータ) (2023-09-01T04:08:45Z) - NAVER LABS Europe's Multilingual Speech Translation Systems for the
IWSLT 2023 Low-Resource Track [78.80683163990446]
本稿では,IWSLT 2023low-Resource trackにおけるタマシェク・フレンチ・ケチュア・スペイン語音声翻訳のためのNAVER LABS Europeのシステムについて述べる。
本研究は,多言語パラメータ効率ソリューションを用いた低リソース環境における翻訳品質の最大化を試みる。
論文 参考訳(メタデータ) (2023-06-13T13:22:30Z) - Strategies for improving low resource speech to text translation relying
on pre-trained ASR models [59.90106959717875]
本稿では,テキスト翻訳(ST)における低音源音声の性能向上のための技術と知見について述べる。
本研究は,英語とポルトガル語,タマシェク語とフランス語の2つの言語対について,シミュレーションおよび実低資源設定について実験を行った。
論文 参考訳(メタデータ) (2023-05-31T21:58:07Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - JUSTICE: A Benchmark Dataset for Supreme Court's Judgment Prediction [0.0]
我々は、自然言語処理(NLP)研究やその他のデータ駆動アプリケーションで容易に利用できるように、SCOTUS裁判所の高品質なデータセットを作成することを目指している。
先進的なNLPアルゴリズムを用いて以前の訴訟を分析することにより、訓練されたモデルは裁判所の判断を予測し、分類することができる。
論文 参考訳(メタデータ) (2021-12-06T23:19:08Z) - Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。
判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文 参考訳(メタデータ) (2021-05-09T09:39:25Z) - A Study of Cross-Lingual Ability and Language-specific Information in
Multilingual BERT [60.9051207862378]
Multilingual BERTは、言語間転送タスクで驚くほどうまく機能します。
データサイズとコンテキストウィンドウサイズは、転送可能性にとって重要な要素です。
多言語BERTの言語間能力を改善するために、計算的に安価だが効果的なアプローチがある。
論文 参考訳(メタデータ) (2020-04-20T11:13:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。