論文の概要: An Empirical Study on Cross-X Transfer for Legal Judgment Prediction
- arxiv url: http://arxiv.org/abs/2209.12325v1
- Date: Sun, 25 Sep 2022 21:41:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 14:00:43.236888
- Title: An Empirical Study on Cross-X Transfer for Legal Judgment Prediction
- Title(参考訳): 法的判断予測のためのクロスx転送に関する実証的研究
- Authors: Joel Niklaus, Matthias St\"urmer, Ilias Chalkidis
- Abstract要約: 言語間移動学習は、様々な自然言語処理(NLP)タスクにおいて有用であることが証明されているが、法的にNLPの文脈で検討されている。
トリリンガルスイス・ジャッジメント・プレディション・データセットを用いた法定判断予測(LJP)における伝達学習手法について検討する。
言語間移動は、特にアダプタベースの微調整を使用する場合、言語間の全体的な結果を改善する。
- 参考スコア(独自算出の注目度): 9.019550105570957
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cross-lingual transfer learning has proven useful in a variety of Natural
Language Processing (NLP) tasks, but it is understudied in the context of legal
NLP, and not at all in Legal Judgment Prediction (LJP). We explore transfer
learning techniques on LJP using the trilingual Swiss-Judgment-Prediction
dataset, including cases written in three languages. We find that cross-lingual
transfer improves the overall results across languages, especially when we use
adapter-based fine-tuning. Finally, we further improve the model's performance
by augmenting the training dataset with machine-translated versions of the
original documents, using a 3x larger training corpus. Further on, we perform
an analysis exploring the effect of cross-domain and cross-regional transfer,
i.e., train a model across domains (legal areas), or regions. We find that in
both settings (legal areas, origin regions), models trained across all groups
perform overall better, while they also have improved results in the worst-case
scenarios. Finally, we report improved results when we ambitiously apply
cross-jurisdiction transfer, where we further augment our dataset with Indian
legal cases.
- Abstract(参考訳): 言語間移動学習は、様々な自然言語処理(NLP)タスクにおいて有用であることが証明されているが、法的なNLPの文脈では研究されていない。
3つの言語で書かれた事例を含む3言語からなるスイス・ジャッジメント・プレディションデータセットを用いて,LJP上の移動学習手法を検討する。
言語間移動は、特にアダプタベースの微調整を使用する場合、言語間の全体的な結果を改善する。
最後に、3倍の大きなトレーニングコーパスを用いて、トレーニングデータセットを原文書の機械翻訳バージョンで拡張することにより、モデルの性能をさらに向上する。
さらに、クロスドメインとクロスリージョントランスファーの効果、すなわち、ドメイン(法的領域)またはリージョン間でモデルをトレーニングすることについて分析を行う。
両方の設定(法域、起源領域)において、すべてのグループでトレーニングされたモデルは全体的なパフォーマンスが良く、最悪のシナリオでは結果も改善されていることが分かりました。
最後に,インドにおける判例のデータセットをさらに強化するクロス・ジャリッディション・トランスファーを野心的に適用した際の改善結果を報告する。
関連論文リスト
- Analysing Cross-Lingual Transfer in Low-Resourced African Named Entity
Recognition [0.10641561702689348]
低リソース言語10言語間の言語間移動学習の特性について検討する。
一つの言語でうまく機能するモデルは、他の言語への一般化を犠牲にして、しばしばそうする。
ソースとターゲットデータセット間で重複するデータの量は、言語間の地理的あるいは遺伝的距離よりも、転送性能の予測器として優れている。
論文 参考訳(メタデータ) (2023-09-11T08:56:47Z) - Optimal Transport Posterior Alignment for Cross-lingual Semantic Parsing [68.47787275021567]
言語間のセマンティックパーシングは、高いソース言語(例えば英語)から少ないトレーニングデータを持つ低リソース言語へのパーシング能力を伝達する。
そこで本稿では,最適輸送を用いた係り受け変数間の言語間相違を明示的に最小化することで,言語間セマンティック解析のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-09T04:52:31Z) - BUFFET: Benchmarking Large Language Models for Few-shot Cross-lingual
Transfer [81.5984433881309]
本稿では,54言語にまたがる15のタスクをシーケンス・ツー・シーケンス・フォーマットで統一するBUFFETを紹介する。
BUFFETは、数発の言語間移動のための厳密で公平な評価フレームワークを確立するように設計されている。
コンテクスト内言語間移動における改善の余地は極めて大きいことが判明した。
論文 参考訳(メタデータ) (2023-05-24T08:06:33Z) - Understanding Translationese in Cross-Lingual Summarization [106.69566000567598]
言語間要約(MS)は、異なる対象言語で簡潔な要約を生成することを目的としている。
大規模なCLSデータを集めるために、既存のデータセットは通常、それらの生成に翻訳を伴います。
本稿では、まず、CLSデータセット構築の異なるアプローチが、異なるレベルの翻訳に結びつくことを確認する。
論文 参考訳(メタデータ) (2022-12-14T13:41:49Z) - Characterization of effects of transfer learning across domains and
languages [0.0]
事前学習されたニューラルネットワークモデルからのトランスファーラーニング(TL)は、長年にわたって強力なテクニックとして現れてきた。
本研究では,TLが3つの自然言語処理(NLP)タスクに対して,一般的な事前学習モデルの性能にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2022-10-03T17:17:07Z) - CONCRETE: Improving Cross-lingual Fact-checking with Cross-lingual
Retrieval [73.48591773882052]
ほとんどのファクトチェックアプローチは、他の言語におけるデータ不足の問題にのみ英語に焦点を当てている。
クロスリンガル検索を付加した最初のファクトチェックフレームワークを提案する。
提案したクロスリンガル逆クローズタスク(XICT)を用いてレトリバーを訓練する。
論文 参考訳(メタデータ) (2022-09-05T17:36:14Z) - Lex Rosetta: Transfer of Predictive Models Across Languages,
Jurisdictions, and Legal Domains [40.58709137006848]
言語間で転送可能なGRU(Gated Recurrent Units)を用いたシーケンスラベリングモデルにおけるLanguage-Agnostic Sentence Representationsの使用を分析する。
トレーニング対象のコンテキストを超えて,モデルが一般化されることが分かりました。
複数のコンテキストでモデルをトレーニングすることで、ロバスト性が向上し、これまで見つからなかったコンテキストで評価する際の全体的なパフォーマンスが向上することがわかった。
論文 参考訳(メタデータ) (2021-12-15T04:53:13Z) - From Zero to Hero: On the Limitations of Zero-Shot Cross-Lingual
Transfer with Multilingual Transformers [62.637055980148816]
言語モデリングの目的によって事前訓練された多言語トランスフォーマーは、NLPの事実上のデフォルト転送パラダイムとなっている。
膨大な多言語変換器による言語間変換は,リソースリーンシナリオや遠方言語では著しく効果が低いことを示す。
論文 参考訳(メタデータ) (2020-05-01T22:04:58Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。