論文の概要: Transformer-based Entity Legal Form Classification
- arxiv url: http://arxiv.org/abs/2310.12766v1
- Date: Thu, 19 Oct 2023 14:11:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-20 15:06:57.849075
- Title: Transformer-based Entity Legal Form Classification
- Title(参考訳): トランスフォーマーに基づくエンティティ法定形式分類
- Authors: Alexander Arimond and Mauro Molteni and Dominik Jany and Zornitsa
Manolova and Damian Borth and Andreas G.F. Hoepner
- Abstract要約: 本稿では,形式分類のためのトランスフォーマーに基づく言語モデルを提案する。
BERTのバリエーションを多用し、その性能を従来の複数のベースラインと比較する。
以上の結果から,事前学習したBERT変種は従来のテキスト分類法よりもF1スコアで優れていた。
- 参考スコア(独自算出の注目度): 43.75590166844617
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We propose the application of Transformer-based language models for
classifying entity legal forms from raw legal entity names. Specifically, we
employ various BERT variants and compare their performance against multiple
traditional baselines. Our evaluation encompasses a substantial subset of
freely available Legal Entity Identifier (LEI) data, comprising over 1.1
million legal entities from 30 different legal jurisdictions. The ground truth
labels for classification per jurisdiction are taken from the Entity Legal Form
(ELF) code standard (ISO 20275). Our findings demonstrate that pre-trained BERT
variants outperform traditional text classification approaches in terms of F1
score, while also performing comparably well in the Macro F1 Score. Moreover,
the validity of our proposal is supported by the outcome of third-party expert
reviews conducted in ten selected jurisdictions. This study highlights the
significant potential of Transformer-based models in advancing data
standardization and data integration. The presented approaches can greatly
benefit financial institutions, corporations, governments and other
organizations in assessing business relationships, understanding risk exposure,
and promoting effective governance.
- Abstract(参考訳): 本稿では,トランスフォーマーに基づく言語モデルを用いて,生の法人名からエンティティの法的形態を分類する手法を提案する。
具体的には,様々なBERTの変種を用いて,その性能を従来の複数のベースラインと比較する。
我々の評価は、30の異なる司法管轄区域から1100万以上の法的機関からなる、自由に利用可能な法定エンティティ識別(LEI)データのかなりのサブセットを含んでいる。
管轄区域ごとの分類のための根拠となる真理ラベルは、エンティティ法典(ELF)コード標準(ISO 20275)から取られる。
以上の結果から,事前学習したBERT変種は従来のテキスト分類法よりもF1スコアで優れており,マクロF1スコアでも高い性能を示した。
さらに, 提案の妥当性は, 選択された10の管轄区域で実施された第三者専門家レビューの結果に支えられている。
本研究は、データ標準化とデータ統合の進展におけるトランスフォーマーモデルの重要な可能性を強調している。
提示されたアプローチは、金融機関、企業、政府、その他の組織に対して、ビジネス関係の評価、リスク暴露の理解、効果的なガバナンスの促進において大きな利益をもたらす。
関連論文リスト
- Improving Legal Entity Recognition Using a Hybrid Transformer Model and Semantic Filtering Approach [0.0]
本稿では,法律テキスト処理用に微調整された変圧器モデルであるLegal-BERTの精度と精度を向上させる新しいハイブリッドモデルを提案する。
15,000の注釈付き法律文書のデータセット上で、F1スコア93.4%を達成し、従来の手法よりも精度とリコールが大幅に向上したことを示す。
論文 参考訳(メタデータ) (2024-10-11T04:51:28Z) - LegalPro-BERT: Classification of Legal Provisions by fine-tuning BERT Large Language Model [0.0]
契約分析は、合意の範囲内で重要な規定及び段落の識別及び分類を必要とする。
LegalPro-BERTはBERTトランスフォーマーアーキテクチャモデルであり、法定条項の分類処理を効率的に行うために微調整を行う。
論文 参考訳(メタデータ) (2024-04-15T19:08:48Z) - Query-driven Relevant Paragraph Extraction from Legal Judgments [1.2562034805037443]
法律専門家は、クエリに直接対処する情報をピンポイントするために、長い法的判断をナビゲートすることに悩まされることが多い。
本稿では,クエリに基づく法的判断から関連する段落を抽出する作業に焦点をあてる。
本稿では,欧州人権裁判所(ECtHR)のケース・ロー・ガイドを用いて,この課題のための特別なデータセットを構築した。
論文 参考訳(メタデータ) (2024-03-31T08:03:39Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - The Right Model for the Job: An Evaluation of Legal Multi-Label
Classification Baselines [4.5054837824245215]
マルチラベル分類(MLC、Multi-Label Classification)は、複数のラベルを法的文書に割り当てることのできる、法的領域における一般的なタスクである。
本研究では,2つの法的データセットを用いて異なるLCC手法の評価を行う。
論文 参考訳(メタデータ) (2024-01-22T11:15:07Z) - Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model
Collaboration [52.57055162778548]
法的判断予測(LJP)は、法律AIにおいてますます重要な課題となっている。
先行は、同様の事実を持つ以前の訴訟であり、国家法制度におけるその後の事件の判断の基礎となっている。
近年のディープラーニングの進歩により、LJPタスクの解決に様々なテクニックが使えるようになった。
論文 参考訳(メタデータ) (2023-10-13T16:47:20Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Flexible categorization for auditing using formal concept analysis and
Dempster-Shafer theory [55.878249096379804]
我々は、異なる金融口座に対する異なる利息の程度に応じて分類する様々な方法を研究する。
本稿で開発したフレームワークは,説明可能な分類の獲得と研究のための公式な基盤を提供する。
論文 参考訳(メタデータ) (2022-10-31T13:49:16Z) - Analysing similarities between legal court documents using natural
language processing approaches based on Transformers [0.0]
本研究の目的は、推論グループで達成できる司法文書間の類似度を検出することである。
ブラジルの司法制度における法的手続のケーススタディに、トランスフォーマーアーキテクチャに基づく6つのNLP技術を適用している。
論文 参考訳(メタデータ) (2022-04-14T18:25:56Z) - Equality before the Law: Legal Judgment Consistency Analysis for
Fairness [55.91612739713396]
本論文では,LInCo(Legal Inconsistency Coefficient)の判定不整合性評価指標を提案する。
法的な判断予測(LJP)モデルを用いて異なる集団の裁判官をシミュレートし、異なる集団で訓練されたLJPモデルによる判断結果の不一致を判断する。
私達はLInCoを実際の場合の不一致を探検するために使用し、次の観察に来ます:(1)地域およびジェンダーの不一致は法制度でありますが、ジェンダーの不一致は地方不一致より大いにより少しです。
論文 参考訳(メタデータ) (2021-03-25T14:28:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。