論文の概要: Transformer-based Entity Legal Form Classification
- arxiv url: http://arxiv.org/abs/2310.12766v1
- Date: Thu, 19 Oct 2023 14:11:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-20 15:06:57.849075
- Title: Transformer-based Entity Legal Form Classification
- Title(参考訳): トランスフォーマーに基づくエンティティ法定形式分類
- Authors: Alexander Arimond and Mauro Molteni and Dominik Jany and Zornitsa
Manolova and Damian Borth and Andreas G.F. Hoepner
- Abstract要約: 本稿では,形式分類のためのトランスフォーマーに基づく言語モデルを提案する。
BERTのバリエーションを多用し、その性能を従来の複数のベースラインと比較する。
以上の結果から,事前学習したBERT変種は従来のテキスト分類法よりもF1スコアで優れていた。
- 参考スコア(独自算出の注目度): 43.75590166844617
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We propose the application of Transformer-based language models for
classifying entity legal forms from raw legal entity names. Specifically, we
employ various BERT variants and compare their performance against multiple
traditional baselines. Our evaluation encompasses a substantial subset of
freely available Legal Entity Identifier (LEI) data, comprising over 1.1
million legal entities from 30 different legal jurisdictions. The ground truth
labels for classification per jurisdiction are taken from the Entity Legal Form
(ELF) code standard (ISO 20275). Our findings demonstrate that pre-trained BERT
variants outperform traditional text classification approaches in terms of F1
score, while also performing comparably well in the Macro F1 Score. Moreover,
the validity of our proposal is supported by the outcome of third-party expert
reviews conducted in ten selected jurisdictions. This study highlights the
significant potential of Transformer-based models in advancing data
standardization and data integration. The presented approaches can greatly
benefit financial institutions, corporations, governments and other
organizations in assessing business relationships, understanding risk exposure,
and promoting effective governance.
- Abstract(参考訳): 本稿では,トランスフォーマーに基づく言語モデルを用いて,生の法人名からエンティティの法的形態を分類する手法を提案する。
具体的には,様々なBERTの変種を用いて,その性能を従来の複数のベースラインと比較する。
我々の評価は、30の異なる司法管轄区域から1100万以上の法的機関からなる、自由に利用可能な法定エンティティ識別(LEI)データのかなりのサブセットを含んでいる。
管轄区域ごとの分類のための根拠となる真理ラベルは、エンティティ法典(ELF)コード標準(ISO 20275)から取られる。
以上の結果から,事前学習したBERT変種は従来のテキスト分類法よりもF1スコアで優れており,マクロF1スコアでも高い性能を示した。
さらに, 提案の妥当性は, 選択された10の管轄区域で実施された第三者専門家レビューの結果に支えられている。
本研究は、データ標準化とデータ統合の進展におけるトランスフォーマーモデルの重要な可能性を強調している。
提示されたアプローチは、金融機関、企業、政府、その他の組織に対して、ビジネス関係の評価、リスク暴露の理解、効果的なガバナンスの促進において大きな利益をもたらす。
関連論文リスト
- The Right Model for the Job: An Evaluation of Legal Multi-Label
Classification Baselines [4.5054837824245215]
マルチラベル分類(MLC、Multi-Label Classification)は、複数のラベルを法的文書に割り当てることのできる、法的領域における一般的なタスクである。
本研究では,2つの法的データセットを用いて異なるLCC手法の評価を行う。
論文 参考訳(メタデータ) (2024-01-22T11:15:07Z) - Identification of Regulatory Requirements Relevant to Business
Processes: A Comparative Study on Generative AI, Embedding-based Ranking,
Crowd and Expert-driven Methods [10.899912290518648]
この研究は、法的およびドメインの専門家が関連する要件を評価するのにどのように役立つかを調べる。
我々は,組込み型NLPランキング法,GPT-4を用いた生成AI法,クラウドソーシング手法を,専門家によるラベル作成の純粋手作業手法と比較した。
BPMN2.0プロセスの両方に対してゴールドスタンダードが作成され、複数の規制文書から現実の要求にマッチします。
論文 参考訳(メタデータ) (2024-01-02T12:08:31Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model
Collaboration [52.57055162778548]
法的判断予測(LJP)は、法律AIにおいてますます重要な課題となっている。
先行は、同様の事実を持つ以前の訴訟であり、国家法制度におけるその後の事件の判断の基礎となっている。
近年のディープラーニングの進歩により、LJPタスクの解決に様々なテクニックが使えるようになった。
論文 参考訳(メタデータ) (2023-10-13T16:47:20Z) - Unlocking Practical Applications in Legal Domain: Evaluation of GPT for
Zero-Shot Semantic Annotation of Legal Texts [0.0]
我々は、短いテキストスニペットのセマンティックアノテーションを実行するための、最先端の生成事前学習トランスフォーマ(GPT)モデルの有効性を評価する。
その結果、GPTモデルは様々な種類の文書のゼロショット設定において驚くほどよく機能することがわかった。
論文 参考訳(メタデータ) (2023-05-08T01:55:53Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Zero Shot Transfer of Legal Judgement Prediction as Article-aware
Entailment for the European Court of Human Rights [1.4072904523937537]
欧州人権裁判所の文書から法定判決予測を提出した。
この構成は、記事テキストを特定の事実テキストにマッピングする際の、モデル学習の法的推論能力を促進する。
ゼロショット LJP 実験を考案し,ドメイン判別器とワッサーシュタイン距離に基づく領域適応法を適用した。
論文 参考訳(メタデータ) (2023-02-01T17:20:52Z) - Flexible categorization for auditing using formal concept analysis and
Dempster-Shafer theory [55.878249096379804]
我々は、異なる金融口座に対する異なる利息の程度に応じて分類する様々な方法を研究する。
本稿で開発したフレームワークは,説明可能な分類の獲得と研究のための公式な基盤を提供する。
論文 参考訳(メタデータ) (2022-10-31T13:49:16Z) - Analysing similarities between legal court documents using natural
language processing approaches based on Transformers [0.0]
本研究の目的は、推論グループで達成できる司法文書間の類似度を検出することである。
ブラジルの司法制度における法的手続のケーススタディに、トランスフォーマーアーキテクチャに基づく6つのNLP技術を適用している。
論文 参考訳(メタデータ) (2022-04-14T18:25:56Z) - Equality before the Law: Legal Judgment Consistency Analysis for
Fairness [55.91612739713396]
本論文では,LInCo(Legal Inconsistency Coefficient)の判定不整合性評価指標を提案する。
法的な判断予測(LJP)モデルを用いて異なる集団の裁判官をシミュレートし、異なる集団で訓練されたLJPモデルによる判断結果の不一致を判断する。
私達はLInCoを実際の場合の不一致を探検するために使用し、次の観察に来ます:(1)地域およびジェンダーの不一致は法制度でありますが、ジェンダーの不一致は地方不一致より大いにより少しです。
論文 参考訳(メタデータ) (2021-03-25T14:28:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。