論文の概要: Analysing similarities between legal court documents using natural
language processing approaches based on Transformers
- arxiv url: http://arxiv.org/abs/2204.07182v3
- Date: Thu, 11 May 2023 08:33:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-12 19:05:42.291841
- Title: Analysing similarities between legal court documents using natural
language processing approaches based on Transformers
- Title(参考訳): トランスフォーマーに基づく自然言語処理手法による訴訟書類間の類似性の分析
- Authors: Raphael Souza de Oliveira and Erick Giovani Sperandio Nascimento
- Abstract要約: 本研究の目的は、推論グループで達成できる司法文書間の類似度を検出することである。
ブラジルの司法制度における法的手続のケーススタディに、トランスフォーマーアーキテクチャに基づく6つのNLP技術を適用している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advances in Artificial Intelligence (AI) have leveraged promising
results in solving complex problems in the area of Natural Language Processing
(NLP), being an important tool to help in the expeditious resolution of
judicial proceedings in the legal area. In this context, this work targets the
problem of detecting the degree of similarity between judicial documents that
can be achieved in the inference group, by applying six NLP techniques based on
the transformers architecture to a case study of legal proceedings in the
Brazilian judicial system. The NLP transformer-based models, namely BERT, GPT-2
and RoBERTa, were pre-trained using a general purpose corpora of the Brazilian
Portuguese language, and then were fine-tuned and specialised for the legal
sector using 210,000 legal proceedings. Vector representations of each legal
document were calculated based on their embeddings, which were used to cluster
the lawsuits, calculating the quality of each model based on the cosine of the
distance between the elements of the group to its centroid. We noticed that
models based on transformers presented better performance when compared to
previous traditional NLP techniques, with the RoBERTa model specialised for the
Brazilian Portuguese language presenting the best results. This methodology can
be also applied to other case studies for different languages, making it
possible to advance in the current state of the art in the area of NLP applied
to the legal sector.
- Abstract(参考訳): 最近の人工知能(ai)の進歩は、自然言語処理(nlp)領域における複雑な問題を解決するために有望な結果を活用し、法的領域における司法手続の迅速な解決に役立つ重要なツールとなっている。
本研究は,ブラジルの司法制度における法的手続のケーススタディに,トランスフォーマーアーキテクチャに基づく6つのNLP技術を適用することにより,推論グループで達成可能な司法文書間の類似度を検出することを目的とする。
nlpトランスフォーマーのモデル(bert、gpt-2、roberta)はブラジルのポルトガル語の汎用コーパスを使用して事前訓練され、その後210,000の法的手続きを用いて法的な部門向けに微調整され、専門化された。
各法的文書のベクトル表現は、その埋め込みに基づいて計算され、訴訟の集団化に用いられ、集団の要素と遠心部との間の距離のコサインに基づいて各モデルの質を計算した。
我々は、トランスフォーマーに基づくモデルは従来のnlp技術よりも優れた性能を示し、ブラジルポルトガル語に特化したロバータモデルは最高の結果を示していることに気付いた。
この手法は、異なる言語に対する他のケーススタディにも適用可能であり、法律分野に適用されたNLPの領域における最先端の技術の進歩を可能にする。
関連論文リスト
- Natural Language Processing for the Legal Domain: A Survey of Tasks, Datasets, Models, and Challenges [4.548047308860141]
自然言語処理は、法律専門家や法務担当者の法務分野における活動の仕方に革命をもたらしている。
本調査では,手動フィルタリング後の127項目を最終選択として,システムレビューとメタアナライズフレームワークの優先報告項目に従って,148の研究をレビューした。
法律分野における自然言語処理に関する基礎概念を探求する。
論文 参考訳(メタデータ) (2024-10-25T01:17:02Z) - LawLLM: Law Large Language Model for the US Legal System [43.13850456765944]
我々は,米国法域に特化して設計されたマルチタスクモデルであるLawLLM(Law Large Language Model)を紹介する。
類似症例検索(SCR)、PCR(Precedent Case Recommendation)、LJP(Lawal Judgment Prediction)においてLawLLMが優れている
そこで本研究では,各タスクに対して,生の法定データをトレーニング可能な形式に変換する,カスタマイズされたデータ前処理手法を提案する。
論文 参考訳(メタデータ) (2024-07-27T21:51:30Z) - InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。
われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。
InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文 参考訳(メタデータ) (2024-06-21T06:19:03Z) - Empowering Prior to Court Legal Analysis: A Transparent and Accessible Dataset for Defensive Statement Classification and Interpretation [5.646219481667151]
本稿では,裁判所の手続きに先立って,警察の面接中に作成された文の分類に適した新しいデータセットを提案する。
本稿では,直感的文と真偽を区別し,最先端のパフォーマンスを実現するための微調整DistilBERTモデルを提案する。
我々はまた、法律専門家と非専門主義者の両方がシステムと対話し、利益を得ることを可能にするXAIインターフェースも提示する。
論文 参考訳(メタデータ) (2024-05-17T11:22:27Z) - Towards A Structured Overview of Use Cases for Natural Language Processing in the Legal Domain: A German Perspective [43.662441393491584]
近年、自然言語処理(NLP)と法学の分野が合わさって法プロセスのデジタル化が進んでいるため、法務技術の分野が盛んになっている。
本研究は,NLP文学を基盤として,ドイツにおける法律実務の声を補足した法律技術事例の構造化された概要を構築することを目的としている。
論文 参考訳(メタデータ) (2024-04-29T14:56:47Z) - Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model
Collaboration [52.57055162778548]
法的判断予測(LJP)は、法律AIにおいてますます重要な課題となっている。
先行は、同様の事実を持つ以前の訴訟であり、国家法制度におけるその後の事件の判断の基礎となっている。
近年のディープラーニングの進歩により、LJPタスクの解決に様々なテクニックが使えるようになった。
論文 参考訳(メタデータ) (2023-10-13T16:47:20Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Application of Transformers based methods in Electronic Medical Records:
A Systematic Literature Review [77.34726150561087]
本研究は,異なるNLPタスクにおける電子カルテ(EMR)のトランスフォーマーに基づく手法を用いて,最先端技術に関する体系的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-04-05T22:19:42Z) - An Uncommon Task: Participatory Design in Legal AI [64.54460979588075]
われわれは10年以上前に行われた法律分野における、注目に値する、未調査のAI設計プロセスについて検討する。
インタラクティブなシミュレーション手法によって,コンピュータ科学者と弁護士が共同設計者になれることを示す。
論文 参考訳(メタデータ) (2022-03-08T15:46:52Z) - Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。
判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文 参考訳(メタデータ) (2021-05-09T09:39:25Z) - Predicting Legal Proceedings Status: Approaches Based on Sequential Text
Data [0.0]
本稿では,ブラジルの法的手続を3段階に分類する予測モデルを開発する。
自然言語処理(NLP)と機械学習技術を組み合わせて問題解決を行った。
我々のアプローチは最大精度.93、最高スコアは.89(マクロ)と.93(重み)を達成した。
論文 参考訳(メタデータ) (2020-03-13T19:40:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。