論文の概要: Brazilian Court Documents Clustered by Similarity Together Using Natural
Language Processing Approaches with Transformers
- arxiv url: http://arxiv.org/abs/2204.07182v1
- Date: Thu, 14 Apr 2022 18:25:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-18 14:44:54.856396
- Title: Brazilian Court Documents Clustered by Similarity Together Using Natural
Language Processing Approaches with Transformers
- Title(参考訳): トランスフォーマーを用いた自然言語処理アプローチによる類似性によって集約されたブラジルの裁判所文書
- Authors: Raphael Souza de Oliveira and Erick Giovani Sperandio Nascimento
- Abstract要約: 本研究の目的は、推論グループで達成できる司法文書間の類似度を検出することである。
ブラジルポルトガル語で事前訓練されたBERT、GPT-2、RoBERTaの変圧器に基づく6つのNLP技術を適用している。
教師なし学習は、集団の要素と中心体の間の距離のコサインに基づいて、モデルの質を計算し、訴訟をクラスタリングするために使用された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advances in Artificial intelligence (AI) have leveraged promising
results in solving complex problems in the area of Natural Language Processing
(NLP), being an important tool to help in the expeditious resolution of
judicial proceedings in the legal area. In this context, this work targets the
problem of detecting the degree of similarity between judicial documents that
can be achieved in the inference group, by applying six NLP techniques based on
transformers, namely BERT, GPT-2 and RoBERTa pre-trained in the Brazilian
Portuguese language and the same specialized using 210,000 legal proceedings.
Documents were pre-processed and had their content transformed into a vector
representation using these NLP techniques. Unsupervised learning was used to
cluster the lawsuits, calculating the quality of the model based on the cosine
of the distance between the elements of the group to its centroid. We noticed
that models based on transformers present better performance when compared to
previous research, highlighting the RoBERTa model specialized in the Brazilian
Portuguese language, making it possible to advance in the current state of the
art in the area of NLP applied to the legal sector.
- Abstract(参考訳): 最近の人工知能(ai)の進歩は、自然言語処理(nlp)領域における複雑な問題を解決するために有望な結果を活用し、法的領域における司法手続の迅速な解決に役立つ重要なツールとなっている。
この文脈では、ブラジルポルトガル語で事前訓練されたBERT、GPT-2、RoBERTaという変圧器をベースとした6つのNLP技術を適用することにより、推論グループで達成できる司法文書間の類似度を検出する問題と、21万件の訴訟手続を専門とする。
文書は前処理され、その内容はこれらのNLP技術を用いてベクトル表現に変換された。
教師なし学習は、集団の要素と中心体の間の距離のコサインに基づいてモデルの品質を計算し、訴訟をクラスタリングするために使用された。
トランスフォーマに基づくモデルは,ブラジルポルトガル語を専門とするロベルタモデルに注目し,法学分野に適用されるnlpの領域における現在の技術の発展を可能にした。
関連論文リスト
- Natural Language Processing for the Legal Domain: A Survey of Tasks, Datasets, Models, and Challenges [4.548047308860141]
自然言語処理は、法律専門家や法務担当者の法務分野における活動の仕方に革命をもたらしている。
本調査では,手動フィルタリング後の127項目を最終選択として,システムレビューとメタアナライズフレームワークの優先報告項目に従って,148の研究をレビューした。
法律分野における自然言語処理に関する基礎概念を探求する。
論文 参考訳(メタデータ) (2024-10-25T01:17:02Z) - LawLLM: Law Large Language Model for the US Legal System [43.13850456765944]
我々は,米国法域に特化して設計されたマルチタスクモデルであるLawLLM(Law Large Language Model)を紹介する。
類似症例検索(SCR)、PCR(Precedent Case Recommendation)、LJP(Lawal Judgment Prediction)においてLawLLMが優れている
そこで本研究では,各タスクに対して,生の法定データをトレーニング可能な形式に変換する,カスタマイズされたデータ前処理手法を提案する。
論文 参考訳(メタデータ) (2024-07-27T21:51:30Z) - InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。
われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。
InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文 参考訳(メタデータ) (2024-06-21T06:19:03Z) - Empowering Prior to Court Legal Analysis: A Transparent and Accessible Dataset for Defensive Statement Classification and Interpretation [5.646219481667151]
本稿では,裁判所の手続きに先立って,警察の面接中に作成された文の分類に適した新しいデータセットを提案する。
本稿では,直感的文と真偽を区別し,最先端のパフォーマンスを実現するための微調整DistilBERTモデルを提案する。
我々はまた、法律専門家と非専門主義者の両方がシステムと対話し、利益を得ることを可能にするXAIインターフェースも提示する。
論文 参考訳(メタデータ) (2024-05-17T11:22:27Z) - Towards A Structured Overview of Use Cases for Natural Language Processing in the Legal Domain: A German Perspective [43.662441393491584]
近年、自然言語処理(NLP)と法学の分野が合わさって法プロセスのデジタル化が進んでいるため、法務技術の分野が盛んになっている。
本研究は,NLP文学を基盤として,ドイツにおける法律実務の声を補足した法律技術事例の構造化された概要を構築することを目的としている。
論文 参考訳(メタデータ) (2024-04-29T14:56:47Z) - Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model
Collaboration [52.57055162778548]
法的判断予測(LJP)は、法律AIにおいてますます重要な課題となっている。
先行は、同様の事実を持つ以前の訴訟であり、国家法制度におけるその後の事件の判断の基礎となっている。
近年のディープラーニングの進歩により、LJPタスクの解決に様々なテクニックが使えるようになった。
論文 参考訳(メタデータ) (2023-10-13T16:47:20Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Application of Transformers based methods in Electronic Medical Records:
A Systematic Literature Review [77.34726150561087]
本研究は,異なるNLPタスクにおける電子カルテ(EMR)のトランスフォーマーに基づく手法を用いて,最先端技術に関する体系的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-04-05T22:19:42Z) - An Uncommon Task: Participatory Design in Legal AI [64.54460979588075]
われわれは10年以上前に行われた法律分野における、注目に値する、未調査のAI設計プロセスについて検討する。
インタラクティブなシミュレーション手法によって,コンピュータ科学者と弁護士が共同設計者になれることを示す。
論文 参考訳(メタデータ) (2022-03-08T15:46:52Z) - Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。
判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文 参考訳(メタデータ) (2021-05-09T09:39:25Z) - Predicting Legal Proceedings Status: Approaches Based on Sequential Text
Data [0.0]
本稿では,ブラジルの法的手続を3段階に分類する予測モデルを開発する。
自然言語処理(NLP)と機械学習技術を組み合わせて問題解決を行った。
我々のアプローチは最大精度.93、最高スコアは.89(マクロ)と.93(重み)を達成した。
論文 参考訳(メタデータ) (2020-03-13T19:40:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。