論文の概要: Predicting Legal Proceedings Status: Approaches Based on Sequential Text
Data
- arxiv url: http://arxiv.org/abs/2003.11561v4
- Date: Wed, 23 Jun 2021 02:57:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 00:55:54.311005
- Title: Predicting Legal Proceedings Status: Approaches Based on Sequential Text
Data
- Title(参考訳): 訴訟手続の状況予測:逐次的テキストデータに基づくアプローチ
- Authors: Felipe Maia Polo, Itamar Ciochetti, Emerson Bertolo
- Abstract要約: 本稿では,ブラジルの法的手続を3段階に分類する予測モデルを開発する。
自然言語処理(NLP)と機械学習技術を組み合わせて問題解決を行った。
我々のアプローチは最大精度.93、最高スコアは.89(マクロ)と.93(重み)を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The objective of this paper is to develop predictive models to classify
Brazilian legal proceedings in three possible classes of status: (i) archived
proceedings, (ii) active proceedings, and (iii) suspended proceedings. This
problem's resolution is intended to assist public and private institutions in
managing large portfolios of legal proceedings, providing gains in scale and
efficiency. In this paper, legal proceedings are made up of sequences of short
texts called "motions." We combined several natural language processing (NLP)
and machine learning techniques to solve the problem. Although working with
Portuguese NLP, which can be challenging due to lack of resources, our
approaches performed remarkably well in the classification task, achieving
maximum accuracy of .93 and top average F1 Scores of .89 (macro) and .93
(weighted). Furthermore, we could extract and interpret the patterns learned by
one of our models besides quantifying how those patterns relate to the
classification task. The interpretability step is important among machine
learning legal applications and gives us an exciting insight into how black-box
models make decisions.
- Abstract(参考訳): 本研究の目的は,ブラジルの法的手続を3段階に分類する予測モデルを開発することである。
(i)アーカイブされた手続
(ii)積極的な手続、及び
(iii)停止。
この問題の解決は、公共機関や民間機関が大規模な法的手続きのポートフォリオを管理し、規模と効率性を高めることを目的としている。
本論文では,「運動」と呼ばれる短文の系列からなる訴訟手続について述べる。
自然言語処理(NLP)と機械学習技術を組み合わせて問題解決を行った。
資源不足のため、ポルトガルのNLPで作業することは難しいが、我々のアプローチは分類作業において非常にうまく行っており、最大精度は.93、最高スコアは.89(マクロ)と.93(重み)である。
さらに,モデルの1つで学習したパターンを抽出・解釈し,そのパターンが分類タスクとどのように関連しているかを定量化することができた。
解釈可能性のステップは、マシンラーニングの法的アプリケーションにおいて重要であり、ブラックボックスモデルがどのように意思決定を行うかに関するエキサイティングな洞察を与えてくれます。
関連論文リスト
- Analyzing and Adapting Large Language Models for Few-Shot Multilingual
NLU: Are We There Yet? [82.02076369811402]
教師付きファインチューニング(SFT)、教師付きインストラクションチューニング(SIT)、インコンテキストラーニング(ICL)は、3つの代替であり、事実上の標準的アプローチである。
提案手法は,6つの高・低リソース言語,3つの異なるNLUタスク,多種多様な言語とドメインのセットアップを用いて,3つのアプローチを網羅的かつ体系的に比較する。
そこで本研究では,教師あり指導のチューニングが,性能とリソース要件の最良のトレードオフであることを示す。
論文 参考訳(メタデータ) (2024-03-04T10:48:13Z) - LLM vs. Lawyers: Identifying a Subset of Summary Judgments in a Large UK
Case Law Dataset [0.0]
本研究は, 英国裁判所判決の大規模コーパスから, 判例, 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、
我々は、ケンブリッジ法コーパス356,011英国の裁判所決定を用いて、大きな言語モデルは、キーワードに対して重み付けされたF1スコアが0.94対0.78であると判断する。
我々は,3,102件の要約判断事例を同定し抽出し,その分布を時間的範囲の様々な英国裁判所にマップできるようにする。
論文 参考訳(メタデータ) (2024-03-04T10:13:30Z) - Modeling Legal Reasoning: LM Annotation at the Edge of Human Agreement [3.537369004801589]
我々は法学哲学に基づく法学推論の分類について研究する。
我々は、ドメインの専門家チームによって注釈付けされた、アメリカ合衆国最高裁判所の歴史的意見の新しいデータセットを使用します。
生成モデルは、人間のアノテーションに提示される命令と同等の命令が与えられた場合、性能が良くないことがわかった。
論文 参考訳(メタデータ) (2023-10-27T19:27:59Z) - Improving Open Information Extraction with Large Language Models: A
Study on Demonstration Uncertainty [52.72790059506241]
オープン情報抽出(OIE)タスクは、構造化されていないテキストから構造化された事実を抽出することを目的としている。
一般的なタスク解決手段としてChatGPTのような大きな言語モデル(LLM)の可能性にもかかわらず、OIEタスクの最先端(教師付き)メソッドは遅れている。
論文 参考訳(メタデータ) (2023-09-07T01:35:24Z) - Cabrita: closing the gap for foreign languages [0.0]
特定の言語やドメインのスクラッチからモデルをトレーニングする戦略は、2つの重要な目的に役立ちます。
このコスト課題を克服する主な解決策は、利用可能なトレーニング済みモデルに依存することである。
本稿では,性能と効率的なトークン化問題に対処する手法であるCabritaを提案する。
論文 参考訳(メタデータ) (2023-08-23T02:49:35Z) - Large Language Models in the Workplace: A Case Study on Prompt
Engineering for Job Type Classification [58.720142291102135]
本研究では,実環境における職種分類の課題について検討する。
目標は、英語の求職が卒業生やエントリーレベルの地位に適切かどうかを判断することである。
論文 参考訳(メタデータ) (2023-03-13T14:09:53Z) - Improving Pre-trained Language Model Fine-tuning with Noise Stability
Regularization [94.4409074435894]
本稿では,LNSR(Layerwise Noise Stability Regularization)という,新規かつ効果的な微調整フレームワークを提案する。
具体的には、標準ガウス雑音を注入し、微調整モデルの隠れ表現を正規化することを提案する。
提案手法は,L2-SP,Mixout,SMARTなど他の最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-12T04:42:49Z) - Context-Aware Language Modeling for Goal-Oriented Dialogue Systems [84.65707332816353]
我々は、部分的に観察されたマルコフ決定過程としてゴール指向対話を定式化する。
目的を意識して言語モデルを微調整する,シンプルで効果的な手法を考案する。
本研究では,AirDialogue を用いた実践的なフライト予約タスクについて評価する。
論文 参考訳(メタデータ) (2022-04-18T17:23:11Z) - Analysing similarities between legal court documents using natural
language processing approaches based on Transformers [0.0]
本研究の目的は、推論グループで達成できる司法文書間の類似度を検出することである。
ブラジルの司法制度における法的手続のケーススタディに、トランスフォーマーアーキテクチャに基づく6つのNLP技術を適用している。
論文 参考訳(メタデータ) (2022-04-14T18:25:56Z) - Skill Induction and Planning with Latent Language [94.55783888325165]
我々は、ゴールがハイレベルなサブタスク記述のシーケンスを生成するアクションシーケンスの生成モデルを定式化する。
本稿では、このモデルを、主に注釈のないデモを用いて、名前付きハイレベルなサブタスクのシーケンスに解析する方法について述べる。
訓練されたモデルでは、自然言語コマンドの空間はスキルのライブラリを索引付けする;エージェントはこれらのスキルを使って、新しい目標に適した高いレベルの命令シーケンスを生成する。
論文 参考訳(メタデータ) (2021-10-04T15:36:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。