論文の概要: Legal Document Classification: An Application to Law Area Prediction of
Petitions to Public Prosecution Service
- arxiv url: http://arxiv.org/abs/2010.12533v1
- Date: Tue, 13 Oct 2020 18:05:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 01:00:12.118178
- Title: Legal Document Classification: An Application to Law Area Prediction of
Petitions to Public Prosecution Service
- Title(参考訳): 法文書分類:公訴庁への申立ての法律区域予測への応用
- Authors: Mariana Y. Noguti, Eduardo Vellasques, Luiz S. Oliveira
- Abstract要約: 本稿では,NLPを用いたテキスト分類手法を提案する。
我々の主な目標は、各分野の法律に請願書を割り当てるプロセスを自動化することです。
最高の結果は、ドメイン固有のコーパスとリカレントニューラルネットワークアーキテクチャに基づいてトレーニングされたWord2Vecの組み合わせで得られる。
- 参考スコア(独自算出の注目度): 6.696983725360808
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, there has been an increased interest in the application of
Natural Language Processing (NLP) to legal documents. The use of convolutional
and recurrent neural networks along with word embedding techniques have
presented promising results when applied to textual classification problems,
such as sentiment analysis and topic segmentation of documents. This paper
proposes the use of NLP techniques for textual classification, with the purpose
of categorizing the descriptions of the services provided by the Public
Prosecutor's Office of the State of Paran\'a to the population in one of the
areas of law covered by the institution. Our main goal is to automate the
process of assigning petitions to their respective areas of law, with a
consequent reduction in costs and time associated with such process while
allowing the allocation of human resources to more complex tasks. In this
paper, we compare different approaches to word representations in the
aforementioned task: including document-term matrices and a few different word
embeddings. With regards to the classification models, we evaluated three
different families: linear models, boosted trees and neural networks. The best
results were obtained with a combination of Word2Vec trained on a
domain-specific corpus and a Recurrent Neural Network (RNN) architecture (more
specifically, LSTM), leading to an accuracy of 90\% and F1-Score of 85\% in the
classification of eighteen categories (law areas).
- Abstract(参考訳): 近年,法律文書への自然言語処理(NLP)の適用に対する関心が高まっている。
畳み込みニューラルネットワークと単語埋め込み技術の使用は、感情分析や文書のトピックセグメンテーションといったテキスト分類問題に適用した場合に有望な結果をもたらす。
本稿は,NLPの手法をテキスト分類に用いて,同機関が対象とする法律の分野の1つにおいて,行政官庁が提供したサービスの記述を人口に分類することを目的としたものである。
私たちの主な目標は、各分野の法律に請願を割り当てるプロセスを自動化し、そのプロセスに関連するコストと時間を削減すると同時に、より複雑なタスクに人材を割り当てることを可能にします。
本稿では、上記の課題における単語表現に対する異なるアプローチを比較し、文書の項行列といくつかの異なる単語埋め込みを含む。
分類モデルに関して、線形モデル、強化木、ニューラルネットワークの3つの異なるファミリーを評価した。
その結果、ドメイン固有のコーパスとリカレントニューラルネットワーク(RNN)アーキテクチャ(具体的にはLSTM)をトレーニングしたWord2Vecの組み合わせで、精度は90\%、F1スコアは18のカテゴリ(法定領域)の分類で85\%となった。
関連論文リスト
- Text Classification using Graph Convolutional Networks: A Comprehensive Survey [11.1080224302799]
グラフ畳み込みネットワーク(GCN)ベースのアプローチは、この10年間、この分野で大きな注目を集めてきた。
本研究の目的は,GCNをベースとしたテキスト分類手法をアーキテクチャや監視方法に関して要約し,分類することである。
論文 参考訳(メタデータ) (2024-10-12T07:03:42Z) - Language Models for Text Classification: Is In-Context Learning Enough? [54.869097980761595]
最近の基礎言語モデルでは、ゼロショットや少数ショットの設定で多くのNLPタスクで最先端のパフォーマンスが示されている。
より標準的なアプローチよりもこれらのモデルの利点は、自然言語(prompts)で書かれた命令を理解する能力である。
これにより、アノテーション付きインスタンスが限られているドメインのテキスト分類問題に対処するのに適している。
論文 参考訳(メタデータ) (2024-03-26T12:47:39Z) - Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文 参考訳(メタデータ) (2023-06-15T02:19:34Z) - Tuning Traditional Language Processing Approaches for Pashto Text
Classification [0.0]
本研究の目的は,Pashto自動テキスト分類システムの構築である。
本研究は、統計的およびニューラルネットワーク機械学習技術の両方を含む複数のモデルを比較する。
本研究では,分類アルゴリズムとTFIDF特徴抽出法を用いて,平均試験精度94%を得た。
論文 参考訳(メタデータ) (2023-05-04T22:57:45Z) - Like a Good Nearest Neighbor: Practical Content Moderation and Text
Classification [66.02091763340094]
LaGoNN(Good Nearest Neighbor)は、学習可能なパラメータを導入することなく、隣人の情報で入力テキストを変更するSetFitの変更である。
LaGoNNは望ましくないコンテンツやテキスト分類のフラグ付けに有効であり、SetFitのパフォーマンスを改善する。
論文 参考訳(メタデータ) (2023-02-17T15:43:29Z) - Attentive Deep Neural Networks for Legal Document Retrieval [2.4350217735794337]
法令文書検索における注意型ニューラルネットワークを用いたテキスト表現法について検討した。
長い文や記事を表すために,2つの階層型アーキテクチャを開発し,それをAttentive CNN と Paraformer と命名する。
実験結果から,知覚的ニューラル法は,データセットや言語間での検索性能において,非神経的手法を著しく上回ることがわかった。
論文 参考訳(メタデータ) (2022-12-13T01:37:27Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Rank over Class: The Untapped Potential of Ranking in Natural Language
Processing [8.637110868126546]
我々は、現在分類を用いて対処されている多くのタスクが、実際には分類モールドに切り替わっていると論じる。
本稿では,一対のテキストシーケンスの表現を生成するトランスフォーマーネットワークからなる新しいエンドツーエンドランキング手法を提案する。
重く歪んだ感情分析データセットの実験では、ランキング結果を分類ラベルに変換すると、最先端のテキスト分類よりも約22%改善する。
論文 参考訳(メタデータ) (2020-09-10T22:18:57Z) - Evaluation of Neural Network Classification Systems on Document Stream [0.5068448669777386]
我々は,NNに基づく文書分類システムの準最適学習事例における効率を解析する。
評価は,実験室におけるシステム性能を評価するための基準事例,文書ストリーム処理に関連する特定の困難をシミュレートする2例,これらすべての困難を組み合わせた現実的事例の4つに分けられた。
論文 参考訳(メタデータ) (2020-07-15T08:52:39Z) - Text Classification with Few Examples using Controlled Generalization [58.971750512415134]
現在の実践は、トレーニング中に見えない単語を、類似した単語とマッピングするために、事前訓練された単語埋め込みに依存している。
私たちの代替案は、未ラベルのパースコーパスから派生したスパース事前訓練された表現から始まります。
これらのベクトル上のフィードフォワードネットワークは、特に低データシナリオにおいて有効であることを示す。
論文 参考訳(メタデータ) (2020-05-18T06:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。