論文の概要: Semantic Segmentation of Legal Documents via Rhetorical Roles
- arxiv url: http://arxiv.org/abs/2112.01836v1
- Date: Fri, 3 Dec 2021 10:49:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-06 14:18:33.097124
- Title: Semantic Segmentation of Legal Documents via Rhetorical Roles
- Title(参考訳): 修辞的役割による法的文書のセマンティックセグメンテーション
- Authors: Vijit Malik and Rishabh Sanjay and Shouvik Kumar Guha and Shubham
Kumar Nigam and Angshuman Hazarika and Arnab Bhattacharya and Ashutosh Modi
- Abstract要約: 本稿では,法的文書を意味的に一貫性のある単位に分割する修辞的役割 (RR) システムを提案する。
我々は,法的文書をセグメント化するための補助的タスクとして,文書の修辞的役割ラベルシフトを用いたマルチタスク学習に基づくディープラーニングモデルを開発した。
- 参考スコア(独自算出の注目度): 3.285073688021526
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Legal documents are unstructured, use legal jargon, and have considerable
length, making it difficult to process automatically via conventional text
processing techniques. A legal document processing system would benefit
substantially if the documents could be semantically segmented into coherent
units of information. This paper proposes a Rhetorical Roles (RR) system for
segmenting a legal document into semantically coherent units: facts, arguments,
statute, issue, precedent, ruling, and ratio. With the help of legal experts,
we propose a set of 13 fine-grained rhetorical role labels and create a new
corpus of legal documents annotated with the proposed RR. We develop a system
for segmenting a document into rhetorical role units. In particular, we develop
a multitask learning-based deep learning model with document rhetorical role
label shift as an auxiliary task for segmenting a legal document. We experiment
extensively with various deep learning models for predicting rhetorical roles
in a document, and the proposed model shows superior performance over the
existing models. Further, we apply RR for predicting the judgment of legal
cases and show that the use of RR enhances the prediction compared to the
transformer-based models.
- Abstract(参考訳): 法律文書は非構造化されており、法的な用語を用いており、かなり長いため、従来のテキスト処理技術による自動処理が困難である。
法的文書処理システムは、文書を意味的に一貫性のある情報単位に分割できれば、かなりの恩恵を受けるだろう。
本稿では,法的文書を意味的に一貫性のある単位(事実,議論,法令,問題,前例,判決,比率)に区分する修辞的役割(RR)システムを提案する。
法律の専門家の助けを借りて,13のきめ細かな修辞的役割ラベルのセットを提案し,提案されたrrに注釈を付した新しい法文書のコーパスを作成する。
文書を修辞的役割単位に分割するシステムを開発した。
特に,法的文書をセグメント化するための補助的タスクとして,文書の修辞的役割ラベルシフトを伴うマルチタスク学習に基づくディープラーニングモデルを開発する。
文書中の修辞的役割を予測するための様々な深層学習モデルを用いて広範囲に実験を行い、提案モデルは既存のモデルよりも優れた性能を示す。
さらに, 訴訟の判断にRRを適用し, RRを用いた場合, 変圧器モデルと比較して予測が向上することを示す。
関連論文リスト
- LegalSeg: Unlocking the Structure of Indian Legal Judgments Through Rhetorical Role Classification [6.549338652948716]
7000以上の文書と140万の文で構成され、7つの修辞的な役割をラベル付けした、このタスクのための最大の注釈付きデータセットであるLegalSegを紹介します。
以上の結果から,より広義の文脈,構造的関係,逐次的な文情報を含むモデルが,文レベルの特徴にのみ依存するモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-09T10:07:05Z) - JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文 参考訳(メタデータ) (2024-10-31T18:43:12Z) - Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - Enhancing Pre-Trained Language Models with Sentence Position Embeddings
for Rhetorical Roles Recognition in Legal Opinions [0.16385815610837165]
法的意見の規模は増え続けており、法的意見の修辞的役割を正確に予測できるモデルを開発することはますます困難になっている。
本稿では,文の位置情報に関する知識によって強化された事前学習言語モデル(PLM)を用いて,修辞的役割を自動的に予測する新しいモデルアーキテクチャを提案する。
LegalEval@SemEval2023コンペティションの注釈付きコーパスに基づいて、我々のアプローチではパラメータが少なく、計算コストが低下することを示した。
論文 参考訳(メタデータ) (2023-10-08T20:33:55Z) - Rhetorical Role Labeling of Legal Documents using Transformers and Graph
Neural Networks [1.290382979353427]
本稿では,SemEval Task 6の一部として,インドの裁判所判決における修辞的役割のラベル付け作業を行うためのアプローチについて述べる。
論文 参考訳(メタデータ) (2023-05-06T17:04:51Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Computing and Exploiting Document Structure to Improve Unsupervised
Extractive Summarization of Legal Case Decisions [7.99536002595393]
文書構造を利用するために再重み付けアルゴリズムを用いる教師なしグラフベースのランキングモデルを提案する。
カナディアン・ロー・ケース・ロー・データセットの結果,提案手法がいくつかの強い基準線より優れていることが示された。
論文 参考訳(メタデータ) (2022-11-06T22:20:42Z) - Unified Pretraining Framework for Document Understanding [52.224359498792836]
文書理解のための統合事前学習フレームワークであるUDocを紹介する。
UDocは、ほとんどのドキュメント理解タスクをサポートするように設計されており、Transformerを拡張してマルチモーダル埋め込みを入力とする。
UDocの重要な特徴は、3つの自己管理的損失を利用して汎用的な表現を学ぶことである。
論文 参考訳(メタデータ) (2022-04-22T21:47:04Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Corpus for Automatic Structuring of Legal Documents [1.8025738207124173]
本稿では,トピックとコヒーレントな部分に分けられる法的判断文書のコーパスを英語で紹介する。
注釈付きコーパスに基づく法文書における修辞的役割を自動的に予測するベースラインモデルを開発した。
要約および法的判断予測のタスクにおける性能向上のための修辞的役割の応用について述べる。
論文 参考訳(メタデータ) (2022-01-31T11:12:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。