論文の概要: Corpus for Automatic Structuring of Legal Documents
- arxiv url: http://arxiv.org/abs/2201.13125v1
- Date: Mon, 31 Jan 2022 11:12:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 14:43:13.838169
- Title: Corpus for Automatic Structuring of Legal Documents
- Title(参考訳): 法律文書の自動構造化のためのコーパス
- Authors: Prathamesh Kalamkar and Aman Tiwari and Astha Agarwal and Saurabh Karn
and Smita Gupta and Vivek Raghavan and Ashutosh Modi
- Abstract要約: 本稿では,トピックとコヒーレントな部分に分けられる法的判断文書のコーパスを英語で紹介する。
注釈付きコーパスに基づく法文書における修辞的役割を自動的に予測するベースラインモデルを開発した。
要約および法的判断予測のタスクにおける性能向上のための修辞的役割の応用について述べる。
- 参考スコア(独自算出の注目度): 1.8025738207124173
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In populous countries, pending legal cases have been growing exponentially.
There is a need for developing techniques for processing and organizing legal
documents. In this paper, we introduce a new corpus for structuring legal
documents. In particular, we introduce a corpus of legal judgment documents in
English that are segmented into topical and coherent parts. Each of these parts
is annotated with a label coming from a list of pre-defined Rhetorical Roles.
We develop baseline models for automatically predicting rhetorical roles in a
legal document based on the annotated corpus. Further, we show the application
of rhetorical roles to improve performance on the tasks of summarization and
legal judgment prediction. We release the corpus and baseline model code along
with the paper.
- Abstract(参考訳): 人口の多い国では、保留中の訴訟が急増している。
法的文書の処理と整理のための技術を開発する必要がある。
本稿では,法律文書の構造化のための新しいコーパスを提案する。
特に,本論文では,トピックとコヒーレントな部分に分けられる法的判断文書のコーパスを英語で紹介する。
これらの各部分は、予め定義された修辞的役割のリストから得られるラベルでアノテートされる。
注釈付きコーパスに基づく法文書における修辞的役割を自動的に予測するベースラインモデルを開発した。
さらに,要約および法的判断予測のタスクにおける性能向上のための修辞的役割の適用について述べる。
我々は、コーパスおよびベースラインモデルコードを論文とともにリリースする。
関連論文リスト
- CLERC: A Dataset for Legal Case Retrieval and Retrieval-Augmented Analysis Generation [44.67578050648625]
我々は、大規模なオープンソース法定コーパスを、情報検索(IR)と検索拡張生成(RAG)をサポートするデータセットに変換する。
このデータセットCLERCは、(1)法的な分析のための対応する引用を見つけ、(2)これらの引用のテキストを、推論目標を支持するコジェント分析にコンパイルする能力に基づいて、モデルのトレーニングと評価のために構築される。
論文 参考訳(メタデータ) (2024-06-24T23:57:57Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - Enhancing Pre-Trained Language Models with Sentence Position Embeddings
for Rhetorical Roles Recognition in Legal Opinions [0.16385815610837165]
法的意見の規模は増え続けており、法的意見の修辞的役割を正確に予測できるモデルを開発することはますます困難になっている。
本稿では,文の位置情報に関する知識によって強化された事前学習言語モデル(PLM)を用いて,修辞的役割を自動的に予測する新しいモデルアーキテクチャを提案する。
LegalEval@SemEval2023コンペティションの注釈付きコーパスに基づいて、我々のアプローチではパラメータが少なく、計算コストが低下することを示した。
論文 参考訳(メタデータ) (2023-10-08T20:33:55Z) - Rhetorical Role Labeling of Legal Documents using Transformers and Graph
Neural Networks [1.290382979353427]
本稿では,SemEval Task 6の一部として,インドの裁判所判決における修辞的役割のラベル付け作業を行うためのアプローチについて述べる。
論文 参考訳(メタデータ) (2023-05-06T17:04:51Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Fine-grained Intent Classification in the Legal Domain [2.088409822555567]
我々は、殺人、土地紛争、強盗、破産のいずれかの事例分類に属する93の法的文書のデータセットを紹介する。
このようなフレーズごとに微妙な意図を注釈し、読者のケースをより深く理解できるようにします。
目的語句の自動抽出における変換器モデルの性能解析を行う。
論文 参考訳(メタデータ) (2022-05-06T23:57:17Z) - Unified Pretraining Framework for Document Understanding [52.224359498792836]
文書理解のための統合事前学習フレームワークであるUDocを紹介する。
UDocは、ほとんどのドキュメント理解タスクをサポートするように設計されており、Transformerを拡張してマルチモーダル埋め込みを入力とする。
UDocの重要な特徴は、3つの自己管理的損失を利用して汎用的な表現を学ぶことである。
論文 参考訳(メタデータ) (2022-04-22T21:47:04Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Semantic Segmentation of Legal Documents via Rhetorical Roles [3.285073688021526]
本稿では,法的文書を意味的に一貫性のある単位に分割する修辞的役割 (RR) システムを提案する。
我々は,法的文書をセグメント化するための補助的タスクとして,文書の修辞的役割ラベルシフトを用いたマルチタスク学習に基づくディープラーニングモデルを開発した。
論文 参考訳(メタデータ) (2021-12-03T10:49:19Z) - \textit{StateCensusLaws.org}: A Web Application for Consuming and
Annotating Legal Discourse Learning [89.77347919191774]
法律テキストの対話セグメントを解析およびラベル付けするために訓練されたNLPモデルの出力を強調表示するためのWebアプリケーションを作成します。
我々は、米国国勢調査人口を用いて資源を割り当て、政府を組織する州レベルの法律に焦点を当てる。
論文 参考訳(メタデータ) (2021-04-20T22:00:54Z) - Rule-Based Approach for Party-Based Sentiment Analysis in Legal Opinion
Texts [0.3364569898365254]
当事者による感情分析は、法的文書の中で各当事者に対する意見の価値観を特定することによって、自動化システムにおいて重要な役割を果たす。
弁護士と法務官は、法的意見書から必要な情報を手作業で入手するために、かなりの時間と時間を費やしなければならない。
論文 参考訳(メタデータ) (2020-11-11T10:07:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。