論文の概要: Incorporating Domain Knowledge for Extractive Summarization of Legal
Case Documents
- arxiv url: http://arxiv.org/abs/2106.15876v1
- Date: Wed, 30 Jun 2021 08:06:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-01 22:45:54.475863
- Title: Incorporating Domain Knowledge for Extractive Summarization of Legal
Case Documents
- Title(参考訳): 訴訟書類の抽出要約のためのドメイン知識の統合
- Authors: Paheli Bhattacharya and Soham Poddar and Koustav Rudra and Kripabandhu
Ghosh and Saptarshi Ghosh
- Abstract要約: 法ケース文書の要約のための教師なし要約アルゴリズムDELSummを提案する。
提案アルゴリズムは,数千対の文書-要約ペアで訓練された教師付き要約モデルより優れている。
- 参考スコア(独自算出の注目度): 7.6340456946456605
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic summarization of legal case documents is an important and practical
challenge. Apart from many domain-independent text summarization algorithms
that can be used for this purpose, several algorithms have been developed
specifically for summarizing legal case documents. However, most of the
existing algorithms do not systematically incorporate domain knowledge that
specifies what information should ideally be present in a legal case document
summary. To address this gap, we propose an unsupervised summarization
algorithm DELSumm which is designed to systematically incorporate guidelines
from legal experts into an optimization setup. We conduct detailed experiments
over case documents from the Indian Supreme Court. The experiments show that
our proposed unsupervised method outperforms several strong baselines in terms
of ROUGE scores, including both general summarization algorithms and
legal-specific ones. In fact, though our proposed algorithm is unsupervised, it
outperforms several supervised summarization models that are trained over
thousands of document-summary pairs.
- Abstract(参考訳): 訴訟書類の自動要約は重要かつ実用的な課題である。
この目的のために使用できる多くのドメインに依存しないテキスト要約アルゴリズムとは別に、訴訟文書を要約するためのいくつかのアルゴリズムが開発されている。
しかし、既存のアルゴリズムのほとんどは、法的ケース文書の要約に理想的に存在するべき情報を特定するドメイン知識を体系的に組み込んでいない。
このギャップに対処するために,法専門家のガイドラインを最適化設定に体系的に組み込んだ教師なし要約アルゴリズムDELSummを提案する。
インド最高裁判所の事件文書に関する詳細な実験を行う。
提案手法は, 一般的な要約アルゴリズムと法則的手法の両方を含む, ROUGEスコアにおいて, 高いベースラインを達成できることを示す。
実際、提案アルゴリズムは教師なしであるが、数千対の文書-要約ペアで訓練された教師付き要約モデルよりも優れている。
関連論文リスト
- A Deep Learning-Based System for Automatic Case Summarization [2.9141777969894966]
本稿では,効率的な自動ケース要約のためのディープラーニングに基づくシステムを提案する。
このシステムは、長い訴訟文書の簡潔かつ関連する要約を生成するための教師なしおよび教師なしの両方の方法を提供する。
今後の研究は、要約技術の改良と、我々の手法を他の種類の法的テキストに適用することに焦点を当てる。
論文 参考訳(メタデータ) (2023-12-13T01:18:10Z) - Exploring Semi-supervised Hierarchical Stacked Encoder for Legal
Judgement Prediction [0.6349503549199403]
本研究では,教師なしと教師なしの2段階の分類機構を探索し,提案する。
我々は、ドメイン固有の事前訓練されたBERTを用いて、変換器エンコーダ層でさらに処理する文埋め込みの観点から、長い文書から情報を抽出する。
ILDCデータセット上で提案した手法よりも高い性能向上が期待できる。
論文 参考訳(メタデータ) (2023-11-14T12:03:26Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - An Intent Taxonomy of Legal Case Retrieval [43.22489520922202]
訴訟検索は、訴訟文書に焦点をあてた特別情報検索(IR)タスクである。
判例検索の新しい階層的意図分類法を提案する。
判例検索において,検索意図の違いによるユーザの行動と満足度に有意な差が認められた。
論文 参考訳(メタデータ) (2023-07-25T07:27:32Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Exploiting Contrastive Learning and Numerical Evidence for Confusing
Legal Judgment Prediction [46.71918729837462]
訴訟の事実記述文を考慮し、法的判断予測は、事件の告訴、法律記事、刑期を予測することを目的としている。
従来の研究では、標準的なクロスエントロピー分類損失と異なる分類誤差を区別できなかった。
本稿では,モコに基づく教師付きコントラスト学習を提案する。
さらに,事前学習した数値モデルにより符号化された抽出された犯罪量による事実記述の表現をさらに強化する。
論文 参考訳(メタデータ) (2022-11-15T15:53:56Z) - Computing and Exploiting Document Structure to Improve Unsupervised
Extractive Summarization of Legal Case Decisions [7.99536002595393]
文書構造を利用するために再重み付けアルゴリズムを用いる教師なしグラフベースのランキングモデルを提案する。
カナディアン・ロー・ケース・ロー・データセットの結果,提案手法がいくつかの強い基準線より優れていることが示された。
論文 参考訳(メタデータ) (2022-11-06T22:20:42Z) - Legal Case Document Summarization: Extractive and Abstractive Methods
and their Evaluation [11.502115682980559]
訴訟判断文書の要約は、法律NLPにおいて難しい問題である。
法的事例文書に適用した場合の要約モデルの異なる族がどのように機能するかについては、あまり分析されていない。
論文 参考訳(メタデータ) (2022-10-14T05:43:08Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Unsupervised Summarization with Customized Granularities [76.26899748972423]
本稿では,最初の教師なし多粒度要約フレームワークであるGranuSumを提案する。
異なる数のイベントを入力することで、GranuSumは教師なしの方法で複数の粒度のサマリーを生成することができる。
論文 参考訳(メタデータ) (2022-01-29T05:56:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。