論文の概要: Incorporating Domain Knowledge for Extractive Summarization of Legal
Case Documents
- arxiv url: http://arxiv.org/abs/2106.15876v1
- Date: Wed, 30 Jun 2021 08:06:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-01 22:45:54.475863
- Title: Incorporating Domain Knowledge for Extractive Summarization of Legal
Case Documents
- Title(参考訳): 訴訟書類の抽出要約のためのドメイン知識の統合
- Authors: Paheli Bhattacharya and Soham Poddar and Koustav Rudra and Kripabandhu
Ghosh and Saptarshi Ghosh
- Abstract要約: 法ケース文書の要約のための教師なし要約アルゴリズムDELSummを提案する。
提案アルゴリズムは,数千対の文書-要約ペアで訓練された教師付き要約モデルより優れている。
- 参考スコア(独自算出の注目度): 7.6340456946456605
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic summarization of legal case documents is an important and practical
challenge. Apart from many domain-independent text summarization algorithms
that can be used for this purpose, several algorithms have been developed
specifically for summarizing legal case documents. However, most of the
existing algorithms do not systematically incorporate domain knowledge that
specifies what information should ideally be present in a legal case document
summary. To address this gap, we propose an unsupervised summarization
algorithm DELSumm which is designed to systematically incorporate guidelines
from legal experts into an optimization setup. We conduct detailed experiments
over case documents from the Indian Supreme Court. The experiments show that
our proposed unsupervised method outperforms several strong baselines in terms
of ROUGE scores, including both general summarization algorithms and
legal-specific ones. In fact, though our proposed algorithm is unsupervised, it
outperforms several supervised summarization models that are trained over
thousands of document-summary pairs.
- Abstract(参考訳): 訴訟書類の自動要約は重要かつ実用的な課題である。
この目的のために使用できる多くのドメインに依存しないテキスト要約アルゴリズムとは別に、訴訟文書を要約するためのいくつかのアルゴリズムが開発されている。
しかし、既存のアルゴリズムのほとんどは、法的ケース文書の要約に理想的に存在するべき情報を特定するドメイン知識を体系的に組み込んでいない。
このギャップに対処するために,法専門家のガイドラインを最適化設定に体系的に組み込んだ教師なし要約アルゴリズムDELSummを提案する。
インド最高裁判所の事件文書に関する詳細な実験を行う。
提案手法は, 一般的な要約アルゴリズムと法則的手法の両方を含む, ROUGEスコアにおいて, 高いベースラインを達成できることを示す。
実際、提案アルゴリズムは教師なしであるが、数千対の文書-要約ペアで訓練された教師付き要約モデルよりも優れている。
関連論文リスト
- JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文 参考訳(メタデータ) (2024-10-31T18:43:12Z) - LawLLM: Law Large Language Model for the US Legal System [43.13850456765944]
我々は,米国法域に特化して設計されたマルチタスクモデルであるLawLLM(Law Large Language Model)を紹介する。
類似症例検索(SCR)、PCR(Precedent Case Recommendation)、LJP(Lawal Judgment Prediction)においてLawLLMが優れている
そこで本研究では,各タスクに対して,生の法定データをトレーニング可能な形式に変換する,カスタマイズされたデータ前処理手法を提案する。
論文 参考訳(メタデータ) (2024-07-27T21:51:30Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - A Deep Learning-Based System for Automatic Case Summarization [2.9141777969894966]
本稿では,効率的な自動ケース要約のためのディープラーニングに基づくシステムを提案する。
このシステムは、長い訴訟文書の簡潔かつ関連する要約を生成するための教師なしおよび教師なしの両方の方法を提供する。
今後の研究は、要約技術の改良と、我々の手法を他の種類の法的テキストに適用することに焦点を当てる。
論文 参考訳(メタデータ) (2023-12-13T01:18:10Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - An Intent Taxonomy of Legal Case Retrieval [43.22489520922202]
訴訟検索は、訴訟文書に焦点をあてた特別情報検索(IR)タスクである。
判例検索の新しい階層的意図分類法を提案する。
判例検索において,検索意図の違いによるユーザの行動と満足度に有意な差が認められた。
論文 参考訳(メタデータ) (2023-07-25T07:27:32Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [117.59690218507565]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
私たちのデータセットは、58人の研究者による477の自己申告された専門知識スコアで構成されています。
2つの論文をレビュアーに関連付けるタスクは、簡単なケースでは12%~30%、ハードケースでは36%~43%である。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Computing and Exploiting Document Structure to Improve Unsupervised
Extractive Summarization of Legal Case Decisions [7.99536002595393]
文書構造を利用するために再重み付けアルゴリズムを用いる教師なしグラフベースのランキングモデルを提案する。
カナディアン・ロー・ケース・ロー・データセットの結果,提案手法がいくつかの強い基準線より優れていることが示された。
論文 参考訳(メタデータ) (2022-11-06T22:20:42Z) - Legal Case Document Summarization: Extractive and Abstractive Methods
and their Evaluation [11.502115682980559]
訴訟判断文書の要約は、法律NLPにおいて難しい問題である。
法的事例文書に適用した場合の要約モデルの異なる族がどのように機能するかについては、あまり分析されていない。
論文 参考訳(メタデータ) (2022-10-14T05:43:08Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。