論文の概要: Legal Case Document Summarization: Extractive and Abstractive Methods
and their Evaluation
- arxiv url: http://arxiv.org/abs/2210.07544v1
- Date: Fri, 14 Oct 2022 05:43:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 17:09:56.444623
- Title: Legal Case Document Summarization: Extractive and Abstractive Methods
and their Evaluation
- Title(参考訳): 判例文書要約:抽出的・抽象的手法とその評価
- Authors: Abhay Shukla, Paheli Bhattacharya, Soham Poddar, Rajdeep Mukherjee,
Kripabandhu Ghosh, Pawan Goyal, Saptarshi Ghosh
- Abstract要約: 訴訟判断文書の要約は、法律NLPにおいて難しい問題である。
法的事例文書に適用した場合の要約モデルの異なる族がどのように機能するかについては、あまり分析されていない。
- 参考スコア(独自算出の注目度): 11.502115682980559
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Summarization of legal case judgement documents is a challenging problem in
Legal NLP. However, not much analyses exist on how different families of
summarization models (e.g., extractive vs. abstractive) perform when applied to
legal case documents. This question is particularly important since many recent
transformer-based abstractive summarization models have restrictions on the
number of input tokens, and legal documents are known to be very long. Also, it
is an open question on how best to evaluate legal case document summarization
systems. In this paper, we carry out extensive experiments with several
extractive and abstractive summarization methods (both supervised and
unsupervised) over three legal summarization datasets that we have developed.
Our analyses, that includes evaluation by law practitioners, lead to several
interesting insights on legal summarization in specific and long document
summarization in general.
- Abstract(参考訳): 訴訟判断文書の要約は、法律NLPにおいて難しい問題である。
しかし、法的事例文書に適用された場合の要約モデル(例えば、抽出対抽象的)の違いについてはあまり分析されていない。
最近のトランスフォーマティブベースの抽象要約モデルは、入力トークンの数に制限があり、法的文書は非常に長いことが知られているため、この問題は特に重要である。
また、訴訟書類要約システムを評価するのが最善であるかについては、公然の疑問である。
本稿では,これまでに開発した3つの法的要約データセットに対して,複数の抽出的,抽象的要約手法(教師なし,教師なし)を用いて広範な実験を行った。
法律実務者による評価を含む分析は、特定の文書の要約と長い文書の要約に関するいくつかの興味深い洞察をもたらす。
関連論文リスト
- JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文 参考訳(メタデータ) (2024-10-31T18:43:12Z) - Applicability of Large Language Models and Generative Models for Legal Case Judgement Summarization [5.0645491201288495]
近年,抽象的な要約モデルやLarge Language Model (LLM) などの生成モデルが広く普及している。
本稿では,判例判断要約におけるそのようなモデルの適用性について検討する。
論文 参考訳(メタデータ) (2024-07-06T04:49:40Z) - LexAbSumm: Aspect-based Summarization of Legal Decisions [1.3723120574076126]
LexAbSummは、欧州人権裁判所(European Court of Human Rights)の管轄下にある法的判例決定のアスペクトベースの要約のために設計されたデータセットである。
我々は、LexAbSumm上の長いドキュメントに適した抽象的な要約モデルをいくつか評価し、アスペクト固有の要約を生成するためにこれらのモデルを条件付けすることの難しさを明らかにした。
論文 参考訳(メタデータ) (2024-03-31T08:00:40Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - FENICE: Factuality Evaluation of summarization based on Natural language Inference and Claim Extraction [85.26780391682894]
自然言語推論とクレーム抽出(FENICE)に基づく要約のファクチュアリティ評価を提案する。
FENICEは、ソース文書内の情報と、要約から抽出されたクレームと呼ばれる一連の原子的事実との間のNLIベースのアライメントを利用する。
我々の測定基準は、事実性評価のためのデファクトベンチマークであるAGGREFACTに関する新しい技術状況を設定する。
論文 参考訳(メタデータ) (2024-03-04T17:57:18Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Towards Argument-Aware Abstractive Summarization of Long Legal Opinions
with Summary Reranking [6.9827388859232045]
本稿では,論文の議論構造を考慮した,長い法的意見の抽象的要約のための簡単なアプローチを提案する。
提案手法では、引数ロール情報を用いて複数の候補要約を生成し、文書の引数構造との整合性に基づいてこれらの候補を再分類する。
我々は、長い法的意見のデータセットにアプローチの有効性を実証し、それがいくつかの強いベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2023-06-01T13:44:45Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - The Legal Argument Reasoning Task in Civil Procedure [2.079168053329397]
我々は,米国民事訴訟の領域から新たなNLPタスクとデータセットを提示する。
データセットの各インスタンスは、ケースの一般的な導入、特定の質問、可能な解決策引数で構成されている。
論文 参考訳(メタデータ) (2022-11-05T17:41:00Z) - Incorporating Domain Knowledge for Extractive Summarization of Legal
Case Documents [7.6340456946456605]
法ケース文書の要約のための教師なし要約アルゴリズムDELSummを提案する。
提案アルゴリズムは,数千対の文書-要約ペアで訓練された教師付き要約モデルより優れている。
論文 参考訳(メタデータ) (2021-06-30T08:06:15Z) - Summarizing Text on Any Aspects: A Knowledge-Informed Weakly-Supervised
Approach [89.56158561087209]
文書に関連する任意の側面を要約する。
監視データがないため、我々は新しい弱い監督構築法とアスペクト・モデリング・スキームを開発した。
実験により,本手法は実文書と合成文書の両方を要約することで,性能の向上を図っている。
論文 参考訳(メタデータ) (2020-10-14T03:20:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。