論文の概要: AugAbEx : Way Forward for Extractive Case Summarization
- arxiv url: http://arxiv.org/abs/2511.12290v1
- Date: Sat, 15 Nov 2025 16:49:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.804443
- Title: AugAbEx : Way Forward for Extractive Case Summarization
- Title(参考訳): AugAbEx : 抽出事例要約への道のり
- Authors: Purnima Bindal, Vikas Kumar, Sagar Rathore, Vasudha Bhatnagar,
- Abstract要約: 本研究の目的は,抽象要約を含む既存の7つの事例要約データセットを,対応する抽出要約を組み込むことで拡張することである。
我々は、研究コミュニティが使うために、パブリックドメインで拡張データセットをリリースすることを約束します。
- 参考スコア(独自算出の注目度): 4.0360727591181
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Summarization of legal judgments poses a heavy cognitive burden on law practitioners due to the complexity of the language, context-sensitive legal jargon, and the length of the document. Therefore, the automatic summarization of legal documents has attracted serious attention from natural language processing researchers. Since the abstractive summaries of legal documents generated by deep neural methods remain prone to the risk of misrepresenting nuanced legal jargon or overlooking key contextual details, we envisage a rising trend toward the use of extractive case summarizers. Given the high cost of human annotation for gold standard extractive summaries, we engineer a light and transparent pipeline that leverages existing abstractive gold standard summaries to create the corresponding extractive gold standard versions. The approach ensures that the experts` opinions ensconced in the original gold standard abstractive summaries are carried over to the transformed extractive summaries. We aim to augment seven existing case summarization datasets, which include abstractive summaries, by incorporating corresponding extractive summaries and create an enriched data resource for case summarization research community. To ensure the quality of the augmented extractive summaries, we perform an extensive comparative evaluation with the original abstractive gold standard summaries covering structural, lexical, and semantic dimensions. We also compare the domain-level information of the two summaries. We commit to release the augmented datasets in the public domain for use by the research community and believe that the resource will offer opportunities to advance the field of automatic summarization of legal documents.
- Abstract(参考訳): 法的判断の要約は、言語が複雑で、文脈に敏感な法律用語、文書の長さが原因で、法律実務者に大きな認知的負担をもたらす。
そのため、法律文書の自動要約は自然言語処理研究者から大きな注目を集めている。
ディープ・ニューラル・メソッドによって生成された法文書の抽象的な要約は、ニュアンスな法用語を誤って表現したり、重要な文脈的詳細を見渡すリスクが伴う傾向にあるため、抽出事例要約器の使用に向けた傾向が高まっている。
金標準抽出サマリーに対する人為的アノテーションのコストが高くなると、既存の抽象金標準サマリーを活用して対応する抽出金標準バージョンを作成する、軽量で透明なパイプラインを設計する。
この手法により、原金本位抽象要約において専門家の意見が変換された抽出要約に受け継がれることが保証される。
本研究は,抽象要約を含む既存の7つの事例要約データセットを,対応する抽出要約を組み込んで拡張し,事例要約研究コミュニティのための充実したデータ資源を作成することを目的とする。
拡張抽出サマリーの品質を確保するため,構造,語彙,意味を網羅したオリジナルの抽象金標準サマリーとの比較を行った。
また、2つの要約のドメインレベル情報を比較する。
我々は,研究コミュニティが利用するための公開ドメインに拡張データセットを公開することを約束し,そのリソースが,法律文書の自動要約の分野を前進させる機会を提供すると信じている。
関連論文リスト
- Context-Aware Hierarchical Merging for Long Document Summarization [56.96619074316232]
本論文では,階層的なマージをソース文書からコンテキストと統合する手法を提案する。
法的および物語的領域を表すデータセットの実験結果は、文脈的拡張がゼロショットと階層的な融合ベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-02-03T01:14:31Z) - How Ready are Pre-trained Abstractive Models and LLMs for Legal Case
Judgement Summarization? [4.721618284417204]
近年、抽象的な要約モデルが人気を集めている。
法的なドメイン固有の事前訓練された抽象要約モデルが利用可能になった。
汎用ドメイン事前訓練大型言語モデル(LLM)は高品質なテキストを生成することが知られている。
論文 参考訳(メタデータ) (2023-06-02T03:16:19Z) - SummIt: Iterative Text Summarization via ChatGPT [12.966825834765814]
本稿では,ChatGPTのような大規模言語モデルに基づく反復的なテキスト要約フレームワークSummItを提案する。
我々のフレームワークは、自己評価とフィードバックによって生成された要約を反復的に洗練することを可能にする。
また, 繰り返し改良の有効性を検証し, 過補正の潜在的な問題を特定するために, 人間の評価を行う。
論文 参考訳(メタデータ) (2023-05-24T07:40:06Z) - Salience Allocation as Guidance for Abstractive Summarization [61.31826412150143]
本稿では, サリエンセ・サリエンス・ガイダンス(SEASON, SaliencE Allocation as Guidance for Abstractive SummarizatiON)を用いた新しい要約手法を提案する。
SEASONは、サリエンス予測の割り当てを利用して抽象的な要約を導き、異なる抽象性のある記事に順応する。
論文 参考訳(メタデータ) (2022-10-22T02:13:44Z) - A Survey on Neural Abstractive Summarization Methods and Factual
Consistency of Summarization [18.763290930749235]
要約は、サブセット(要約)を作成するために、テキストデータの集合を計算的に短縮する過程である
既存の要約法は、抽出法と抽象法という2つのタイプに大別できる。
抽出要約器は、ソース文書からテキストスニペットを明示的に選択し、抽象要約器は、ソースで広く普及している最も健全な概念を伝えるために、新しいテキストスニペットを生成する。
論文 参考訳(メタデータ) (2022-04-20T14:56:36Z) - EASE: Extractive-Abstractive Summarization with Explanations [18.046254486733186]
情報ボトルネック原理に基づく説明可能な要約システムを提案する。
人間が長い文書をまとめるために2段階の枠組みを使用するという以前の研究に触発されて、私たちのフレームワークは最初に説明として事前に定義された証拠の量を抽出します。
生成した要約の質を著しく犠牲にすることなく、我々のフレームワークからの説明は単純なベースラインよりも適切であることを示す。
論文 参考訳(メタデータ) (2021-05-14T17:45:06Z) - Constrained Abstractive Summarization: Preserving Factual Consistency
with Constrained Generation [93.87095877617968]
本稿では,抽象要約の現実的一貫性を保ちつつ,制約付き抽象要約(CAS)を提案する。
我々は、CASを満たすために、一般的に自己回帰生成モデルに適用される語彙制約付き復号法を採用する。
対話的要約において1つの手動制約のみを使用する場合、最大13.8ROUGE-2ゲインを観測する。
論文 参考訳(メタデータ) (2020-10-24T00:27:44Z) - Few-Shot Learning for Opinion Summarization [117.70510762845338]
オピニオン要約は、複数の文書で表現された主観的な情報を反映したテキストの自動生成である。
本研究では,要約テキストの生成をブートストラップするのには,少数の要約でも十分であることを示す。
提案手法は, 従来の抽出法および抽象法を, 自動的, 人的評価において大きく上回っている。
論文 参考訳(メタデータ) (2020-04-30T15:37:38Z) - At Which Level Should We Extract? An Empirical Analysis on Extractive
Document Summarization [110.54963847339775]
本研究は,全文を抽出する際,不必要な問題や冗長性が存在することを示す。
選挙区解析木に基づくサブセグメント単位の抽出を提案する。
論文 参考訳(メタデータ) (2020-04-06T13:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。