論文の概要: Cross-Document Event-Keyed Summarization
- arxiv url: http://arxiv.org/abs/2410.14795v1
- Date: Fri, 18 Oct 2024 18:09:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:19:09.932936
- Title: Cross-Document Event-Keyed Summarization
- Title(参考訳): クロスドキュメントイベントキーによる要約
- Authors: William Walden, Pavlo Kuchmiichuk, Alexander Martin, Chihsheng Jin, Angela Cao, Claire Sun, Curisia Allen, Aaron Steven White,
- Abstract要約: イベントキー要約(EKS)をクロスドキュメント設定(CDEKS)に拡張する。
本稿では,文書間議論抽出のためのFAMUSデータセットのエキスパートアノテーションに基づいて,CDEKSのための高品質なデータセットSEAMUSを紹介する。
本報告では,SEAMUSのベースラインについて,小型モデル,微調整モデル,ゼロおよび少数ショット誘導LDM,詳細な改善,人体評価などについて述べる。
- 参考スコア(独自算出の注目度): 35.957271217461525
- License:
- Abstract: Event-keyed summarization (EKS) requires generating a summary about a specific event described in a document, given the document and an event representation extracted from it. In this work, we extend EKS to the cross-document setting (CDEKS), in which summaries must synthesize information from accounts of the same event given by multiple sources. We introduce SEAMUS (Summaries of Events Across Multiple Sources), a high-quality dataset for CDEKS based on an expert reannotation of the FAMUS dataset for cross-document argument extraction. We present a suite of baselines on SEAMUS, covering both smaller, fine-tuned models, as well as zero- and few-shot prompted LLMs, along with detailed ablations, and a human evaluation study, showing SEAMUS to be a valuable benchmark for this new task.
- Abstract(参考訳): イベントキーの要約(EKS)では、ドキュメントに記述された特定のイベントに関する要約を生成する必要がある。
本研究では,EKSをクロスドキュメント設定(CDEKS)に拡張し,複数のソースから提供される同じイベントのアカウントから要約が情報を合成する必要がある。
クロスドキュメント引数抽出のためのFAMUSデータセットのエキスパート再注釈に基づく,CDEKSのための高品質なデータセットであるSEAMUS(Summaries of Events Across Multiple Sources)を紹介する。
筆者らはSEAMUSのベースラインについて,小型モデル,微調整モデル,ゼロおよび少数ショットのLDM,詳細な改善,人体評価などについて紹介し,SEAMUSが新たなタスクに有用なベンチマークとなることを示す。
関連論文リスト
- Harvesting Events from Multiple Sources: Towards a Cross-Document Event Extraction Paradigm [33.737981167605575]
本稿では,複数の文書からイベント情報を統合し,イベントに関する総合的な視点を提供するために,クロスドキュメントイベント抽出(CDEE)の課題を提案する。
我々は,20,059の文書と37,688の言及レベルのイベントを含む,クロスドキュメントイベント抽出データセット(CLES)を構築した。
当社のCDEEパイプラインは,エンドツーエンドのクロスドキュメントイベント抽出において,約72%のF1を実現しています。
論文 参考訳(メタデータ) (2024-06-23T06:01:11Z) - Write Summary Step-by-Step: A Pilot Study of Stepwise Summarization [48.57273563299046]
本稿では,新たな文書が提案されるたびに追加の要約を生成するステップワイド要約の課題を提案する。
追加された要約は、新たに追加されたコンテンツを要約するだけでなく、以前の要約と一貫性を持たなければならない。
SSGは,自動計測と人的評価の両面から,最先端のパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2024-06-08T05:37:26Z) - Event-Keyed Summarization [46.521305453350635]
イベントキーの要約(EKS)は、従来の要約と文書レベルのイベント抽出を結合する新しいタスクである。
本稿では,従来のMUC-4データセットのすべての事象を要約したMUCSUMというデータセットを提案する。
EKSを従来の要約や構造からテクストへの要約に還元するアブレーションは、ターゲットイベントの劣るサマリーをもたらすことを示す。
論文 参考訳(メタデータ) (2024-02-10T15:32:53Z) - Peek Across: Improving Multi-Document Modeling via Cross-Document
Question-Answering [49.85790367128085]
我々は,事前学習対象に答える新しいクロスドキュメント質問から,汎用的なマルチドキュメントモデルを事前学習する。
この新規なマルチドキュメントQA定式化は、クロステキスト情報関係をよりよく回復させるようモデルに指示する。
分類タスクや要約タスクに焦点を当てた従来のマルチドキュメントモデルとは異なり、事前学習対象の定式化により、短いテキスト生成と長いテキスト生成の両方を含むタスクを実行できる。
論文 参考訳(メタデータ) (2023-05-24T17:48:40Z) - UniSumm and SummZoo: Unified Model and Diverse Benchmark for Few-Shot
Summarization [54.59104881168188]
textscUniSummは、複数の要約タスクで事前訓練された、統合された数ショットの要約モデルである。
textscSummZooは、スクリーンショットの要約をよりよく評価するための新しいベンチマークである。
論文 参考訳(メタデータ) (2022-11-17T18:54:47Z) - Unsupervised Summarization with Customized Granularities [76.26899748972423]
本稿では,最初の教師なし多粒度要約フレームワークであるGranuSumを提案する。
異なる数のイベントを入力することで、GranuSumは教師なしの方法で複数の粒度のサマリーを生成することができる。
論文 参考訳(メタデータ) (2022-01-29T05:56:35Z) - HowSumm: A Multi-Document Summarization Dataset Derived from WikiHow
Articles [8.53502615629675]
クエリ中心のマルチドキュメント要約(qMDS)タスクのための,新たな大規模データセットであるHowSummを提案する。
このユースケースは、既存のマルチドキュメント要約(MDS)データセットでカバーされているユースケースと異なり、教育や産業のシナリオに適用できる。
データセットの作成について述べ、他の要約コーパスと区別するユニークな特徴について論じる。
論文 参考訳(メタデータ) (2021-10-07T04:44:32Z) - WSL-DS: Weakly Supervised Learning with Distant Supervision for Query
Focused Multi-Document Abstractive Summarization [16.048329028104643]
Query Focused Multi-Document Summarization (QF-MDS)タスクでは、ドキュメントのセットとクエリが与えられ、そこでこれらのドキュメントから要約を生成する。
このタスクの大きな課題のひとつは、ラベル付きトレーニングデータセットの可用性の欠如である。
本稿では,遠隔指導による弱教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2020-11-03T02:02:55Z) - A Large-Scale Multi-Document Summarization Dataset from the Wikipedia
Current Events Portal [10.553314461761968]
MDS(Multi-document summarization)は、大規模な文書コレクションの内容を短い要約に圧縮することを目的としている。
この研究は、文書クラスタの総数と個々のクラスタのサイズの両方で大きいMDS用の新しいデータセットを示す。
論文 参考訳(メタデータ) (2020-05-20T14:33:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。