論文の概要: SumREN: Summarizing Reported Speech about Events in News
- arxiv url: http://arxiv.org/abs/2212.01146v1
- Date: Fri, 2 Dec 2022 12:51:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 16:30:08.032004
- Title: SumREN: Summarizing Reported Speech about Events in News
- Title(参考訳): sumren: ニュースの出来事に関する報告されたスピーチを要約する
- Authors: Revanth Gangi Reddy, Heba Elfardy, Hou Pong Chan, Kevin Small, Heng Ji
- Abstract要約: 本稿では,各話者の反応を,それぞれの発言によって表現された反応を,ある事象に要約する新しい課題を提案する。
我々は,多文書要約ベンチマークSUMRENを作成し,様々な公開人物からの報告文の745の要約を作成した。
- 参考スコア(独自算出の注目度): 51.82314543729287
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A primary objective of news articles is to establish the factual record for
an event, frequently achieved by conveying both the details of the specified
event (i.e., the 5 Ws; Who, What, Where, When and Why regarding the event) and
how people reacted to it (i.e., reported statements). However, existing work on
news summarization almost exclusively focuses on the event details. In this
work, we propose the novel task of summarizing the reactions of different
speakers, as expressed by their reported statements, to a given event. To this
end, we create a new multi-document summarization benchmark, SUMREN, comprising
745 summaries of reported statements from various public figures obtained from
633 news articles discussing 132 events. We propose an automatic silver
training data generation approach for our task, which helps smaller models like
BART achieve GPT-3 level performance on this task. Finally, we introduce a
pipeline-based framework for summarizing reported speech, which we empirically
show to generate summaries that are more abstractive and factual than baseline
query-focused summarization approaches.
- Abstract(参考訳): ニュース記事の主目的はイベントの事実記録を確立することであり、指定されたイベントの詳細(例えば、5 Ws; Who, What, Where, When and Why)とそれに対する人々の反応(すなわち、報告された声明)の両方を伝えることでしばしば達成される。
しかし、ニュース要約に関する既存の作業は、ほとんどがイベントの詳細に焦点を当てている。
そこで本研究では,各話者の反応を,各事象に対する報告文で表されるように要約する新しい課題を提案する。
そこで我々は,132件の出来事を議論する633のニュース記事から得られた,様々な公開人物の報告文の745の要約からなる,新しい多文書要約ベンチマークSUMRENを作成する。
本稿では,BART などの小型モデルによる GPT-3 レベルの性能向上を支援するため,タスクの自動銀トレーニングデータ生成手法を提案する。
最後に,ベースラインクエリ指向の要約アプローチよりも抽象的かつ事実的な要約を生成するために経験的に示す,報告音声要約のためのパイプラインベースのフレームワークを提案する。
関連論文リスト
- Grounding Partially-Defined Events in Multimodal Data [61.0063273919745]
部分定義イベントに対するマルチモーダル定式化を導入し、これらのイベントの抽出を3段階スパン検索タスクとしてキャストする。
このタスクのベンチマークであるMultiVENT-Gを提案し,22.8Kのラベル付きイベント中心エンティティを含む,14.5時間の高密度アノテーション付き現在のイベントビデオと1,168のテキストドキュメントからなる。
結果は、イベント理解の抽象的な課題を示し、イベント中心のビデオ言語システムにおける約束を実証する。
論文 参考訳(メタデータ) (2024-10-07T17:59:48Z) - Event-Keyed Summarization [46.521305453350635]
イベントキーの要約(EKS)は、従来の要約と文書レベルのイベント抽出を結合する新しいタスクである。
本稿では,従来のMUC-4データセットのすべての事象を要約したMUCSUMというデータセットを提案する。
EKSを従来の要約や構造からテクストへの要約に還元するアブレーションは、ターゲットイベントの劣るサマリーをもたらすことを示す。
論文 参考訳(メタデータ) (2024-02-10T15:32:53Z) - Towards Event Extraction from Speech with Contextual Clues [61.164413398231254]
本稿では,音声イベント抽出(SpeechEE)タスクを導入し,3つの合成トレーニングセットと1つの人為的テストセットを構築した。
テキストからのイベント抽出と比較して、SpeechEEは、主に連続的で単語境界を持たない複雑な音声信号のために、より大きな課題を提起する。
我々の手法はすべてのデータセットに大幅な改善をもたらし、最大10.7%のF1ゲインを達成する。
論文 参考訳(メタデータ) (2024-01-27T11:07:19Z) - Background Summarization of Event Timelines [13.264991569806572]
本稿では、各時系列更新と関連するイベントの背景要約を補完するバックグラウンドニュース要約のタスクを紹介する。
我々は,既存の時系列データセットをマージしてデータセットを構築し,各ニュースイベント毎の背景要約を書くよう人間アノテータに依頼する。
我々は、最先端の要約システムを用いて強力なベースライン性能を確立し、背景要約を生成するためのクエリ中心の変種を提案する。
論文 参考訳(メタデータ) (2023-10-24T21:30:15Z) - COMET-M: Reasoning about Multiple Events in Complex Sentences [14.644677930985816]
本稿では,複合文中の対象事象に対するコモンセンス推論を生成可能なイベント中心のコモンセンスモデルであるCOMET-Mを提案する。
COMET-Mは、単純な文に対するイベント中心の推論を排他的に生成するCOMETの上に構築されている。
論文 参考訳(メタデータ) (2023-05-24T01:35:01Z) - Whats New? Identifying the Unfolding of New Events in Narratives [11.058053956455545]
本稿では,イベントの情報状況(IS)を調査し,物語における新たなイベントの自動識別という,新たな課題を提案する。
我々は、事象を主題、述語、対象の三重項として定義する。
我々は,人間の注釈を用いて,新しい出来事を文レベルで表現した物語の公開コーパスを注釈した。
論文 参考訳(メタデータ) (2023-02-15T15:54:01Z) - Zero-Shot On-the-Fly Event Schema Induction [61.91468909200566]
本稿では,大規模な言語モデルを用いて,高レベルなイベント定義,特定のイベント,引数,それらの関係を予測・付与するソースドキュメントを生成する手法を提案する。
我々のモデルを用いて、任意のトピックに関する完全なスキーマを、手動のデータ収集、すなわちゼロショットの方法で、オンザフライで生成することができる。
論文 参考訳(メタデータ) (2022-10-12T14:37:00Z) - TAGPRIME: A Unified Framework for Relational Structure Extraction [71.88926365652034]
TAGPRIMEは、与えられた条件に関する情報を入力テキストに追加するシーケンスタグ付けモデルである。
事前学習された言語モデルにおける自己認識機構により、プライミングワードは、出力された文脈化された表現に、与えられた条件に関するより多くの情報を含む。
5つの異なる言語にまたがる10のデータセットをカバーする3つのタスクに関する大規模な実験と分析は、TAGPRIMEの汎用性と有効性を示している。
論文 参考訳(メタデータ) (2022-05-25T08:57:46Z) - Detecting Ongoing Events Using Contextual Word and Sentence Embeddings [110.83289076967895]
本稿では,OED(Ongoing Event Detection)タスクを紹介する。
目的は、歴史、未来、仮説、あるいは新しいものでも現在のものでもない他の形式や出来事に対してのみ、進行中のイベントの言及を検出することである。
構造化されていないテキストから進行中のイベントに関する構造化情報を抽出する必要があるアプリケーションは、OEDシステムを利用することができる。
論文 参考訳(メタデータ) (2020-07-02T20:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。