論文の概要: Unfolding the Headline: Iterative Self-Questioning for News Retrieval and Timeline Summarization
- arxiv url: http://arxiv.org/abs/2501.00888v1
- Date: Wed, 01 Jan 2025 16:28:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:14:50.372567
- Title: Unfolding the Headline: Iterative Self-Questioning for News Retrieval and Timeline Summarization
- Title(参考訳): 見出しの展開:ニュース検索とタイムライン要約のための反復的セルフクエスト
- Authors: Weiqi Wu, Shen Huang, Yong Jiang, Pengjun Xie, Fei Huang, Hai Zhao,
- Abstract要約: 本稿では,オープンドメインニュースタイムライン SummarizatiOn に対するCHRONOS-Causal Headline Retrieval を提案する。
実験の結果,Chronosはオープンドメインのタイムラインの要約に長けているだけでなく,クローズドドメインアプリケーション用に設計された既存の最先端システムの性能に匹敵していることがわかった。
- 参考スコア(独自算出の注目度): 93.56166917491487
- License:
- Abstract: In the fast-changing realm of information, the capacity to construct coherent timelines from extensive event-related content has become increasingly significant and challenging. The complexity arises in aggregating related documents to build a meaningful event graph around a central topic. This paper proposes CHRONOS - Causal Headline Retrieval for Open-domain News Timeline SummarizatiOn via Iterative Self-Questioning, which offers a fresh perspective on the integration of Large Language Models (LLMs) to tackle the task of Timeline Summarization (TLS). By iteratively reflecting on how events are linked and posing new questions regarding a specific news topic to gather information online or from an offline knowledge base, LLMs produce and refresh chronological summaries based on documents retrieved in each round. Furthermore, we curate Open-TLS, a novel dataset of timelines on recent news topics authored by professional journalists to evaluate open-domain TLS where information overload makes it impossible to find comprehensive relevant documents from the web. Our experiments indicate that CHRONOS is not only adept at open-domain timeline summarization, but it also rivals the performance of existing state-of-the-art systems designed for closed-domain applications, where a related news corpus is provided for summarization.
- Abstract(参考訳): 情報の流れが急速に変化する中で、広範囲なイベント関連コンテンツから一貫性のあるタイムラインを構築する能力は、ますます重要で難しいものになりつつある。
この複雑さは、関連するドキュメントを集約して、中心となるトピックの周りに意味のあるイベントグラフを構築するときに生じる。
本稿では,Large Language Models (LLMs) を統合することで,TLS(Timeline Summarization) の課題に対処するための新たな視点を提供する。
イベントがどのようにリンクされているかを反復的に反映し、特定のニューストピックに関する新しい質問をオンラインまたはオフラインの知識ベースから収集することで、LLMは各ラウンドで検索された文書に基づいて時系列の要約を作成し、更新する。
さらに、プロのジャーナリストが作成した最近のニューストピックのタイムラインデータセットであるOpen-TLSをキュレートして、情報過負荷によりWebから包括的な関連文書を見つけることが不可能なオープンドメインTLSを評価する。
実験の結果,CHRONOSはオープンドメインのタイムライン要約に適応するだけでなく,関連するニュースコーパスを網羅して要約を行う,クローズドドメインアプリケーション用に設計された既存の最先端システムの性能に匹敵することがわかった。
関連論文リスト
- Neon: News Entity-Interaction Extraction for Enhanced Question Answering [2.7661475645321256]
本稿では,ニュース記事に記載されている新たなエンティティインタラクションの抽出を目的としたNEONフレームワークを提案する。
NEONは、そのようなインタラクションをキャプチャするエンティティ中心のタイムスタンプ知識グラフを構築する。
オープンな情報抽出(openIE)スタイルを大規模言語モデルに組み込むことによって,我々のフレームワークは革新的になる。
論文 参考訳(メタデータ) (2024-11-19T12:17:43Z) - Analyzing Temporal Complex Events with Large Language Models? A Benchmark towards Temporal, Long Context Understanding [57.62275091656578]
時間的複合イベント(TCE)として、長い期間にわたって多くのニュース記事から構成される複合イベントについて述べる。
本稿では,Large Language Models (LLMs) を用いて,TCE内のイベントチェーンを系統的に抽出し,解析する手法を提案する。
論文 参考訳(メタデータ) (2024-06-04T16:42:17Z) - Background Summarization of Event Timelines [13.264991569806572]
本稿では、各時系列更新と関連するイベントの背景要約を補完するバックグラウンドニュース要約のタスクを紹介する。
我々は,既存の時系列データセットをマージしてデータセットを構築し,各ニュースイベント毎の背景要約を書くよう人間アノテータに依頼する。
我々は、最先端の要約システムを用いて強力なベースライン性能を確立し、背景要約を生成するためのクエリ中心の変種を提案する。
論文 参考訳(メタデータ) (2023-10-24T21:30:15Z) - Follow the Timeline! Generating Abstractive and Extractive Timeline
Summary in Chronological Order [78.46986998674181]
時間順で抽象的かつ抽出的な時系列を生成できる統一タイムライン要約器(UTS)を提案する。
我々は、以前の中国の大規模タイムライン要約データセットを拡張し、新しい英語タイムラインデータセットを収集する。
UTSは、自動評価と人的評価の両方の観点から最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-01-02T20:29:40Z) - Zero-Shot On-the-Fly Event Schema Induction [61.91468909200566]
本稿では,大規模な言語モデルを用いて,高レベルなイベント定義,特定のイベント,引数,それらの関係を予測・付与するソースドキュメントを生成する手法を提案する。
我々のモデルを用いて、任意のトピックに関する完全なスキーマを、手動のデータ収集、すなわちゼロショットの方法で、オンザフライで生成することができる。
論文 参考訳(メタデータ) (2022-10-12T14:37:00Z) - NECE: Narrative Event Chain Extraction Toolkit [64.89332212585404]
NECEはオープンアクセス型文書レベルのツールキットで,その発生の時間順に物語のイベントを自動的に抽出・アライメントする。
NECEツールキットの高品質さを示し、性別に関するナラティブバイアスを分析するために、その下流の応用を実証する。
また、現状のアプローチの欠点と、今後の研究で生成モデルを活用する可能性についてもオープンに論じる。
論文 参考訳(メタデータ) (2022-08-17T04:30:58Z) - A Large-Scale Multi-Document Summarization Dataset from the Wikipedia
Current Events Portal [10.553314461761968]
MDS(Multi-document summarization)は、大規模な文書コレクションの内容を短い要約に圧縮することを目的としている。
この研究は、文書クラスタの総数と個々のクラスタのサイズの両方で大きいMDS用の新しいデータセットを示す。
論文 参考訳(メタデータ) (2020-05-20T14:33:33Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。