論文の概要: NTS-CoT: Mitigating Hallucinations in LLM-based News Timeline Summarization with Chain-of-Thought Reasoning
- arxiv url: http://arxiv.org/abs/2606.13171v1
- Date: Thu, 11 Jun 2026 10:42:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.729424
- Title: NTS-CoT: Mitigating Hallucinations in LLM-based News Timeline Summarization with Chain-of-Thought Reasoning
- Title(参考訳): NTS-CoT:チェーン・オブ・ソート推論によるLCMに基づくニュースタイムライン要約における幻覚の緩和
- Authors: Feng Lyu, Huiqin Yan, Sijing Duan, Hao Wu, Shuang Gu, Xue Qiao, Weixu Zhang, Haolun Wu,
- Abstract要約: タイムライン要約における幻覚を緩和するために、Chain-of-Thought(CoT)推論を利用する新しいフレームワークであるNTS-CoTを提案する。
フレームワークは、3つの重要なモジュールで構成されている: 忠実な要約のための重要なニュース要素をキャプチャするElement-CoT、タイムスタンプ選択のための時間的サリエンスとイベントプロミネンスを組み合わせるDate Selection、因果関係を推測するCausal-CoT、日付の要約における欠落を減らすCausal-CoT。
- 参考スコア(独自算出の注目度): 10.50622034465093
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid updates of online news make tracking event developments challenging, highlighting the need for timeline summarization (TLS). Hallucinations, where LLM-generated content deviates from source news, still remain a critical issue in LLM-based TLS and are not well studied in existing works. To bridge this gap, we identify two primary types of hallucinations: unfaithful content during news summarization and information omission in date-event summarization. Then, we propose NTS-CoT, a novel framework that leverages Chain-of-Thought (CoT) reasoning to mitigate hallucinations in TLS. The framework consists of three key modules: i) Element-CoT to capture essential news elements for faithful summarization, ii) Date Selection to combine temporal saliency and event prominence for timestamp selection, and iii) Causal-CoT to infer causal relationships and reduce omissions in date-event summarization. Extensive experiments, including quantitative analysis on three TLS benchmarks and human evaluation, demonstrate that NTS-CoT outperforms state-of-the-art baselines, effectively mitigating hallucinations and improving LLM-based TLS performance. Our source code is available at https://anonymous.4open.science/r/NTS-CoT .
- Abstract(参考訳): オンラインニュースの急激な更新は、イベントの追跡を難しくし、タイムライン要約(TLS)の必要性を強調している。
LLM生成コンテンツがソースニュースから逸脱した幻覚は、まだLSMベースのTLSにおいて重要な問題であり、既存の作品ではあまり研究されていない。
このギャップを埋めるために,ニュース要約時の不信な内容と日時要約時の情報の欠落の2つの主要な幻覚を同定する。
そこで我々は,TLSの幻覚を緩和するためにChain-of-Thought(CoT)推論を利用する新しいフレームワークであるNTS-CoTを提案する。
フレームワークは3つの主要なモジュールで構成されています。
一 忠実な要約のための重要なニュース要素を捕捉する要素CoT
二 タイムスタンプ選択のための時相の順応とイベントの卓越を兼ね備えた日時選択
三 因果関係を推測し、かつ、日時要約において省略する因果CoT
3つのTLSベンチマークの定量的分析や人的評価を含む大規模な実験により、NTS-CoTは最先端のベースラインより優れ、幻覚を効果的に緩和し、LSMベースのTLS性能を改善することが示されている。
ソースコードはhttps://anonymous.4open.science/r/NTS-CoT で公開されています。
関連論文リスト
- TimelineReasoner: Advancing Timeline Summarization with Large Reasoning Models [54.737142557469916]
我々は、タイムラインの要約を静的生成からアクティブな推論駆動プロセスに移行するフレームワークであるTimelineReasonerを提案する。
タイムラインの精度,カバレッジ,コヒーレンスの観点から,TimelineReasoner は既存の LLM ベースのTLS 手法よりも優れていることを示す。
この作業はTLSの境界を推し進めるだけでなく、タイムラインの要約のためのLRMベースの推論フレームワークの幅広い可能性を強調している。
論文 参考訳(メタデータ) (2026-04-03T12:30:15Z) - Ground What You See: Hallucination-Resistant MLLMs via Caption Feedback, Diversity-Aware Sampling, and Conflict Regularization [38.469173375694076]
マルチモーダル大言語モデル(MLLM)における幻覚の根本原因を系統的に解析する。
1)不正確な初期記述が後続の推論を誤った前提に固定する連鎖的視覚推論の過度な信頼、(2)政策最適化中の探索の多様性が不十分で、過度に自信があるが誤ったアウトプットを発生させる要因、(3)トレーニングサンプル間の破壊的な衝突、NTKの類似性が誤関連や不安定なパラメータ更新を引き起こす要因である。
実験の結果,提案手法は幻覚率を著しく低減し,MLLMの推論精度を効果的に向上することが示された。
論文 参考訳(メタデータ) (2026-01-09T07:59:18Z) - TableTime: Reformulating Time Series Classification as Training-Free Table Understanding with Large Language Models [20.077169400691435]
大規模言語モデル (LLM) は多変量時系列分類において有効であることを示した。
LLM は LLM の潜在空間内の時系列の埋め込みを直接コードし、LLM の意味空間と一致させる。
MTSCを表理解タスクとして再編成するテーブルタイムを提案する。
論文 参考訳(メタデータ) (2024-11-24T07:02:32Z) - UnSeenTimeQA: Time-Sensitive Question-Answering Beyond LLMs' Memorization [34.257914212541394]
本稿では,新しいデータ汚染のない質問応答ベンチマークUnSeenTimeQAを紹介する。
既存のTSQAベンチマークとは異なるのは、現実世界に根ざしたWeb検索可能なクエリを避けることだ。
大きな言語モデル(LLM)は、訓練前の段階で得られた事実知識に依存することなく、真の時間的推論を行う必要がある。
論文 参考訳(メタデータ) (2024-07-03T22:02:07Z) - MALTO at SemEval-2024 Task 6: Leveraging Synthetic Data for LLM
Hallucination Detection [3.049887057143419]
自然言語生成(NLG)では、現代のLarge Language Models(LLM)がいくつかの課題に直面している。
これはしばしば「幻覚」を示すニューラルネットワークにつながる
SHROOMチャレンジは、生成されたテキストでこれらの幻覚を自動的に識別することに焦点を当てている。
論文 参考訳(メタデータ) (2024-03-01T20:31:10Z) - Enhancing Uncertainty-Based Hallucination Detection with Stronger Focus [99.33091772494751]
大規模言語モデル(LLM)は、様々な分野にわたる印象的なパフォーマンスで大きな人気を集めている。
LLMは、ユーザの期待を満たさない非現実的あるいは非感覚的なアウトプットを幻覚させる傾向がある。
LLMにおける幻覚を検出するための新しい基準のない不確実性に基づく手法を提案する。
論文 参考訳(メタデータ) (2023-11-22T08:39:17Z) - FactCHD: Benchmarking Fact-Conflicting Hallucination Detection [64.4610684475899]
FactCHD は LLM からファクトコンフリクトの幻覚を検出するために設計されたベンチマークである。
FactCHDは、バニラ、マルチホップ、比較、セット操作など、さまざまな事実パターンにまたがる多様なデータセットを備えている。
Llama2 に基づくツール強化 ChatGPT と LoRA-tuning による反射的考察を合成する Truth-Triangulator を提案する。
論文 参考訳(メタデータ) (2023-10-18T16:27:49Z) - Zero-Shot Cross-Lingual Summarization via Large Language Models [108.30673793281987]
言語間要約(CLS)は、異なる対象言語で要約を生成する。
近年のLarge Language Models (LLMs) の出現は、計算言語学コミュニティから広く注目を集めている。
本稿では,異なるパラダイムからゼロショットCLSを実行するために,LSMを誘導するために様々なプロンプトを経験的に使用した。
論文 参考訳(メタデータ) (2023-02-28T01:27:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。