論文の概要: Faithful by Construction: Claim-Anchored Attribution for Multi-Document Summarization
- arxiv url: http://arxiv.org/abs/2606.23989v1
- Date: Mon, 22 Jun 2026 22:39:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.69848
- Title: Faithful by Construction: Claim-Anchored Attribution for Multi-Document Summarization
- Title(参考訳): 構築の信条:多文書要約におけるクレームアンコレッド属性
- Authors: Shuo Guan,
- Abstract要約: Claim-Anchored Multi-Docment Summarization framework (CAMS)
Claim-Anchored Multi-Docment Summarization framework (CAMS)
- 参考スコア(独自算出の注目度): 1.1168121941015015
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end large language models (LLMs) produce fluent multi-document summaries but remain prone to hallucination, and the attributions they offer are typically coarse (whole documents or passages) and generated post hoc, leaving each summary statement hard to verify. We revisit the modular Extract--Select--Rewrite paradigm and recast its intermediate representation as the unit of attribution. We present CAMS, a Claim-Anchored Multi-document Summarization framework that (i) extracts atomic claims with token-level provenance from every source document, (ii) clusters equivalent claims across documents while flagging inter-source conflicts, (iii) selects a support-aware and salient subset, and (iv) rewrites the selection into a summary in which every sentence is anchored to a support-checked claim that links back to one or more source spans. Because content is localized before it is realized, the pipeline is attribution-oriented by construction and faithfulness-oriented by construction: it structurally preserves fine-grained, multi-source traceability while using support-aware selection, constrained rewriting, and verification to encourage, rather than guarantee, factual faithfulness. We evaluate quality, faithfulness, and localization on MultiNews, analyze conflict handling on DiverseSumm, and test zero-shot transfer on WCEP, using a two-regime protocol that separates reference-free citation quality from gold-aligned localization accuracy, and we add an evaluator-decoupled audit that tests citation precision with a support model never used for selection or verification. CAMS matches strong end-to-end and span-attribution baselines on summary quality while substantially improving faithfulness and citation precision, lifting multi-source attribution accuracy by roughly two-thirds, and exposing a controllable faithfulness--coverage trade-off that end-to-end models leave implicit.
- Abstract(参考訳): エンドツーエンドの大規模言語モデル(LLM)は、複数のドキュメントの要約を生成するが、幻覚に苦しむ傾向にあり、それらが提供する属性は通常、粗い(全文書またはパス)と生成されたポストホックであり、それぞれの要約文の検証が困難である。
モジュラー抽出-セレクト--リライトパラダイムを再検討し、その中間表現を属性の単位として再キャストする。
クレームアンコール型多文書要約フレームワークCAMSについて紹介する。
i)すべての資料からトークンレベルの証明付き原子クレームを抽出する。
(ii) ソース間の競合を警告しながら、ドキュメント間で同等のクレームをクラスタ化する。
(iii)サポート意識と健全なサブセットを選択し、
(iv)選択を、各文が1つ以上のソースにリンクするサポートチェックされたクレームに固定されたサマリに書き換える。
コンテンツは実現前にローカライズされるため、パイプラインは構築によって帰属指向であり、実際の忠実性を保証するのではなく、サポート意識の選択、制約された書き換え、検証を使用して、きめ細かなマルチソーストレーサビリティを構造的に保持する。
我々は、マルチニューズにおける品質、忠実度、ローカライゼーションを評価し、DiverseSumm上でのコンフリクトハンドリングを分析し、WCEP上でのゼロショット転送をテストする。
CAMSは、要約品質に基づいて強力なエンドツーエンドとスパン属性のベースラインを一致させ、忠実さと引用精度を大幅に向上させ、多ソース属性の精度をおよそ3分の2引き上げ、エンドツーエンドモデルが暗黙的に残すコントロール可能な信頼度-カバレッジトレードオフを露呈する。
関連論文リスト
- Enhancing Factuality through Consensus and Consistency in Summarization Using Minimum Bayes Risk Decoding [64.98167175790817]
本稿では、ソース文書の一貫性と他の候補間のコンセンサスという2つの要因を考慮し、候補要約を再引用するConSUMを提案する。
我々のシステムは既存の手法と競合しており、人による評価により、生成した要約が他のシステムよりも好まれていることが確認されている。
論文 参考訳(メタデータ) (2026-05-28T04:14:43Z) - CHOP: Chunkwise Context-Preserving Framework for RAG on Multi Documents [6.134883925217888]
大規模言語モデル(LLM)によるチャンク関係を反復的に評価するフレームワークであるCHOPを提案する。
CHOPはCNM-ExtractorとContinuity Decision Moduleという2つの重要なコンポーネントを統合している。
ベンチマークデータセットの実験では、CHOPは検索の混乱を緩和し、高品質な知識ベースを構築するためのスケーラブルなアプローチを提供する。
論文 参考訳(メタデータ) (2026-04-17T08:05:17Z) - MARA: A Multimodal Adaptive Retrieval-Augmented Framework for Document Question Answering [51.19392014547221]
検索型マルチモーダル文書QAは,視覚的にリッチな文書から複雑なマルチモーダル構造を持つ関連情報を識別し,統合することを目的としている。
現在のアプローチは、サージェントなコンテンツを見渡すクエリに依存しないドキュメント表現に依存しています。
本稿では,クエリ適応生成を導入したMultimodal Adaptive Retrieval-Augmented (MARA)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-01T12:27:40Z) - MMDeepResearch-Bench: A Benchmark for Multimodal Deep Research Agents [37.98503734345155]
MMDR-Bench(MMDR-Bench)は、21のドメインにまたがる140の専門的なタスクのベンチマークである。
MMDR-Benchは以前の設定と比較して、明確な証拠を用いたレポートスタイルの合成を強調している。
報告品質のためのF-LLM適応評価(FLAE)、引用的根拠のアライメントのためのTRACE(Trustworthy Retrieval-Aligned Citation Evaluation)、テキスト・視覚的整合性のためのMOSAIC(Multimodal Support-Aligned Integrity Check)を提案する。
論文 参考訳(メタデータ) (2026-01-18T10:41:33Z) - VeriCite: Towards Reliable Citations in Retrieval-Augmented Generation via Rigorous Verification [107.75781898355562]
証拠を厳格に検証し,回答の帰属性を高めるために設計された,VeriCiteと呼ばれる新しいフレームワークを紹介する。
我々は,5つのオープンソースLCMと4つのデータセットを対象とした実験を行い,VeriCiteが回答の正しさを維持しつつ,引用品質を大幅に向上できることを実証した。
論文 参考訳(メタデータ) (2025-10-13T13:38:54Z) - Towards Knowledge-Aware Document Systems: Modeling Semantic Coverage Relations via Answerability Detection [40.12543056558646]
本稿では,セマンティックカバレッジ関係(SCR)をモデル化するための新しいフレームワークを提案する。
等価性、包摂性、セマンティックオーバーラップという3つのコア関係タイプを定義します。
質問応答(QA)に基づくアプローチでは,文書間で共有された質問の応答可能性を意味的カバレッジの指標として活用する。
論文 参考訳(メタデータ) (2025-09-10T06:00:01Z) - Unstructured Evidence Attribution for Long Context Query Focused Summarization [53.08341620504465]
固定粒度の場合よりも、より関連性が高く一貫した証拠を得るために、非構造的(すなわち任意の長さのスパン)な証拠を抽出することを提案する。
既存のシステムが、非構造的証拠をコピーし、適切に引用するのにどのように苦労しているかを示す。
論文 参考訳(メタデータ) (2025-02-20T09:57:42Z) - Verifiable Generation with Subsentence-Level Fine-Grained Citations [13.931548733211436]
検証可能な生成には、出力をサポートするソースドキュメントを引用するために、大きな言語モデルが必要である。
先行研究は主に文レベルの引用の生成を目標としており、引用された情報源によって文のどの部分が裏付けられているかの特異性が欠如している。
本研究は, サブ文レベルのきめ細かな引用による生成を検証し, 引用元が支持する生成コンテンツのより正確な位置について検討する。
論文 参考訳(メタデータ) (2024-06-10T09:32:37Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。