論文の概要: Narrative-Driven Paper-to-Slide Generation via ArcDeck
- arxiv url: http://arxiv.org/abs/2604.11969v1
- Date: Mon, 13 Apr 2026 19:03:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.074354
- Title: Narrative-Driven Paper-to-Slide Generation via ArcDeck
- Title(参考訳): ArcDeckによるナラティブ駆動型ペーパー・ツー・スライディング生成
- Authors: Tarik Can Ozden, Sachidanand VS, Furkan Horoz, Ozgur Kara, Junho Kim, James Matthew Rehg,
- Abstract要約: ArcDeckは、紙とスライドの生成を構造化された物語再構築タスクとして定式化するフレームワークである。
まず、インプットを解析して、談話ツリーを構築し、グローバルなコミットメント文書を確立する。
これらの構造的先行は、反復的なマルチエージェント精錬プロセスを導く。
- 参考スコア(独自算出の注目度): 14.784435721765538
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce ArcDeck, a multi-agent framework that formulates paper-to-slide generation as a structured narrative reconstruction task. Unlike existing methods that directly summarize raw text into slides, ArcDeck explicitly models the source paper's logical flow. It first parses the input to construct a discourse tree and establish a global commitment document, ensuring the high-level intent is preserved. These structural priors then guide an iterative multi-agent refinement process, where specialized agents iteratively critique and revise the presentation outline before rendering the final visual layouts and designs. To evaluate our approach, we also introduce ArcBench, a newly curated benchmark of academic paper-slide pairs. Experimental results demonstrate that explicit discourse modeling, combined with role-specific agent coordination, significantly improves the narrative flow and logical coherence of the generated presentations.
- Abstract(参考訳): 本稿では,多エージェントフレームワークであるArcDeckについて紹介する。
原文を直接スライドに要約する既存の方法とは異なり、ArcDeckはソース紙の論理フローを明示的にモデル化する。
まず、インプットを解析して、談話木を構築し、グローバルなコミットメント文書を確立し、ハイレベルな意図を確実に保持する。
これらの構造的事前は、反復的なマルチエージェントの洗練プロセスを導き、特殊エージェントが最終的な視覚的レイアウトとデザインをレンダリングする前に、プレゼンテーション概要を反復的に批判し、修正する。
また,本手法を評価するために,新たにキュレートされた学術用紙スライディングペアのベンチマークであるArcBenchを導入する。
実験結果から,明示的な談話モデルと役割特化エージェントの協調が組み合わさって,生成したプレゼンテーションの物語の流れと論理的一貫性を著しく改善することが示された。
関連論文リスト
- PaperX: A Unified Framework for Multimodal Academic Presentation Generation with Scholar DAG [22.64989700220684]
本稿では,学術的なプレゼンテーション生成を構造的変換とレンダリングのプロセスとしてモデル化する統合フレームワークPaperXを紹介する。
PaperXは単一のソースから多種多様な高品質の出力を生成する。
論文 参考訳(メタデータ) (2026-01-30T18:27:03Z) - Disco-RAG: Discourse-Aware Retrieval-Augmented Generation [81.53888908988756]
生成プロセスに談話信号を注入する談話認識フレームワークであるディスコRAGを提案する。
提案手法は,チャンク内談話木を構築し,局所階層を捕捉し,クロスパスコヒーレンスをモデル化するためのチャンク間修辞グラフを構築する。
質問応答と長期文書要約ベンチマークの実験から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2026-01-07T20:32:50Z) - PosterForest: Hierarchical Multi-Agent Collaboration for Scientific Poster Generation [28.02969134846803]
文書構造と視覚的・テキスト的関係を共同で符号化する階層型中間表現であるtextitPoster Tree を導入する。
本フレームワークでは,コンテンツ要約とレイアウト計画を専門とするエージェントが反復的に協調し,相互にフィードバックを提供するマルチエージェント協調戦略を採用している。
論文 参考訳(メタデータ) (2025-08-29T15:36:06Z) - DREAM: Document Reconstruction via End-to-end Autoregressive Model [53.51754520966657]
本稿では、文書再構成に特化した革新的な自己回帰モデルについて述べる。
文書再構成タスクの標準化定義を確立し,文書類似度基準(DSM)とDocRec1Kデータセットを導入し,タスクの性能を評価する。
論文 参考訳(メタデータ) (2025-07-08T09:24:07Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - DOC2PPT: Automatic Presentation Slides Generation from Scientific
Documents [76.19748112897177]
文書・スライド生成のための新しい課題とアプローチを提案する。
エンドツーエンドでタスクに取り組むための階層的なシーケンス・ツー・シーケンスアプローチを提案する。
提案手法では,文書やスライド内の固有構造を利用して,パラフレーズとレイアウト予測モジュールを組み込んでスライドを生成する。
論文 参考訳(メタデータ) (2021-01-28T03:21:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。