論文の概要: DeepSlide: From Artifacts to Presentation Delivery
- arxiv url: http://arxiv.org/abs/2605.15202v1
- Date: Wed, 01 Apr 2026 13:38:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.819469
- Title: DeepSlide: From Artifacts to Presentation Delivery
- Title(参考訳): DeepSlide: アーティファクトからプレゼンテーションデリバリへ
- Authors: Ming Yang, Zhiwei Zhang, Jiahang Li, Haoseng Liu, Yuzheng Cai, Weiguo Zheng,
- Abstract要約: 提案するDeepSlideは,完全なプレゼンテーションプロセスの作成を支援するマルチエージェントシステムである。
DeepSlideは、(i)制御可能な論理チェーンプランナとノード単位の時間予算、(ii)グラウンディングのための軽量なコンテンツツリーレトリバー、(iii)スタイル継承によるマルコフスタイルのシーケンシャルレンダリング、(iv)最小限の修復によるサンドボックス実行を統合して、レンダリング性を保証する。
- 参考スコア(独自算出の注目度): 18.44771582564852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Presentations are a primary medium for scholarly communication, yet most AI slide generators optimize the artifact (a visually plausible deck) while under-optimizing the delivery process (pacing, narrative, and presentation preparation). We present DeepSlide, a human-in-the-loop multi-agent system that supports preparing the full presentation process, from requirement elicitation and time-budgeted narrative planning, to evidence-grounded slide--script generation, attention augmentation, and rehearsal support. DeepSlide integrates (i) a controllable logical-chain planner with per-node time budgets, (ii) a lightweight content-tree retriever for grounding, (iii) Markov-style sequential rendering with style inheritance, and (iv) sandboxed execution with minimal repair to ensure renderability. We further introduce a dual-scoreboard benchmark that cleanly separates static artifact quality from dynamic delivery excellence. Across 20 domains and diverse audience profiles, DeepSlide matches strong baselines on artifact quality while consistently achieving larger gains on delivery metrics, improving narrative flow, pacing precision, and slide--script synergy with clearer attention guidance.
- Abstract(参考訳): プレゼンテーションは学術的なコミュニケーションの主要な媒体であるが、ほとんどのAIスライドジェネレータは、成果物(視覚的に可視なデッキ)を最適化し、デリバリプロセス(ピッチ、物語、プレゼンテーションの準備)を過度に最適化する。
本稿では,人間によるマルチエージェントシステムであるDeepSlideについて紹介する。このシステムは,要求適応や時間予算の物語計画,エビデンスグラウンドのスライド-スクリプト生成,アテンション強化,リハーサル支援など,完全なプレゼンテーションプロセスの作成を支援する。
DeepSlideが統合
(i)ノード単位の時間予算を有する制御可能な論理チェーンプランナ
(二)接地用軽量のコンテントツリーレトリバー
三 様式継承によるマルコフ様式の逐次レンダリング、及び
(4) レンダリング性を確保するため、最小限の修理でサンドボックス化された実行。
さらに、静的アーティファクトの品質を動的デリバリの優れたものと明確に分離するデュアルスコアボードベンチマークを導入します。
20のドメインと多様なオーディエンスプロファイルにまたがって、DeepSlideはアーティファクト品質の強いベースラインにマッチすると同時に、デリバリメトリクスの継続的な向上、物語の流れの改善、ペーシング精度の向上、より明確な注意喚起によるスライド-スクリプトのシナジーを実現している。
関連論文リスト
- DeepPresenter: Environment-Grounded Reflection for Agentic Presentation Generation [75.7505732466149]
DeepPresenterは多様なユーザ意図に適応するエージェントフレームワークである。
DeepPresenterは、中間のスライドアーティファクトを自律的に計画し、レンダリングし、修正する。
論文 参考訳(メタデータ) (2026-02-26T10:26:48Z) - SlidesGen-Bench: Evaluating Slides Generation via Computational and Quantitative Metrics [49.092634600260965]
SlidesGen-Benchは、3つのコア原理のレンズを通してスライド生成を評価するために設計されたベンチマークである。
まず、視覚領域で解析を行い、端末出力をレンダリングとして扱い、基礎となる生成法に非依存なままにする。
次に,3次元のスライド(コンテンツ,美学,編集可能性)を定量的に評価する計算手法を提案する。
論文 参考訳(メタデータ) (2026-01-14T13:50:30Z) - SlideGen: Collaborative Multimodal Agents for Scientific Slide Generation [26.4357968329723]
SlideGenは、科学論文をスライド生成するためのループフレームワークにおいて、エージェント的でモジュール的でビジュアルである。
ドキュメントの構造とセマンティクスを協調的に操作する視覚言語エージェントのグループを編成し、論理フローと魅力的なビジュアルプレゼンテーションを備えた編集可能なXスライドを生成する。
論文 参考訳(メタデータ) (2025-12-04T07:22:16Z) - Generating Narrated Lecture Videos from Slides with Synchronized Highlights [55.2480439325792]
本稿では,静的スライドをビデオ講義に変換するプロセスを自動化するエンド・ツー・エンドシステムを提案する。
このシステムは、動的視覚ハイライトと正確に同期されたAI生成ナレーションを特徴とするビデオ講義を合成する。
そこで本研究では,1000個のサンプルを手動でアノテートしたスライドデータセットを用いた技術評価により,システムの有効性を実証する。
論文 参考訳(メタデータ) (2025-05-05T18:51:53Z) - PASS: Presentation Automation for Slide Generation and Speech [0.0]
PASSは一般的なWord文書からスライドを生成するパイプラインである。
また、生成されたスライドのオーラル配信を自動化する。
Passはユーザ文書を分析して、AI生成音声による動的で魅力的なプレゼンテーションを生成する。
論文 参考訳(メタデータ) (2025-01-11T10:22:04Z) - PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides [51.88536367177796]
そこで本研究では,人案に触発された2段階の編集手法を提案し,プレゼンテーションを自動的に生成する。
PWTAgentはまず参照を分析し、スライドレベルの関数型とコンテンツスキーマを抽出し、選択した参照スライドに基づいて編集アクションを生成する。
PWTAgentは、既存の3次元のプレゼンテーション生成方法よりも大幅に優れています。
論文 参考訳(メタデータ) (2025-01-07T16:53:01Z) - DOC2PPT: Automatic Presentation Slides Generation from Scientific
Documents [76.19748112897177]
文書・スライド生成のための新しい課題とアプローチを提案する。
エンドツーエンドでタスクに取り組むための階層的なシーケンス・ツー・シーケンスアプローチを提案する。
提案手法では,文書やスライド内の固有構造を利用して,パラフレーズとレイアウト予測モジュールを組み込んでスライドを生成する。
論文 参考訳(メタデータ) (2021-01-28T03:21:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。