論文の概要: Slide Deck Q&A Quality Assurance App: A Multi-Stage Pipeline for Pedagogical Question Generation
- arxiv url: http://arxiv.org/abs/2605.26428v2
- Date: Wed, 27 May 2026 22:26:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:54.734625
- Title: Slide Deck Q&A Quality Assurance App: A Multi-Stage Pipeline for Pedagogical Question Generation
- Title(参考訳): Slide Deck Q&A品質保証アプリ: 教育的質問生成のための多段階パイプライン
- Authors: Jim Salsman,
- Abstract要約: 本稿では,PDFスライドからテキストや描画画像を抽出するFlaskベースのソフトウェアシステムであるSlide Deck Q&A Quality Assurance(slidesqaqa)について述べる。
このシステムは、スライドのモダリティと教育的役割を共同で考慮し、予算を割り当て、デッキのレベルを変更して冗長性を低減し、カバレッジを向上させる。
最初の実験は、パイプラインが非教育的なスライドをフィルタリングし、視覚的に複雑なコンテンツに対して、教育的に一貫性のある質問を生成できることを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating high-quality, pedagogically useful questions from lecture slide decks is difficult because important instructional content is distributed across both text and visual elements, and because useful questions must be scaffolded across the flow of a presentation rather than generated slide by slide in isolation. This paper describes Slide Deck Q\&A Quality Assurance (slidesqaqa), a Flask-based software system that extracts text and rendered images from PDF slides and processes them through a four-stage large language model pipeline comprising window planning, deck synthesis, slide annotation, and reconciliation. The system reasons jointly about slide modality and pedagogical role, allocates bounded question budgets, and revises draft annotations at the deck level to reduce redundancy and improve coverage. The final output is a structured JSON annotation containing deck-level goals, section structure, slide-level summaries, question sets, and evaluation scores. Initial experiments on two technical lecture decks indicate that the pipeline can filter non-instructional slides and produce high-fidelity, pedagogically coherent questions for visually complex content. The working system is at https://slidesqaqa-974767694043.us-west1.run.app The software repository is at https://github.com/blinding2submit/slidesqaqa
- Abstract(参考訳): 講義スライドから高品質で教育学的に有用な質問を生成することは、重要な指導内容がテキストと視覚要素の両方に分散しているため困難である。
Slide Deck Q\&A Quality Assurance (slidesqaqa)は、PDFスライドからテキストや描画画像を抽出し、ウィンドウ計画、デッキ合成、スライドアノテーション、和解を含む4段階の大規模言語モデルパイプラインを通して処理するフラスコベースのソフトウェアシステムである。
このシステムでは、スライドのモダリティと教育的役割を共同で考慮し、限定された質問予算を割り当て、デッキレベルでドラフトアノテーションを改訂し、冗長性を低減し、カバレッジを向上させる。
最後の出力は、デッキレベルの目標、セクション構造、スライドレベルの要約、質問セット、評価スコアを含む構造化JSONアノテーションである。
2つの技術的講義デッキでの初期の実験は、パイプラインが非教育的なスライドをフィルタリングし、視覚的に複雑なコンテンツに対して、高忠実で円滑な質問を生成することを示唆している。
動作するシステムはhttps://slidesqaqa-974767694043.us-west1.run.app ソフトウェアリポジトリはhttps://github.com/blinding2submit/slidesqaqaにある。
関連論文リスト
- Attend to what I say: Highlighting relevant content on slides [15.282453684375293]
本稿では,話者の物語に基づいて,最も関連性の高いスライド領域を自動的に識別し,ハイライトする手法を提案する。
音声コンテンツを解析し、スライド内のテキストまたはグラフィカル要素とマッチングすることにより、我々のアプローチはリスナーが聞くものと出席するために必要なものとの同期性を向上する。
論文 参考訳(メタデータ) (2026-01-15T10:04:59Z) - SlideGen: Collaborative Multimodal Agents for Scientific Slide Generation [26.4357968329723]
SlideGenは、科学論文をスライド生成するためのループフレームワークにおいて、エージェント的でモジュール的でビジュアルである。
ドキュメントの構造とセマンティクスを協調的に操作する視覚言語エージェントのグループを編成し、論理フローと魅力的なビジュアルプレゼンテーションを備えた編集可能なXスライドを生成する。
論文 参考訳(メタデータ) (2025-12-04T07:22:16Z) - BOOM: Beyond Only One Modality KIT's Multimodal Multilingual Lecture Companion [56.41649972542962]
講義音声とスライドを共同で翻訳し、3つのモードで同期出力を生成する多言語講義コンパニオンである textbfBOOM を提示する。
実験により,スライド対応文字起こしは,要約や質問応答といった下流タスクにカスケード効果をもたらすことが示された。
論文 参考訳(メタデータ) (2025-12-02T14:27:26Z) - VLM-SlideEval: Evaluating VLMs on Structured Comprehension and Perturbation Sensitivity in PPT [0.0]
視覚言語モデル(VLM)は、プレゼンテーションスライドを含むマルチモーダルコンテンツの評価にますます利用されているが、スライド固有の理解はいまだ探索されていない。
VLM-SlideEvalは,(1)真実に整合したスライド画像からの要素レベル抽出,(2)幾何学,スタイル,テキストの摂動制御,(3)シャッフルスライドからデッキの物語順を復元するなど,3つの軸に沿ってVLMを探索する評価フレームワークである。
論文 参考訳(メタデータ) (2025-10-24T22:06:56Z) - Paper2Video: Automatic Video Generation from Scientific Papers [62.634562246594555]
Paper2Videoは、著者が作成したプレゼンテーションビデオ、スライド、スピーカーメタデータと組み合わせた101の研究論文の最初のベンチマークである。
そこで我々は,学術プレゼンテーションビデオ生成のための最初のマルチエージェントフレームワークであるPaperTalkerを提案する。
論文 参考訳(メタデータ) (2025-10-06T17:58:02Z) - Generating Narrated Lecture Videos from Slides with Synchronized Highlights [55.2480439325792]
本稿では,静的スライドをビデオ講義に変換するプロセスを自動化するエンド・ツー・エンドシステムを提案する。
このシステムは、動的視覚ハイライトと正確に同期されたAI生成ナレーションを特徴とするビデオ講義を合成する。
そこで本研究では,1000個のサンプルを手動でアノテートしたスライドデータセットを用いた技術評価により,システムの有効性を実証する。
論文 参考訳(メタデータ) (2025-05-05T18:51:53Z) - SlideSpawn: An Automatic Slides Generation System for Research Publications [0.0]
本稿では,研究資料のPDFを入力とし,質の高いプレゼンテーションを生成する新しいシステムであるSlideSpwanを提案する。
PS5KデータセットとAminer 9.5K Insightsデータセットに基づいてトレーニングされた機械学習モデルを使用して、論文の各文のサリエンスを予測する。
650対の論文とスライドによるテストセットの実験により,本システムがより良い品質のプレゼンテーションを生成することを示す。
論文 参考訳(メタデータ) (2024-11-20T18:16:16Z) - Awaking the Slides: A Tuning-free and Knowledge-regulated AI Tutoring System via Language Model Coordination [52.20542825755132]
Slide2Lectureは、チューニング不要で知識を制御した知的チューリングシステムである。
入力された講義スライドを、不均一な教育行為の集合からなる構造化された教育課題に効果的に変換することができる。
教師や開発者にとって、Slide2Lectureはパーソナライズされた要求に対応するカスタマイズを可能にする。
論文 参考訳(メタデータ) (2024-09-11T16:03:09Z) - Multimodal Lecture Presentations Dataset: Understanding Multimodality in
Educational Slides [57.86931911522967]
学習内容のマルチモーダル理解における機械学習モデルの能力を検証する。
このデータセットには,180時間以上のビデオと9000時間以上のスライドが,各科目から10人の講師が参加している。
マルチモーダル・トランスフォーマーであるPolyViLTを導入する。
論文 参考訳(メタデータ) (2022-08-17T05:30:18Z) - DOC2PPT: Automatic Presentation Slides Generation from Scientific
Documents [76.19748112897177]
文書・スライド生成のための新しい課題とアプローチを提案する。
エンドツーエンドでタスクに取り組むための階層的なシーケンス・ツー・シーケンスアプローチを提案する。
提案手法では,文書やスライド内の固有構造を利用して,パラフレーズとレイアウト予測モジュールを組み込んでスライドを生成する。
論文 参考訳(メタデータ) (2021-01-28T03:21:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。