論文の概要: Slide2Text: Leveraging LLMs for Personalized Textbook Generation from PowerPoint Presentations
- arxiv url: http://arxiv.org/abs/2503.17710v1
- Date: Sat, 22 Mar 2025 09:42:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:34:30.374826
- Title: Slide2Text: Leveraging LLMs for Personalized Textbook Generation from PowerPoint Presentations
- Title(参考訳): Slide2Text:PowerPointプレゼンテーションからパーソナライズされたテキスト生成にLLMを活用する
- Authors: Yizhou Zhou,
- Abstract要約: 本稿ではPowerPointのプレゼンテーションをカスタマイズした教科書に変換するシステムであるSlide2Textを紹介する。
OCRを用いてスライドコンテンツを抽出し、コヒーレントな構造に整理し、説明、エクササイズ、参照などの調整された資料を生成することにより、Slide2Textは教科書作成プロセスを合理化する。
- 参考スコア(独自算出の注目度): 3.868956529565916
- License:
- Abstract: The rapid advancements in Large Language Models (LLMs) have revolutionized educational technology, enabling innovative approaches to automated and personalized content creation. This paper introduces Slide2Text, a system that leverages LLMs to transform PowerPoint presentations into customized textbooks. By extracting slide content using OCR, organizing it into a coherent structure, and generating tailored materials such as explanations, exercises, and references, Slide2Text streamlines the textbook creation process. Flexible customization options further enhance its adaptability to diverse educational needs. The system highlights the potential of LLMs in modernizing textbook creation and improving educational accessibility. Future developments will explore multimedia inputs and advanced user customization features.
- Abstract(参考訳): LLM(Large Language Models)の急速な進歩は教育技術に革命をもたらし、自動化およびパーソナライズされたコンテンツ作成に対する革新的なアプローチを可能にした。
本稿では,LLMを利用してPowerPointのプレゼンテーションをカスタマイズした教科書に変換するシステムであるSlide2Textを紹介する。
OCRを用いてスライドコンテンツを抽出し、コヒーレントな構造に整理し、説明、エクササイズ、参照などの調整された資料を生成することにより、Slide2Textは教科書作成プロセスを合理化する。
柔軟なカスタマイズオプションにより、多様な教育ニーズへの適応性がさらに向上する。
このシステムは、教科書作成の近代化と教育的アクセシビリティ向上におけるLLMの可能性を強調している。
今後,マルチメディア入力と高度なユーザカスタマイズ機能について検討する予定である。
関連論文リスト
- Instruction-Guided Editing Controls for Images and Multimedia: A Survey in LLM era [50.19334853510935]
命令ベースの編集の最近の進歩は、ユーザ意図と複雑な編集操作の間の橋渡しとして自然言語を用いて、視覚コンテンツとの直感的な対話を可能にしている。
我々は,エンターテイメントから教育に至るまで,様々な産業において強力なビジュアル編集を民主化することを目指している。
論文 参考訳(メタデータ) (2024-11-15T05:18:15Z) - LLM2CLIP: Powerful Language Model Unlocks Richer Visual Representation [60.02145113467427]
この作業では、大規模な言語モデルと事前訓練されたCLIPビジュアルエンコーダを統合する、微調整のアプローチを導入している。
LLMの自己回帰的性質の課題に対処するために,キャプション・トゥ・キャプション・トゥ・キャプション・トゥ・コントラッシブ・ラーニング・フレームワークを提案する。
提案手法は,様々な下流タスクにおいて,大幅な性能向上を実現する。
論文 参考訳(メタデータ) (2024-11-07T18:59:16Z) - Awaking the Slides: A Tuning-free and Knowledge-regulated AI Tutoring System via Language Model Coordination [52.20542825755132]
Slide2Lectureは、チューニング不要で知識を制御した知的チューリングシステムである。
入力された講義スライドを、不均一な教育行為の集合からなる構造化された教育課題に効果的に変換することができる。
教師や開発者にとって、Slide2Lectureはパーソナライズされた要求に対応するカスタマイズを可能にする。
論文 参考訳(メタデータ) (2024-09-11T16:03:09Z) - Visual Prompting in Multimodal Large Language Models: A Survey [95.75225825537528]
MLLM(Multimodal large language model)は、視覚機能を備えた事前訓練された多言語モデル(LLM)である。
ビジュアルプロンプトはよりきめ細かな自由形式のビジュアルインストラクションのために現れた。
本稿では,視覚的プロンプト,即時生成,構成的推論,即時学習に焦点をあてる。
論文 参考訳(メタデータ) (2024-09-05T08:47:34Z) - DocLayLLM: An Efficient Multi-modal Extension of Large Language Models for Text-rich Document Understanding [40.38251904765156]
テキストリッチ文書理解(TDU)では,テキストの内容や複雑なレイアウトを含む文書を包括的に分析する必要がある。
本稿では,TDUに特化して設計されたマルチモーダル言語モデル(MLLM)の効率的なマルチモーダル拡張であるDocLayLLMを紹介する。
論文 参考訳(メタデータ) (2024-08-27T13:13:38Z) - SPELL: Semantic Prompt Evolution based on a LLM [5.983194751474721]
大規模言語モデル(LLM)はトークンによって一貫性のあるテキストトークンを生成する強力な能力を持つ。
本研究では,テキストの自動最適化のためのブラックボックス進化アルゴリズム,SPELLを提案する。
実験の結果,SPELLはプロンプトを急速に改善できることがわかった。
論文 参考訳(メタデータ) (2023-10-02T14:51:16Z) - Multimodal Lecture Presentations Dataset: Understanding Multimodality in
Educational Slides [57.86931911522967]
学習内容のマルチモーダル理解における機械学習モデルの能力を検証する。
このデータセットには,180時間以上のビデオと9000時間以上のスライドが,各科目から10人の講師が参加している。
マルチモーダル・トランスフォーマーであるPolyViLTを導入する。
論文 参考訳(メタデータ) (2022-08-17T05:30:18Z) - AI based Presentation Creator With Customized Audio Content Delivery [0.0]
本稿では,機械学習(ML)アルゴリズムと自然言語処理(NLP)モジュールを用いて,文書からスライドベースのプレゼンテーションを作成するプロセスを自動化することを目的とする。
次に、最先端の音声クローンモデルを使用して、希望する著者の声にコンテンツを配信します。
論文 参考訳(メタデータ) (2021-06-27T12:17:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。