論文の概要: COMIC: Agentic Sketch Comedy Generation
- arxiv url: http://arxiv.org/abs/2603.11048v1
- Date: Wed, 11 Mar 2026 17:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:33.100922
- Title: COMIC: Agentic Sketch Comedy Generation
- Title(参考訳): COMIC:Agenic Sketch Comedy Generation
- Authors: Susung Hong, Brian Curless, Ira Kemelmacher-Shlizerman, Steve Seitz,
- Abstract要約: そこで我々は,サタデーナイトライブのようなスケッチショーに似たショートコメディビデオを生成する,完全に自動化されたAIシステムを提案する。
キャラクター参照から始めて、システムは実際のプロダクションスタジオの役割に基づいたエージェントの集団を緩やかに採用し、アイデアとアウトプットの品質と多様性を最適化する。
実験により,本フレームワークはプロが作成したスケッチの品質に近づき,映像生成における最先端の性能を実証した。
- 参考スコア(独自算出の注目度): 21.52902597339289
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a fully automated AI system that produces short comedic videos similar to sketch shows such as Saturday Night Live. Starting with character references, the system employs a population of agents loosely based on real production studio roles, structured to optimize the quality and diversity of ideas and outputs through iterative competition, evaluation, and improvement. A key contribution is the introduction of LLM critics aligned with real viewer preferences through the analysis of a corpus of comedy videos on YouTube to automatically evaluate humor. Our experiments show that our framework produces results approaching the quality of professionally produced sketches while demonstrating state-of-the-art performance in video generation.
- Abstract(参考訳): そこで我々は,サタデーナイトライブのようなスケッチショーに似たショートコメディビデオを生成する,完全に自動化されたAIシステムを提案する。
キャラクター参照から始めて、システムは実際のプロダクションスタジオの役割に基づいて緩やかにエージェントを雇い、反復的な競争、評価、改善を通じてアイデアとアウトプットの品質と多様性を最適化するために構成されている。
重要な貢献は、ユーモアを自動評価するためにYouTube上のコメディビデオのコーパスを分析して、実際の視聴者の好みに合わせたLLM批評家の導入である。
実験により,本フレームワークはプロが作成したスケッチの品質に近づき,映像生成における最先端の性能を実証した。
関連論文リスト
- FilMaster: Bridging Cinematic Principles and Generative AI for Automated Film Generation [40.91597961715311]
FilMasterは、プロ級映画制作のための現実の映画原理を統合するエンドツーエンドのAIシステムである。
我々の世代ステージでは、プロのカメラ言語を生成するためのAIをガイドするマルチショットRAGカメラ言語設計モジュールが強調されている。
撮影後段階は,映像制御モジュールを設計し,プロの映画製作をエミュレートする。
論文 参考訳(メタデータ) (2025-06-23T17:59:16Z) - AniMaker: Multi-Agent Animated Storytelling with MCTS-Driven Clip Generation [50.63646953706144]
AniMakerは、効率的なマルチ候補クリップ生成とストーリーテリング対応クリップ選択を可能にするフレームワークである。
AniMakerは、VBenchや提案したAniEvalフレームワークなど、一般的なメトリクスによって測定される、優れた品質を実現しています。
論文 参考訳(メタデータ) (2025-06-12T10:06:21Z) - Stealing Creator's Workflow: A Creator-Inspired Agentic Framework with Iterative Feedback Loop for Improved Scientific Short-form Generation [20.571381061542766]
SciTalkは、テキスト、フィギュア、ビジュアルスタイル、アバターなど、さまざまなソースで動画をグラウンド化するための新しいフレームワークである。
コンテンツクリエーターのイテレーションにインスパイアされたSciTalkは、コンテンツ要約、ビジュアルシーン計画、テキストとレイアウトの編集に特別なエージェントを使用する。
我々のフレームワークは、フィードバック駆動のビデオ生成の課題とメリットに関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2025-04-26T05:22:35Z) - Shot-by-Shot: Film-Grammar-Aware Training-Free Audio Description Generation [110.79299467093006]
ビデオ理解の基本単位として「ショット」を活用する2段階フレームワークを提案する。
これには、隣接するショットへの時間的コンテキストの拡張や、ショットスケールやスレッド構造などのフィルム文法装置の導入が含まれる。
我々の手法は、オープンソースとプロプライエタリなVisual-Language Modelsの両方と互換性がある。
論文 参考訳(メタデータ) (2025-04-01T17:59:57Z) - VideoGen-Eval: Agent-based System for Video Generation Evaluation [54.662739174367836]
ビデオ生成は、最先端のモデルを評価するのに、既存の評価システムを不十分にしている。
本稿では,コンテンツ構造化,MLLMに基づくコンテンツ判断,時空間次元のパッチツールを統合したエージェント評価システムであるVideoGen-Evalを提案する。
我々は,既存の最先端モデルを評価するためのビデオ生成ベンチマークを導入し,評価システムの有効性を検証する。
論文 参考訳(メタデータ) (2025-03-30T14:12:21Z) - CLIPVQA:Video Quality Assessment via CLIP [56.94085651315878]
VQA問題(CLIPVQA)に対する効率的なCLIPベースのトランスフォーマー手法を提案する。
提案したCLIPVQAは、新しい最先端のVQAパフォーマンスを実現し、既存のベンチマークVQAメソッドよりも最大で37%の汎用性を実現している。
論文 参考訳(メタデータ) (2024-07-06T02:32:28Z) - VLM-Eval: A General Evaluation on Video Large Language Models [16.92780012093112]
キャプション,質問と回答,検索,行動認識など,複数のビデオタスクを含む統合評価を導入する。
本稿では, 1 つの線形射影を用いて既存のビデオ LLM より優れるビデオ-LLaVA を提案する。
ビデオLLMを学術データセットを超えて評価し,数百対のビデオインストラクションペアのみを微調整で駆動シナリオの認識と推論能力を示す。
論文 参考訳(メタデータ) (2023-11-20T16:02:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。