論文の概要: Towards Automated Movie Trailer Generation
- arxiv url: http://arxiv.org/abs/2404.03477v1
- Date: Thu, 4 Apr 2024 14:28:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-05 14:31:56.729221
- Title: Towards Automated Movie Trailer Generation
- Title(参考訳): 映画トレーサの自動生成に向けて
- Authors: Dawit Mureja Argaw, Mattia Soldan, Alejandro Pardo, Chen Zhao, Fabian Caba Heilbron, Joon Son Chung, Bernard Ghanem,
- Abstract要約: 本稿では,エンコーダ・デコーダアーキテクチャを利用したディープラーニングフレームワークTGTを紹介する。
自動回帰トレーラーデコーダは、次のトレーラーショットの特徴表現を予測する。
当社のTGTは、総合的なメトリクススイートにおいて、従来の方法よりも大幅に優れています。
- 参考スコア(独自算出の注目度): 98.9854474456265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Movie trailers are an essential tool for promoting films and attracting audiences. However, the process of creating trailers can be time-consuming and expensive. To streamline this process, we propose an automatic trailer generation framework that generates plausible trailers from a full movie by automating shot selection and composition. Our approach draws inspiration from machine translation techniques and models the movies and trailers as sequences of shots, thus formulating the trailer generation problem as a sequence-to-sequence task. We introduce Trailer Generation Transformer (TGT), a deep-learning framework utilizing an encoder-decoder architecture. TGT movie encoder is tasked with contextualizing each movie shot representation via self-attention, while the autoregressive trailer decoder predicts the feature representation of the next trailer shot, accounting for the relevance of shots' temporal order in trailers. Our TGT significantly outperforms previous methods on a comprehensive suite of metrics.
- Abstract(参考訳): 映画の予告編は映画を宣伝し、観客を惹きつけるのに欠かせない道具である。
しかし、トレーラーの製作には時間と費用がかかる。
このプロセスを合理化するために,撮影選択と合成の自動化により,全作品から可塑性トレーラを生成する自動トレーラ生成フレームワークを提案する。
提案手法は,映画やトレーラーを映像のシーケンスとしてモデル化する機械翻訳技術からインスピレーションを得て,トレーラー生成問題をシークエンス・ツー・シークエンス・タスクとして定式化する。
本稿では,エンコーダ・デコーダアーキテクチャを利用したディープラーニングフレームワークTGTを紹介する。
TGTフィルムエンコーダは、自動回帰トレーラーデコーダが、トレーラーにおけるショットの時間的順序の関連性を考慮して、次のトレーラーショットの特徴表現を予測する。
当社のTGTは、総合的なメトリクススイートにおいて、従来の方法よりも大幅に優れています。
関連論文リスト
- ScreenWriter: Automatic Screenplay Generation and Movie Summarisation [55.20132267309382]
ビデオコンテンツは、ユーザーがキープロットポイントをリコールしたり、見ずに概要を見ることができるようなテキスト記述や要約の需要を駆り立ててきた。
本稿では,映像のみを操作し,対話,話者名,シーンブレーク,視覚的記述を含む出力を生成するScreenWriterを提案する。
ScreenWriterは、映像を視覚ベクトルのシーケンスに基づいてシーンに分割する新しいアルゴリズムを導入し、アクターの顔のデータベースに基づく文字名決定の難しい問題に対する新しい方法を提案する。
論文 参考訳(メタデータ) (2024-10-17T07:59:54Z) - MovieDreamer: Hierarchical Generation for Coherent Long Visual Sequence [62.72540590546812]
MovieDreamerは、自己回帰モデルの強みと拡散ベースのレンダリングを統合する、新しい階層的なフレームワークである。
様々な映画ジャンルにまたがって実験を行い、そのアプローチが優れた視覚的・物語的品質を実現することを示す。
論文 参考訳(メタデータ) (2024-07-23T17:17:05Z) - Movie101v2: Improved Movie Narration Benchmark [53.54176725112229]
映像の自動ナレーションは、視覚障害者を支援するために、映像に合わせたプロット記述を生成することを目的としている。
映画ナレーションに特化して設計されたデータ品質を向上した大規模バイリンガルデータセットであるMovie101v2を紹介する。
新しいベンチマークに基づいて,GPT-4Vを含む多数の視覚言語モデルをベースライン化し,ナレーション生成における課題の詳細な分析を行う。
論文 参考訳(メタデータ) (2024-04-20T13:15:27Z) - Find the Cliffhanger: Multi-Modal Trailerness in Soap Operas [17.476344577463525]
長大なビデオからトレーラーにふさわしい瞬間を選択する際に,編集者を支援するために,トレーラー性を予測するマルチモーダル手法を提案する。
新たに導入されたソープオペラデータセットを用いて,トレーラの予測が課題であることを示す。
論文 参考訳(メタデータ) (2024-01-29T11:34:36Z) - AI based approach to Trailer Generation for Online Educational Courses [0.0]
提案するフレームワークは,ビデオトレーラ生成のためのテンプレートベースの手法である。
提案したトレーラーは、コンテンツの選択、パラフレーズ化、生成によって生成される様々なフラグメントからなるタイムラインの形式である。
我々は,63人の評価者を用いて,システムによって生成されたトレーラの評価を行う。
論文 参考訳(メタデータ) (2023-01-10T13:33:08Z) - Film Trailer Generation via Task Decomposition [65.16768855902268]
私たちは映画をグラフとしてモデル化し、ノードはショットであり、エッジはそれらの間のセマンティックな関係を表す。
スクリーンプレイから特権的テキスト情報を活用する共同コントラストトレーニングを用いて,これらの関係を学習する。
教師なしのアルゴリズムがグラフを横切り、人間の審査員が競争的な教師付きアプローチによって生成されるトレーラーを生成する。
論文 参考訳(メタデータ) (2021-11-16T20:50:52Z) - A Case Study of Deep Learning Based Multi-Modal Methods for Predicting
the Age-Suitability Rating of Movie Trailers [15.889598494755646]
IMDBとYouTubeからダウンロードされた英語で映画トレーラーのビデオを含む新しいデータセットを提案する。
映画予告年齢適合性評価問題に対処したマルチモーダルディープラーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2021-01-26T17:15:35Z) - Learning Trailer Moments in Full-Length Movies [49.74693903050302]
我々は、正式に公開された予告編を弱い監督力として活用し、フル長の映画から重要な瞬間を検知できるモデルを学ぶ。
本稿では,映画とトレーラーのコ・アテンションを利用してトレーニングペアを生成する新しいランキングネットワークを提案する。
我々は,最初の映画トレーラデータセットを構築し,提案するコ・アテンション支援ランキングネットワークは,教師付きアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-08-19T15:23:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。