論文の概要: Find the Cliffhanger: Multi-Modal Trailerness in Soap Operas
- arxiv url: http://arxiv.org/abs/2401.16076v1
- Date: Mon, 29 Jan 2024 11:34:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 15:01:26.470333
- Title: Find the Cliffhanger: Multi-Modal Trailerness in Soap Operas
- Title(参考訳): find the cliffhanger: soap operasのマルチモーダルトレーラー
- Authors: Carlo Bretti, Pascal Mettes, Hendrik Vincent Koops, Daan Odijk, Nanne
van Noord
- Abstract要約: 長大なビデオからトレーラーにふさわしい瞬間を選択する際に,編集者を支援するために,トレーラー性を予測するマルチモーダル手法を提案する。
新たに導入されたソープオペラデータセットを用いて,トレーラの予測が課題であることを示す。
- 参考スコア(独自算出の注目度): 17.476344577463525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creating a trailer requires carefully picking out and piecing together brief
enticing moments out of a longer video, making it a chal- lenging and
time-consuming task. This requires selecting moments based on both visual and
dialogue information. We introduce a multi-modal method for predicting the
trailerness to assist editors in selecting trailer- worthy moments from
long-form videos. We present results on a newly introduced soap opera dataset,
demonstrating that predicting trailerness is a challenging task that benefits
from multi-modal information. Code is available at
https://github.com/carlobretti/cliffhanger
- Abstract(参考訳): トレーラーを作るには、より長いビデオから短いエンゲージメントの瞬間を慎重に取り出してまとめる必要がある。
これは視覚情報と対話情報の両方に基づいてモーメントを選択する必要がある。
本稿では,長編ビデオからトレーラーにふさわしいモーメントを選択する際に,トレーラー性を予測するマルチモーダル手法を提案する。
新たに導入されたソープオペラデータセットに,マルチモーダル情報を利用したトレーラの予測が課題であることを示す。
コードはhttps://github.com/carlobretti/cliffhangerで入手できる。
関連論文リスト
- MovieBench: A Hierarchical Movie Level Dataset for Long Video Generation [62.85764872989189]
長いビデオ生成モデルの分析、評価、トレーニングに適したデータセットは公開されていない。
The MovieBench: A Hierarchical Movie-Level dataset for Long Video Generation。
データセットは公開され、継続的に維持され、長いビデオ生成の分野を前進させることを目的としている。
論文 参考訳(メタデータ) (2024-11-22T10:25:08Z) - TeaserGen: Generating Teasers for Long Documentaries [59.8220642722399]
1,269の文書集であるDocumentaryNetをティーザーと組み合わせて紹介する。
長文からティーザーを生成するための新しい2段階システムを提案する。
論文 参考訳(メタデータ) (2024-10-08T01:00:09Z) - MMTrail: A Multimodal Trailer Video Dataset with Language and Music Descriptions [69.9122231800796]
MMTrailは,2000万回以上のトレーラークリップと視覚的キャプションを組み込んだ大規模マルチモーダルビデオ言語データセットである。
本稿では,27.1k時間以上のトレーラービデオで様々なモダリティアノテーションを実現するシステムキャプションフレームワークを提案する。
我々のデータセットは、大きめのマルチモーダル言語モデルトレーニングのためのパスを舗装する可能性がある。
論文 参考訳(メタデータ) (2024-07-30T16:43:24Z) - Towards Automated Movie Trailer Generation [98.9854474456265]
本稿では,エンコーダ・デコーダアーキテクチャを利用したディープラーニングフレームワークTGTを紹介する。
自動回帰トレーラーデコーダは、次のトレーラーショットの特徴表現を予測する。
当社のTGTは、総合的なメトリクススイートにおいて、従来の方法よりも大幅に優れています。
論文 参考訳(メタデータ) (2024-04-04T14:28:34Z) - Film Trailer Generation via Task Decomposition [65.16768855902268]
私たちは映画をグラフとしてモデル化し、ノードはショットであり、エッジはそれらの間のセマンティックな関係を表す。
スクリーンプレイから特権的テキスト情報を活用する共同コントラストトレーニングを用いて,これらの関係を学習する。
教師なしのアルゴリズムがグラフを横切り、人間の審査員が競争的な教師付きアプローチによって生成されるトレーラーを生成する。
論文 参考訳(メタデータ) (2021-11-16T20:50:52Z) - A Case Study of Deep Learning Based Multi-Modal Methods for Predicting
the Age-Suitability Rating of Movie Trailers [15.889598494755646]
IMDBとYouTubeからダウンロードされた英語で映画トレーラーのビデオを含む新しいデータセットを提案する。
映画予告年齢適合性評価問題に対処したマルチモーダルディープラーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2021-01-26T17:15:35Z) - Learning Trailer Moments in Full-Length Movies [49.74693903050302]
我々は、正式に公開された予告編を弱い監督力として活用し、フル長の映画から重要な瞬間を検知できるモデルを学ぶ。
本稿では,映画とトレーラーのコ・アテンションを利用してトレーニングペアを生成する新しいランキングネットワークを提案する。
我々は,最初の映画トレーラデータセットを構築し,提案するコ・アテンション支援ランキングネットワークは,教師付きアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-08-19T15:23:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。