Fugu-MT 論文翻訳(概要): AnimateLCM: Computation-Efficient Personalized Style Video Generation without Personalized Video Data

論文の概要: AnimateLCM: Computation-Efficient Personalized Style Video Generation without Personalized Video Data

arxiv url: http://arxiv.org/abs/2402.00769v3
Date: Wed, 16 Oct 2024 04:53:55 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:30.510532
Title: AnimateLCM: Computation-Efficient Personalized Style Video Generation without Personalized Video Data
Title（参考訳）: AnimateLCM:パーソナライズされたビデオデータのない計算効率の良いパーソナライズされたスタイルのビデオ生成
Authors: Fu-Yun Wang, Zhaoyang Huang, Weikang Bian, Xiaoyu Shi, Keqiang Sun, Guanglu Song, Yu Liu, Hongsheng Li,
Abstract要約: 同様のサイズのビデオ拡散モデルの必要な生成時間を25秒から1秒程度に短縮する。この手法の有効性は、二重レベルデカップリング学習アプローチにある。
参考スコア（独自算出の注目度）: 45.20627288830823
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper introduces an effective method for computation-efficient personalized style video generation without requiring access to any personalized video data. It reduces the necessary generation time of similarly sized video diffusion models from 25 seconds to around 1 second while maintaining the same level of performance. The method's effectiveness lies in its dual-level decoupling learning approach: 1) separating the learning of video style from video generation acceleration, which allows for personalized style video generation without any personalized style video data, and 2) separating the acceleration of image generation from the acceleration of video motion generation, enhancing training efficiency and mitigating the negative effects of low-quality video data.
Abstract（参考訳）: 本稿では、パーソナライズされたビデオデータにアクセスすることなく、計算効率の良いパーソナライズされたビデオ生成方法を提案する。同様の大きさの動画拡散モデルの必要な生成時間を、同じレベルの性能を維持しながら25秒から1秒程度に短縮する。この方法の有効性は、二重レベルデカップリング学習アプローチにある。 1)パーソナライズされたスタイルのビデオデータなしで、パーソナライズされたスタイルのビデオ生成を可能にするビデオ生成アクセラレーションからビデオスタイルの学習を分離し、 2)映像生成の加速と映像生成の加速を分離し,訓練効率を向上し,低品質映像データの負の効果を緩和する。

関連論文リスト

Subject-driven Video Generation via Disentangled Identity and Motion [52.54835936914813]
本稿では,ゼロショットにおける時間的ダイナミクスから被験者固有の学習を分離し,追加のチューニングを伴わずに,主題駆動のカスタマイズビデオ生成モデルを訓練することを提案する。提案手法は、ゼロショット設定で既存のビデオカスタマイズモデルよりも優れた、強力な被写体整合性とスケーラビリティを実現する。
論文参考訳（メタデータ） (2025-04-23T06:48:31Z)
Whats in a Video: Factorized Autoregressive Decoding for Online Dense Video Captioning [71.94122309290537]
ビデオの高密度キャプションを生成するための,効率的なオンライン手法を提案する。我々のモデルは、新しい自己回帰因子化復号化アーキテクチャを使用している。提案手法は,オフライン手法とオンライン手法の両方と比較して優れた性能を示し,計算コストを20%削減する。
論文参考訳（メタデータ） (2024-11-22T02:46:44Z)
Movie Gen: A Cast of Media Foundation Models [133.41504332082667]
高品質の1080pHDビデオを生成する基礎モデルのキャストであるMovie Genについて紹介する。ユーザの画像に基づいて,高精度な命令ベースのビデオ編集やパーソナライズされたビデオの生成などの追加機能を示す。
論文参考訳（メタデータ） (2024-10-17T16:22:46Z)
DreamVideo: Composing Your Dream Videos with Customized Subject and Motion [52.7394517692186]
対象の静的画像からパーソナライズされたビデオを生成する新しいアプローチであるDreamVideoを紹介します。 DreamVideoは、このタスクを、トレーニング済みのビデオ拡散モデルを活用することによって、主観学習とモーション学習の2つの段階に分離する。モーション学習では、対象のモーションパターンを効果的にモデル化するために、モーションアダプタを設計し、所定のビデオに微調整する。
論文参考訳（メタデータ） (2023-12-07T16:57:26Z)
InstructVid2Vid: Controllable Video Editing with Natural Language Instructions [97.17047888215284]
InstructVid2Vidは、人間の言語命令でガイドされたビデオ編集のためのエンドツーエンドの拡散ベースの方法論である。我々のアプローチは、自然言語ディレクティブによって案内される映像操作を強化し、サンプルごとの微調整や逆変換の必要性を排除します。
論文参考訳（メタデータ） (2023-05-21T03:28:13Z)
Style-A-Video: Agile Diffusion for Arbitrary Text-based Video Style Transfer [13.098901971644656]
本稿では,Style-A-Video というゼロショットビデオスタイリング手法を提案する。画像遅延拡散モデルを用いた生成事前学習型トランスフォーマーを用いて、簡潔なテキスト制御ビデオスタイリングを実現する。テストの結果,従来のソリューションよりも少ない使用量で,優れたコンテンツ保存とスタイリスティックな性能が得られることがわかった。
論文参考訳（メタデータ） (2023-05-09T14:03:27Z)
Video Generation Beyond a Single Clip [76.5306434379088]
ビデオ生成モデルは、実際のビデオの長さと比較して比較的短いビデオクリップしか生成できない。多様なコンテンツや複数のイベントをカバーした長いビデオを生成するために,ビデオ生成プロセスを制御するための追加のガイダンスを提案する。提案手法は、固定時間ウィンドウ内でリアルな映像を生成することに焦点を当てた、既存の映像生成の取り組みを補完するものである。
論文参考訳（メタデータ） (2023-04-15T06:17:30Z)
Diverse Generation from a Single Video Made Possible [24.39972895902724]
本稿では,1つの自然なビデオから映像を生成し,操作するための高速で実用的な方法を提案する。本手法は,シングルビデオGANよりもリアルで高品質な結果を生成する。
論文参考訳（メタデータ） (2021-09-17T15:12:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。