論文の概要: CamCloneMaster: Enabling Reference-based Camera Control for Video Generation
- arxiv url: http://arxiv.org/abs/2506.03140v1
- Date: Tue, 03 Jun 2025 17:59:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.986177
- Title: CamCloneMaster: Enabling Reference-based Camera Control for Video Generation
- Title(参考訳): CamCloneMaster:ビデオ生成のための参照型カメラ制御の実現
- Authors: Yawen Luo, Jianhong Bai, Xiaoyu Shi, Menghan Xia, Xintao Wang, Pengfei Wan, Di Zhang, Kun Gai, Tianfan Xue,
- Abstract要約: CamCloneMasterは、カメラパラメータやテストタイムの微調整を必要とせずに、リファレンスビデオからカメラの動きを再現できるフレームワークである。
本稿では,カメラクローン学習のための大規模合成データセットについて述べる。
- 参考スコア(独自算出の注目度): 39.68297612349062
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Camera control is crucial for generating expressive and cinematic videos. Existing methods rely on explicit sequences of camera parameters as control conditions, which can be cumbersome for users to construct, particularly for intricate camera movements. To provide a more intuitive camera control method, we propose CamCloneMaster, a framework that enables users to replicate camera movements from reference videos without requiring camera parameters or test-time fine-tuning. CamCloneMaster seamlessly supports reference-based camera control for both Image-to-Video and Video-to-Video tasks within a unified framework. Furthermore, we present the Camera Clone Dataset, a large-scale synthetic dataset designed for camera clone learning, encompassing diverse scenes, subjects, and camera movements. Extensive experiments and user studies demonstrate that CamCloneMaster outperforms existing methods in terms of both camera controllability and visual quality.
- Abstract(参考訳): カメラ制御は、表現力と撮影力のあるビデオを生成するのに不可欠である。
既存の方法は、カメラパラメータの明示的なシーケンスを制御条件として頼りにしており、特に複雑なカメラの動きのために、ユーザが構築するのが面倒である。
より直感的なカメラ制御方法として,カメラパラメータやテストタイムの微調整を必要とせずに,参照ビデオからカメラの動きを再現するフレームワークCamCloneMasterを提案する。
CamCloneMasterは、統合されたフレームワーク内でImage-to-VideoタスクとVideo-to-Videoタスクの両方に対して、参照ベースのカメラコントロールをシームレスにサポートする。
さらに、カメラクローンデータセット(Camera Clone Dataset)は、カメラクローン学習用に設計された大規模な合成データセットであり、多様なシーン、主題、カメラの動きを含む。
大規模な実験とユーザスタディにより、CamCloneMasterは、カメラの制御性と視覚的品質の両方において、既存の手法よりも優れていることが示されている。
関連論文リスト
- OmniCam: Unified Multimodal Video Generation via Camera Control [42.94206239207397]
カメラの位置やポーズを変えることで多様な視覚効果を実現するカメラ制御は、広く注目を集めている。
既存の手法は複雑な相互作用や限定的な制御能力といった課題に直面している。
我々は、誘導時間的に一貫したビデオを生成する統合カメラフレームワークであるOmniCamを紹介する。
論文 参考訳(メタデータ) (2025-04-03T06:38:30Z) - VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control [74.5434726968562]
制御ネットライクなコンディショニング機構を用いて3次元カメラ制御のためのトランスフォーマー映像の改ざん方法を示す。
我々の研究は、トランスフォーマーに基づくビデオ拡散モデルのカメラ制御を可能にする最初のものである。
論文 参考訳(メタデータ) (2024-07-17T17:59:05Z) - MotionMaster: Training-free Camera Motion Transfer For Video Generation [48.706578330771386]
本稿では,映像中のカメラの動きと物体の動きをアンハングリングする,トレーニング不要な動画移動モデルを提案する。
我々のモデルは、効果的にカメラオブジェクトの動きを分離し、分離されたカメラの動きを広範囲の制御可能なビデオ生成タスクに適用することができる。
論文 参考訳(メタデータ) (2024-04-24T10:28:54Z) - CameraCtrl: Enabling Camera Control for Text-to-Video Generation [86.36135895375425]
ユーザーがコンテンツをより正確に作成し、編集できるようにするため、制御性はビデオ生成において重要な役割を果たす。
しかし、既存のモデルは、より深い物語のニュアンスを表現するための映画言語として機能するカメラポーズの制御を欠いている。
我々は、ビデオ拡散モデルの正確なカメラポーズ制御を可能にするCameraCtrlを紹介する。
論文 参考訳(メタデータ) (2024-04-02T16:52:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。