論文の概要: MoRight: Motion Control Done Right
- arxiv url: http://arxiv.org/abs/2604.07348v1
- Date: Wed, 08 Apr 2026 17:59:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.672782
- Title: MoRight: Motion Control Done Right
- Title(参考訳): MoRight:モーションコントロールが正しい
- Authors: Shaowei Liu, Xuanchi Ren, Tianchang Shen, Huan Ling, Saurabh Gupta, Shenlong Wang, Sanja Fidler, Jun Gao,
- Abstract要約: 両制約に対処する統合フレームワークであるMoRightを紹介した。
オブジェクトの動きは標準静的ビューで指定され、任意のターゲットカメラ視点に転送される。
3つのベンチマークの実験では、生成品質、動作制御性、相互作用認識における最先端のパフォーマンスが示されている。
- 参考スコア(独自算出の注目度): 71.36903230523589
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating motion-controlled videos--where user-specified actions drive physically plausible scene dynamics under freely chosen viewpoints--demands two capabilities: (1) disentangled motion control, allowing users to separately control the object motion and adjust camera viewpoint; and (2) motion causality, ensuring that user-driven actions trigger coherent reactions from other objects rather than merely displacing pixels. Existing methods fall short on both fronts: they entangle camera and object motion into a single tracking signal and treat motion as kinematic displacement without modeling causal relationships between object motion. We introduce MoRight, a unified framework that addresses both limitations through disentangled motion modeling. Object motion is specified in a canonical static-view and transferred to an arbitrary target camera viewpoint via temporal cross-view attention, enabling disentangled camera and object control. We further decompose motion into active (user-driven) and passive (consequence) components, training the model to learn motion causality from data. At inference, users can either supply active motion and MoRight predicts consequences (forward reasoning), or specify desired passive outcomes and MoRight recovers plausible driving actions (inverse reasoning), all while freely adjusting the camera viewpoint. Experiments on three benchmarks demonstrate state-of-the-art performance in generation quality, motion controllability, and interaction awareness.
- Abstract(参考訳): 動作制御ビデオの生成 - ユーザが指定したアクションが、自由選択された視点下で物理的に可塑性なシーンダイナミクスを駆動する - 1) ゆがみのあるモーションコントロール、ユーザが別々にオブジェクトの動きを制御し、カメラの視点を調整できる機能、(2) 動作因果性、そして、ユーザーが駆動するアクションが、単にピクセルを分解するのではなく、他のオブジェクトからのコヒーレントな反応を引き起こすことを保証する。
既存の方法は、カメラと物体の動きを単一の追跡信号に絡めて、物体の動き間の因果関係をモデル化することなく運動を運動運動として扱う。
両制約に対処する統合フレームワークであるMoRightを紹介した。
物体の動きは標準静的ビューで指定され、時間的クロスビューの注意を通して任意の目標カメラ視点に移動される。
さらに、動作をアクティブな(ユーザ主導)および受動的(コンシークエンス)コンポーネントに分解し、データから動作因果性を学ぶためのモデルを訓練する。
推論では、アクティブな動作を提供し、MoRightは結果(前方推論)を予測するか、望ましい受動的結果を指定するか、MoRightは、カメラの視点を自由に調整しながら、妥当な駆動動作(逆推論)を回復する。
3つのベンチマークの実験では、生成品質、動作制御性、相互作用認識における最先端のパフォーマンスが示されている。
関連論文リスト
- MotionPro: A Precise Motion Controller for Image-to-Video Generation [108.63100943070592]
我々は、画像間(I2V)生成のための正確なモーションコントローラであるMotionProを提案する。
局所軌道と運動マスクは、微細な運動合成を制御するために用いられる。
WebVid-10MとMC-Benchで行った実験は、MotionProの有効性を実証している。
論文 参考訳(メタデータ) (2025-05-26T17:59:03Z) - C-Drag: Chain-of-Thought Driven Motion Controller for Video Generation [81.4106601222722]
トラジェクティブに基づくモーションコントロールは、制御可能なビデオ生成のための直感的で効率的なアプローチとして登場した。
我々はC-Dragという制御可能なビデオ生成のためのチェーン・オブ・ソート型モーションコントローラを提案する。
本手法は,物体認識モジュールとChain-of-Thoughtベースの動作推論モジュールを含む。
論文 参考訳(メタデータ) (2025-02-27T08:21:03Z) - Direct-a-Video: Customized Video Generation with User-Directed Camera Movement and Object Motion [34.404342332033636]
我々は、カメラのパンやズームの動きだけでなく、複数のオブジェクトのモーションを独立して指定できるシステムであるDirect-a-Videoを紹介した。
カメラの動きの定量的なパラメータを解釈するために,新しい時間的クロスアテンション層を導入する。
どちらのコンポーネントも独立して動作し、個別または複合的な制御を可能にし、オープンドメインシナリオに一般化することができる。
論文 参考訳(メタデータ) (2024-02-05T16:30:57Z) - MotionCtrl: A Unified and Flexible Motion Controller for Video Generation [77.09621778348733]
ビデオ中の動きは、主にカメラの動きによって誘導されるカメラの動きと、物体の動きによって生じる物体の動きから成り立っている。
本稿では,カメラと物体の動きを効果的かつ独立に制御するビデオ生成用統合モーションコントローラであるMotionCtrlを提案する。
論文 参考訳(メタデータ) (2023-12-06T17:49:57Z) - MotionZero:Exploiting Motion Priors for Zero-shot Text-to-Video
Generation [131.1446077627191]
ゼロショットのテキスト・トゥ・ビデオ合成は、ビデオなしでプロンプトに基づいてビデオを生成する。
本研究では,MotionZeroと命名されたプロンプト適応型・アンタングル型モーションコントロール戦略を提案する。
我々の戦略は、異なるオブジェクトの動きを正しく制御し、ゼロショットビデオ編集を含む多目的アプリケーションをサポートする。
論文 参考訳(メタデータ) (2023-11-28T09:38:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。