論文の概要: Learning Reactive Human Motion Generation from Paired Interaction Data Using Transformer-Based Models
- arxiv url: http://arxiv.org/abs/2604.22164v1
- Date: Fri, 24 Apr 2026 02:27:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.312274
- Title: Learning Reactive Human Motion Generation from Paired Interaction Data Using Transformer-Based Models
- Title(参考訳): 変圧器モデルを用いたペアリングインタラクションデータからの反応型ヒューマンモーション生成の学習
- Authors: Masato Soga, Ryuki Takebayashi,
- Abstract要約: 本研究は,対話シナリオにおける他者の動作に基づいて,ある人物の動作を生成する問題に対処する。
簡単なTransformer、iTransformer、Crossformerの3つのモデルを実装し比較する。
実験結果から, 簡易トランスフォーマーは姿勢崩壊に悩まされることなく, 可塑性相互作用を意識した動作を生成できることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in deep learning have enabled the generation of videos from textual descriptions as well as the prediction of future sequences from input videos. Similarly, in human motion modeling, motions can be generated from text or predicted from a single person's motion sequence. However, these approaches primarily focus on single-agent motion generation. In contrast, this study addresses the problem of generating the motion of one person based on the motion of another in interaction scenarios, where the two motions are mutually dependent. We construct a dataset of paired action-reaction motion sequences extracted from boxing match videos and investigate the effectiveness of Transformer-based models for this task. Specifically, we implement and compare three models: a simple Transformer, iTransformer, and Crossformer. In addition, we introduce a person ID embedding to explicitly distinguish between individuals, enabling the model to maintain structural consistency and better capture interaction dynamics. Experimental results show that the simple Transformer can generate plausible interaction-aware motions without suffering from posture collapse, while iTransformer and Crossformer accumulate errors over time, leading to unstable motion generation. Furthermore, the proposed person ID embedding contributes to preventing structural collapse and improving motion consistency. These results highlight the importance of explicitly modeling individual identity in interaction-aware motion generation.
- Abstract(参考訳): 近年のディープラーニングの進歩により、テキスト記述からの動画生成や、入力ビデオからの将来のシーケンスの予測が可能になった。
同様に、人間のモーションモデリングでは、動きはテキストから生成されるか、一人の人のモーションシーケンスから予測される。
しかしながら、これらのアプローチは主に単一エージェントのモーション生成に焦点を当てている。
対照的に,本研究では, 相互に依存する相互作用シナリオにおいて, 他者の動きに基づく1人の動きを生成する問題に対処する。
ボクシングマッチビデオから抽出した2組のアクション・アクション・モーション・シーケンスのデータセットを構築し,このタスクに対するトランスフォーマーモデルの有効性について検討する。
具体的には、単純なTransformer、iTransformer、Crossformerの3つのモデルを実装し比較する。
さらに,個人を明瞭に識別するために,人物IDの埋め込みを導入し,モデルが構造的整合性を維持し,相互作用のダイナミクスをよりよく捉えられるようにした。
iTransformerとCrossformerは時間とともに誤差を蓄積し、不安定な動きの発生につながる。
さらに, 提案した人物IDの埋め込みは, 構造崩壊の防止と動きの整合性の向上に寄与する。
これらの結果は、対話型動作生成における個人識別を明示的にモデル化することの重要性を強調している。
関連論文リスト
- MoReact: Generating Reactive Motion from Textual Descriptions [57.642436102978245]
MoReactは拡散に基づく手法で、グローバルな軌跡と局所的な動きを連続的に引き離すように設計されている。
2人の動作データセットから適応したデータを用いて,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-09-28T14:31:41Z) - PhysiInter: Integrating Physical Mapping for High-Fidelity Human Interaction Generation [35.563978243352764]
人間のインタラクション生成パイプライン全体に統合された物理マッピングを導入する。
具体的には、物理に基づくシミュレーション環境での運動模倣は、ターゲットの動きを物理的に有効な空間に投影するために使用される。
実験の結果,人間の運動の質は3%~89%向上した。
論文 参考訳(メタデータ) (2025-06-09T06:04:49Z) - Learning Video Generation for Robotic Manipulation with Collaborative Trajectory Control [72.00655365269]
本稿では,協調的軌跡定式化を通じてオブジェクト間ダイナミクスをモデル化する新しいフレームワークであるRoboMasterを紹介する。
オブジェクトを分解する従来の方法とは異なり、我々のコアは、相互作用プロセスを3つのサブステージ(相互作用前、相互作用後、相互作用後)に分解することである。
提案手法は既存の手法よりも優れており,ロボット操作のための軌道制御ビデオ生成における最先端性能を確立している。
論文 参考訳(メタデータ) (2025-06-02T17:57:06Z) - InterDyn: Controllable Interactive Dynamics with Video Diffusion Models [50.38647583839384]
我々は、初期フレームと駆動対象またはアクターの動作を符号化する制御信号が与えられたインタラクティブな動画像を生成するフレームワークであるInterDynを提案する。
我々の重要な洞察は、大規模なビデオ生成モデルは、大規模ビデオデータからインタラクティブなダイナミクスを学習し、ニューラルと暗黙の物理シミュレーターの両方として機能できるということです。
論文 参考訳(メタデータ) (2024-12-16T13:57:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。