論文の概要: MotionPyramid: Hierarchical Motion Representation and Residual Interfaces
- arxiv url: http://arxiv.org/abs/2606.20705v1
- Date: Mon, 15 Jun 2026 18:00:11 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-23 11:18:12.678276
- Title: MotionPyramid: Hierarchical Motion Representation and Residual Interfaces
- Title(参考訳): MotionPyramid:階層型モーション表現と残像インタフェース
- Authors: Gao Zhu, Zaishuo Xia, Yubei Chen,
- Abstract要約: ヒューマノイド制御では、低レベル動作は即時運動コマンドを指定し、意味のある動作はより長い時間スケールで組織される。
我々は、モーションデータからそのような構造を学習する階層的なアクション表現であるMotionPyramidを紹介する。
MotionPyramidは再利用可能なマルチレベル表現に整理でき、制御性を犠牲にすることなく構造化された抽象化を提供する。
- 参考スコア(独自算出の注目度): 9.880977839912811
- License:
- Abstract: We ask whether the representational hierarchy seen in perception, from local primitives such as edges to higher level structures such as parts and objects, can be established for motion. In humanoid control, low level actions specify immediate motor commands, while meaningful behavior is organized over longer temporal scales, including contacts, gait fragments, balance recovery, reaching, and whole body skills. We introduce MotionPyramid, a hierarchical action representation that learns such structure from motion data. Starting from a motion tracking teacher, it trains a recursive stack of latent decoders: low level latents decode to immediate full body motor commands, while higher level latents unfold through lower levels into temporally extended motion programs. After pretraining, the hierarchy is frozen and reused by downstream reinforcement learning policies as a family of action interfaces at different control resolutions. Experiments show the learned levels form a motion hierarchy: coarser interfaces improve early learning and motion regularity by constraining exploration to structured segments, while finer interfaces preserve feedback control and final task precision. Representation probes show the hierarchy supports traversal, interpolation, transition, and qualitative composition, exposing editable control handles across temporal scales. Finally, we introduce Residual Interfaces, letting a downstream policy maintain coarse, segment level, and frame level residual commands through the frozen hierarchy. Analogous to residual or skip connections in deep networks, this allows coarse motion programs and fine residual corrections to coexist within one controller. MotionPyramid shows that motion, like perception, can be organized into a reusable multi level representation, providing structured abstraction without sacrificing controllability.
- Abstract(参考訳): 我々は、エッジのような局所的原始体から、部品や物体のような高次構造に至るまで、知覚で見られる表現的階層が運動のために確立できるかどうかを問う。
ヒューマノイド制御では、低レベル動作は即時運動コマンドを規定するが、接触、歩行の断片、バランス回復、到達、全身のスキルなど、より長い時間スケールで意味のある行動が組織される。
我々は、モーションデータからそのような構造を学習する階層的なアクション表現であるMotionPyramidを紹介する。
モーショントラッキングの教師から始めて、低レベルのラテントが即時フルボディモーターコマンドにデコードされ、高レベルのラテントが低レベルのラテントが時間的に拡張された動作プログラムに展開されるように、ラテントデコーダの再帰的なスタックを訓練する。
事前トレーニング後、階層は凍結され、異なる制御解像度でのアクションインターフェースのファミリーとして下流の強化学習ポリシーによって再利用される。
粗いインターフェイスは、構造化セグメントへの探索を制限することで、早期学習と運動の規則性を向上し、きめ細かいインターフェースはフィードバック制御と最終タスク精度を維持している。
表現プローブは、階層構造がトラバース、補間、遷移、質的な構成をサポートし、時間スケールで編集可能なコントロールハンドルを露出することを示している。
最後に、Residual Interfacesを導入し、凍結階層を通して、下流ポリシーが粗さ、セグメントレベル、フレームレベル残余コマンドを維持できるようにする。
ディープネットワークにおける残差やスキップと類似し、粗い動作プログラムと細かい残差補正を1つのコントローラ内で共存させることができる。
MotionPyramidは、知覚と同様に、動きは再利用可能なマルチレベル表現に整理でき、制御性を犠牲にすることなく構造化された抽象化を提供する。
関連論文リスト
- MultiAct: Text-to-Motion Generation from Composite Text via Tailored Attention Guidance [54.131431576597514]
MultiActは、合成テキスト-モーション合成のための未ペアの推論時間フレームワークである。
提案手法は,未表現のプロンプト成分に付随するクロスアテンションスコアを適応的に増幅することにより,意味的崩壊に対処する。
論文 参考訳(メタデータ) (2026-05-29T07:14:48Z) - Online Continual Learning with Dynamic Label Hierarchies [72.33335166136045]
粒度をまたいで重大度が進化する新しい問題設定であるDHOCLを導入し,各サンプルは単一階層レベルでの監視を行う。
i) 混合粒度の部分的監視は、塑性を制約し、階層間のセマンティック一貫性を損なう、進化するパスワイド階層上のポイントワイド信号のみを提供する。
本稿では,相補的分類を適応的に組み合わせ,学習可能な階層型プロトタイプによって正規化し,素早い適応,階層的整合性,構造的知識の統合を可能にするHALOを提案する。
論文 参考訳(メタデータ) (2026-05-12T08:20:23Z) - Learning Reactive Dexterous Grasping via Hierarchical Task-Space RL Planning and Joint-Space QP Control [50.28263951510334]
本稿では,リアクティブなデクスタリーグルーピングのためのハイブリッド階層型制御フレームワークを提案する。
提案手法は,低レベル共同実行から高レベル空間意図を明示的に分離する。
我々は厳密なシミュレーションと現実のパイプラインを通して提案したフレームワークを広範囲に検証する。
論文 参考訳(メタデータ) (2026-05-05T04:49:38Z) - MotionHiFlow: Text-to-motion via hierarchical flow matching [23.3063383764363]
テキスト・トゥ・モーション・ジェネレーションは、入力されたテキストと密に一致した3次元の人間の動きを生成することを目的としている。
動きを段階的に生成する階層型フローマッチングフレームワークである textitMotionHiFlow を提案する。
低スケールでのフローは高レベルのセマンティクスと粗い動き構造を捉え、高スケールでのフローは時間的詳細を洗練させる。
論文 参考訳(メタデータ) (2026-04-25T12:16:37Z) - HOSIG: Full-Body Human-Object-Scene Interaction Generation with Hierarchical Scene Perception [57.37135310143126]
HO SIGは階層的なシーン認識を通じて全体インタラクションを合成するための新しいフレームワークである。
我々のフレームワークは、自己回帰生成による運動長の無制限化をサポートし、手動による介入を最小限に抑える。
この研究は、シーン認識ナビゲーションとデクスタラスオブジェクト操作の間に重要なギャップを埋める。
論文 参考訳(メタデータ) (2025-06-02T12:08:08Z) - KinMo: Kinematic-aware Human Motion Understanding and Generation [6.962697597686156]
現在のヒューマンモーション合成フレームワークは、グローバルなアクション記述に依存している。
ランのような単一の粗い記述は、速度の変動、手足の位置決め、運動力学といった詳細を捉えるのに失敗する。
階層的な記述可能な動作表現に基づいて構築された統合フレームワークであるKinMoを紹介する。
論文 参考訳(メタデータ) (2024-11-23T06:50:11Z) - Act As You Wish: Fine-Grained Control of Motion Diffusion Model with
Hierarchical Semantic Graphs [31.244039305932287]
動き生成のきめ細かい制御のための階層的意味グラフを提案する。
動作記述を階層的なセマンティックグラフに分解し,3段階の動作,行動,具体性を含む。
提案手法は, コミュニティに多大な影響を及ぼす可能性のある, 生成した動きを連続的に改善することができる。
論文 参考訳(メタデータ) (2023-11-02T06:20:23Z) - Motion In-Betweening with Phase Manifolds [29.673541655825332]
本稿では,周期的オートエンコーダによって学習された位相変数を利用して,文字のターゲットポーズに到達するための,新たなデータ駆動型動作制御システムを提案する。
提案手法では,経験的ニューラルネットワークモデルを用いて,空間と時間の両方のクラスタの動きを,異なる専門家の重みで解析する。
論文 参考訳(メタデータ) (2023-08-24T12:56:39Z) - Unsupervised Motion Representation Learning with Capsule Autoencoders [54.81628825371412]
Motion Capsule Autoencoder (MCAE) は、2レベル階層のモーションをモデル化する。
MCAEは、新しいTrajectory20モーションデータセットと、様々な現実世界の骨格に基づく人間のアクションデータセットで評価されている。
論文 参考訳(メタデータ) (2021-10-01T16:52:03Z) - Hierarchical Contrastive Motion Learning for Video Action Recognition [100.9807616796383]
本稿では,映像フレームから効果的な動き表現を抽出する自己教師型学習フレームワークである階層型コントラスト学習を提案する。
提案手法は,ネットワーク内の異なる抽象レベルに対応する動作特徴の階層構造を段階的に学習する。
私たちのモーション学習モジュールは軽量で柔軟性があり、様々なバックボーンネットワークに組み込むことができます。
論文 参考訳(メタデータ) (2020-07-20T17:59:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。