論文の概要: DynaWM: Dynamics-Aware Distillation with World Model and Momentum Targets for Smooth Locomotion over Continuous Stairs
- arxiv url: http://arxiv.org/abs/2606.24089v1
- Date: Tue, 23 Jun 2026 03:07:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.751755
- Title: DynaWM: Dynamics-Aware Distillation with World Model and Momentum Targets for Smooth Locomotion over Continuous Stairs
- Title(参考訳): DynaWM:世界モデルによるダイナミック・アウェア蒸留とスムース・ロコモーションのためのモーメントターゲット
- Authors: Haidong Hou, Zhangguo Yu, Hengbo Qi, Jianlin Zhang,
- Abstract要約: 動的認識型表現学習フレームワークDynaWMを提案する。
本研究では,世界モデルをレギュレータとして導入し,フォワード力学の認識を強制し,包括的地形形状を保存する。
非定常教師更新による次元的崩壊を防止し、一貫した蒸留ターゲットを提供するために運動量目標エンコーダを用いる。
- 参考スコア(独自算出の注目度): 8.383969829401517
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in control have enabled bipedal-wheeled robots to traverse slopes and single-step obstacles, yet long staircase traversal remains challenging as current teacher-student frameworks suffer from weakened dynamics-aware representations and incomplete terrain geometry encoding. To bridge this gap, we propose DynaWM, a dynamics-aware representation learning framework. To enhance terrain encoding capability and enable transparent assessment, we introduce a world model as a regularizer to enforce forward-dynamics awareness, preserving comprehensive terrain geometry while facilitating hierarchical encoding visualization. To stabilize knowledge transfer, we employ a momentum target encoder to provide consistent distillation targets, preventing dimensional collapse from non-stationary teacher updates. Evaluation of the learned representations through Principal Component Analysis (PCA) visualization and quantitative metrics reveals that our encoder hierarchically captures terrain geometry with higher terrain encoding capability, leading to enhanced terrain adaptability and motion smoothness. Experimental results in simulation and real hardware demonstrate that our method achieves superior terrain adaptability and motion smoothness, enabling bipedal-wheeled robots to overcome diverse continuous stairs, as shown in Fig. 1.
- Abstract(参考訳): 近年の制御の進歩により、二足歩行ロボットは傾斜や単一ステップの障害物を横切ることが可能になったが、現在の教師学生のフレームワークは、弱められたダイナミックス認識表現と不完全な地形形状の符号化に悩まされているため、長い階段の移動は依然として困難である。
このギャップを埋めるため,動的認識型表現学習フレームワークDynaWMを提案する。
地形のエンコーディング能力を高め,透過的なアセスメントを可能にするために,世界モデルをレギュレータとして導入し,フォワード・ダイナミックス・アウェアメントを強化し,包括的地形形状を保存し,階層的エンコーディングの可視化を容易にする。
知識伝達を安定させるために, 運動量目標エンコーダを用いて一貫した蒸留ターゲットを提供し, 非定常教師更新による次元崩壊を防止する。
主成分分析(PCA)の可視化と定量化による学習表現の評価により,エンコーダは地形形状を階層的に捕集し,地形適応性の向上と運動の滑らかさを図った。
シミュレーションおよび実ハードウェアによる実験結果から,本手法は地形適応性と運動の平滑性を向上し,二足歩行ロボットが多種多様な連続階段を克服できることが図1に示されている。
関連論文リスト
- ManiSplat: Manipulation Trajectory Synthesis from Monocular Video via Decoupled 3D Gaussian Splatting [28.256286705954846]
現実の観察から動的でインタラクティブな3Dシーンを再構築することは、コンピュータビジョンとロボティクスの基本的な課題である。
ロボットビデオから直接ガウスのデジタル双生児を制御可能で分離する統合フレームワークであるManiSplatを紹介した。
提案手法は,対話駆動型動的シーンを高忠実度かつ制御性で再構築し,下流ロボットタスクとポリシー学習を効果的に支援する。
論文 参考訳(メタデータ) (2026-06-09T09:55:58Z) - Kinematics-Aware Latent World Models for Data-Efficient Autonomous Driving [8.391716372682316]
車両キネマティック情報は観測エンコーダに組み込まれ、物理的に意味のある運動力学における潜伏遷移を基底とする。
ジオメトリ・アウェアの監督は、RSSM潜時状態を規則化し、ピクセル再構成を超えてタスク関連空間構造をキャプチャする。
論文 参考訳(メタデータ) (2026-03-07T15:47:54Z) - MeshMimic: Geometry-Aware Humanoid Motion Learning through 3D Scene Reconstruction [54.36564144414704]
MeshMimicは、3Dシーンの再構築とインテリジェンスを組み込んだ革新的なフレームワークで、ヒューマノイドロボットがビデオから直接「モーション・テライン」インタラクションを学習できるようにする。
現状の3次元視覚モデルを活用することで、我々のフレームワークは、人間の軌跡と基礎となる地形や物体の3次元幾何学の両方を正確にセグメント化し再構築する。
論文 参考訳(メタデータ) (2026-02-17T17:09:45Z) - Self-supervised Physics-Informed Manipulation of Deformable Linear Objects with Non-negligible Dynamics [14.801939035043352]
SPiDは、変形可能な線形オブジェクトの動的操作のための物理インフォーム付き自己教師付き学習フレームワークである。
タスク指向コストを用いてニューラルコントローラをトレーニングし、微分可能なオブジェクトモデルとの相互作用を通じてエンドツーエンドの最適化を可能にする。
我々は、手頃なマーカーレスロープ認識法を開発し、ノイズや低周波状態の更新を伴って、制御が性能を維持することを示す。
論文 参考訳(メタデータ) (2026-02-03T15:14:09Z) - Learning Terrain Aware Bipedal Locomotion via Reduced Dimensional Perceptual Representations [6.407946291544721]
本研究は、地形を意識した二足歩行の階層的戦略を導入する。
低次元表現を統合して、リアルタイム歩行生成のための強化学習(RL)に基づく高レベル(HL)ポリシーを強化する。
論文 参考訳(メタデータ) (2025-12-15T05:38:08Z) - MoSiC: Optimal-Transport Motion Trajectory for Dense Self-Supervised Learning [66.53533434848369]
密集した表現を学習する動き誘導型自己学習フレームワークを提案する。
6つの画像およびビデオデータセットと4つの評価ベンチマークにおいて、最先端を1%から6%改善する。
論文 参考訳(メタデータ) (2025-06-10T11:20:32Z) - GeoDrive: 3D Geometry-Informed Driving World Model with Precise Action Control [50.67481583744243]
実世界モデルにロバストな3次元形状条件を明示的に統合したGeoDriveを紹介する。
車両の位置を編集することでレンダリングを強化するため,トレーニング中の動的編集モジュールを提案する。
動作精度と空間認識の両面で既存のモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-05-28T14:46:51Z) - Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。
まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。
このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文 参考訳(メタデータ) (2024-06-21T13:48:37Z) - TrackDiffusion: Tracklet-Conditioned Video Generation via Diffusion Models [75.20168902300166]
微粒な軌跡条件の運動制御が可能な新しい映像生成フレームワークであるTrackDiffusionを提案する。
TrackDiffusionの重要なコンポーネントは、複数のオブジェクトのフレーム間の一貫性を明確に保証するインスタンスエンハンサーである。
TrackDiffusionによって生成されたビデオシーケンスは、視覚知覚モデルのトレーニングデータとして使用できる。
論文 参考訳(メタデータ) (2023-12-01T15:24:38Z) - Learning to Jump from Pixels [23.17535989519855]
我々は、高度にアジャイルな視覚的誘導行動の合成法であるDepth-based Impulse Control (DIC)を提案する。
DICは、モデルフリー学習の柔軟性を提供するが、地面反応力の明示的なモデルベース最適化により、振る舞いを規則化する。
提案手法をシミュレーションと実世界の両方で評価する。
論文 参考訳(メタデータ) (2021-10-28T17:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。