論文の概要: Articulated-Body Dynamics Network: Dynamics-Grounded Prior for Robot Learning
- arxiv url: http://arxiv.org/abs/2603.19078v1
- Date: Thu, 19 Mar 2026 16:06:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.996168
- Title: Articulated-Body Dynamics Network: Dynamics-Grounded Prior for Robot Learning
- Title(参考訳): Articulated-Body Dynamics Network:ロボット学習に先立つダイナミクス
- Authors: Sangwoo Shin, Kunzhao Ren, Xiaobin Xiong, Josiah Hanna,
- Abstract要約: 本稿では,フォワードダイナミクスの計算構造を基盤とした新しいグラフニューラルネットワークアーキテクチャであるArticulated-Body Dynamics Network (ABD-Net)を提案する。
提案手法は, 変圧器ベースラインやGNNベースラインと比較して, サンプル効率の向上と動的シフトへの一般化を示す。
さらに、実際のUnitree G1およびGo2ロボット、最先端のヒューマノイド、四足歩行プラットフォームに関する学習ポリシーを検証する。
- 参考スコア(独自算出の注目度): 9.035498732406037
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent work in reinforcement learning has shown that incorporating structural priors for articulated robots, such as link connectivity, into policy networks improves learning efficiency. However, dynamics properties, despite their fundamental role in determining how forces and motion propagate through the body, remain largely underexplored as an inductive bias for policy learning. To address this gap, we present the Articulated-Body Dynamics Network (ABD-Net), a novel graph neural network architecture grounded in the computational structure of forward dynamics. Specifically, we adapt the inertia propagation mechanism from the Articulated Body Algorithm, systematically aggregating inertial quantities from child to parent links in a tree-structured manner, while replacing physical quantities with learnable parameters. Embedding ABD-NET into the policy actor enables dynamics-informed representations that capture how actions propagate through the body, leading to efficient and robust policy learning. Through experiments with simulated humanoid, quadruped, and hopper robots, our approach demonstrates increased sample efficiency and generalization to dynamics shifts compared to transformer-based and GNN baselines. We further validate the learned policy on real Unitree G1 and Go2 robots, state-of-the-art humanoid and quadruped platforms, generating dynamic, versatile and robust locomotion behaviors through sim-to-real transfer with real-time inference.
- Abstract(参考訳): 近年、強化学習における研究により、リンク接続などのロボットの構造的先行性を政策ネットワークに組み込むことで、学習効率が向上することが示されている。
しかしながら、運動特性は、身体内での力と運動がどのように伝播するかを決定する基本的な役割にもかかわらず、政策学習の帰納的バイアスとしてほとんど調査されていない。
このギャップに対処するために,フォワードダイナミクスの計算構造を基盤とした新しいグラフニューラルネットワークアーキテクチャであるArticulated-Body Dynamics Network (ABD-Net)を提案する。
具体的には,学習可能なパラメータを物理量に置き換えつつ,子から子への慣性量を木構造的に体系的に集約するArticulated Body Algorithmの慣性伝播機構を適応する。
ABD-NETをポリシーアクターに組み込むことで、動的にインフォームドされた表現が可能になり、アクションが身体を通してどのように伝播するかをキャプチャし、効率的で堅牢なポリシー学習につながる。
シミュレーションされたヒューマノイド,四足歩行ロボット,ホッパーロボットを用いた実験により,トランスフォーマーベースやGNNベースラインと比較して,サンプル効率の向上と動的シフトの一般化が示された。
我々はさらに、実際のUnitree G1とGo2ロボット、最先端のヒューマノイドと四足歩行プラットフォームに関する学習方針を検証し、リアルタイム推論によるシミュレートによる動的、多目的、堅牢な移動行動を生成する。
関連論文リスト
- D-REX: Differentiable Real-to-Sim-to-Real Engine for Learning Dexterous Grasping [66.22412592525369]
本稿では,ガウスのSplat表現を生かした実--sim-to-realエンジンを導入し,実-sim-to-realエンジンについて述べる。
提案エンジンは, 各種物体の形状と質量値のマス識別において, 高精度かつロバストな性能を実現していることを示す。
これらの最適化された質量値は、力覚的なポリシー学習を促進し、オブジェクトの把握において優れた、高いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-03-01T15:32:04Z) - AdaWorldPolicy: World-Model-Driven Diffusion Policy with Online Adaptive Learning for Robotic Manipulation [12.592383721590402]
オンライン適応学習(AdaWorldPolicy)を用いた統合フレームワーク「世界モデル駆動拡散政策」を導入する。
私たちの中核となる洞察は、世界モデルは強力な監視信号を提供し、動的環境におけるオンライン適応学習を可能にします。
AdaWorldPolicyは、アウト・オブ・ディストリビューションシナリオへの動的適応能力を備えた最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-02-23T17:12:25Z) - Machine Learning and Control: Foundations, Advances, and Perspectives [0.0]
重畳制御性やアンサンブル制御性といった概念は、ディープニューラルネットワークの分類と表現特性に新たな洞察を与えることを示す。
また、動的ニューラルネットワークと静的ニューラルネットワークの関係についても検討する。
偏微分方程式の文脈で長い間確立されてきた拡散過程の古典的性質が、現代の生成人工知能の成功を説明するのにどのように貢献するかを述べる。
論文 参考訳(メタデータ) (2025-09-30T10:47:26Z) - Domain Translation of a Soft Robotic Arm using Conditional Cycle Generative Adversarial Network [0.8624680612413766]
条件付きサイクル生成逆ネットワーク(CCGAN)に基づくドメイン翻訳フレームワークを提案する。
本モデルでは,両領域の対応する端点位置と向きを条件とした入力圧力信号から学習する。
論文 参考訳(メタデータ) (2025-08-16T15:47:35Z) - Rodrigues Network for Learning Robot Actions [76.69283501115855]
本稿では,ニューラルロドリゲス演算子を用いて,キネマティクスを意識した帰納バイアスを神経計算に注入する手法を提案する。
ロドリゲスネットワーク(RodriNet)は,処理動作に特化したニューラルアーキテクチャである。
この結果から,構造化キネマティック前駆体をネットワークアーキテクチャに統合することで,様々な領域における行動学習が向上することが示唆された。
論文 参考訳(メタデータ) (2025-06-03T08:34:06Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - GEM: Group Enhanced Model for Learning Dynamical Control Systems [78.56159072162103]
サンプルベースの学習が可能な効果的なダイナミクスモデルを構築します。
リー代数ベクトル空間上のダイナミクスの学習は、直接状態遷移モデルを学ぶよりも効果的であることを示す。
この研究は、ダイナミクスの学習とリー群の性質の関連性を明らかにし、新たな研究の方向への扉を開く。
論文 参考訳(メタデータ) (2021-04-07T01:08:18Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Deep learning of contagion dynamics on complex networks [0.0]
本稿では,ネットワーク上での感染動態の効果的なモデルを構築するために,ディープラーニングに基づく補完的アプローチを提案する。
任意のネットワーク構造をシミュレーションすることで,学習したダイナミックスの性質を学習データを超えて探索することが可能になる。
この結果は,ネットワーク上での感染動態の効果的なモデルを構築するために,ディープラーニングが新たな補完的な視点を提供することを示す。
論文 参考訳(メタデータ) (2020-06-09T17:18:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。