論文の概要: Learning Quadruped Walking from Seconds of Demonstration
- arxiv url: http://arxiv.org/abs/2603.06961v1
- Date: Sat, 07 Mar 2026 00:47:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.500615
- Title: Learning Quadruped Walking from Seconds of Demonstration
- Title(参考訳): デモの秒間からの四足歩行の学習
- Authors: Ruipeng Zhang, Hongzhan Yu, Ya-Chien Chang, Chenghao Li, Henrik I. Christensen, Sicun Gao,
- Abstract要約: そこで本研究では,4重項を用いた模倣学習がデータ構造において本質的に有効である理由を理論的に分析する。
新しい模倣学習法は、潜在空間における変分と出力動作上の変分との整合を調節する。
- 参考スコア(独自算出の注目度): 27.175937325259643
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quadruped locomotion provides a natural setting for understanding when model-free learning can outperform model-based control design, by exploiting data patterns to bypass the difficulty of optimizing over discrete contacts and the combinatorial explosion of mode changes. We give a principled analysis of why imitation learning with quadrupeds can be inherently effective in a small data regime, based on the structure of its limit cycles, Poincaré return maps, and local numerical properties of neural networks. The understanding motivates a new imitation learning method that regulates the alignment between variations in a latent space and those over the output actions. Hardware experiments confirm that a few seconds of demonstration is sufficient to train various locomotion policies from scratch entirely offline with reasonable robustness.
- Abstract(参考訳): Quadruped locomotionは、個別の接触を最適化することの難しさを回避し、モード変更の組合せ爆発を回避し、モデルフリーの学習がモデルベースの制御設計より優れていることを理解するための自然な設定を提供する。
本稿では,その制限周期の構造,ポアンカレ回帰写像,ニューラルネットワークの局所的数値特性に基づいて,四重項を用いた模倣学習が本質的に小さなデータ構造において有効である理由を理論的に分析する。
この理解は、潜在空間における変分と出力動作上の変分とのアライメントを調節する新しい模倣学習手法を動機付けている。
ハードウェア実験は、数秒のデモで、さまざまなロコモーションポリシーをスクラッチから完全にオフラインで、合理的な堅牢さでトレーニングするのに十分であることを確認した。
関連論文リスト
- Disentangled World Models: Learning to Transfer Semantic Knowledge from Distracting Videos for Reinforcement Learning [65.85335291827086]
本稿では,オフラインからオンラインまでの潜水蒸留とフレキシブルなゆがみ制約を通したビデオから,セマンティックな違いを学習し,理解することを試みる。
動作自由なビデオ予測モデルを非干渉正規化によりオフラインでトレーニングし、注意をそらすビデオから意味的知識を抽出する。
オンライン環境での微調整には、事前学習されたモデルからの知識を活用し、世界モデルに絡み合った制約を導入する。
論文 参考訳(メタデータ) (2025-03-11T13:50:22Z) - Offline Adaptation of Quadruped Locomotion using Diffusion Models [59.882275766745295]
本稿では,複数のスキル間の相互補間と学習の限界に同時に対処する,四足歩行への拡散に基づくアプローチを提案する。
これらの機能は、マルチスキルポリシーと互換性があり、ほとんど変更することなく、最小限の計算オーバーヘッドで適用可能であることを示す。
ANYmal四重奏プラットフォーム上でのハードウェア実験によるアプローチの有効性を検証する。
論文 参考訳(メタデータ) (2024-11-13T18:12:15Z) - Deep Learning Through A Telescoping Lens: A Simple Model Provides Empirical Insights On Grokking, Gradient Boosting & Beyond [61.18736646013446]
その驚くべき振る舞いをより深く理解するために、トレーニングされたニューラルネットワークの単純かつ正確なモデルの有用性について検討する。
3つのケーススタディで、様々な顕著な現象に関する新しい経験的洞察を導き出すためにどのように適用できるかを説明します。
論文 参考訳(メタデータ) (2024-10-31T22:54:34Z) - Learning Low-Dimensional Strain Models of Soft Robots by Looking at the Evolution of Their Shape with Application to Model-Based Control [2.058941610795796]
本稿では,低次元物理モデル学習のための合理化手法を提案する。
各種平面ソフトマニピュレータを用いたシミュレーションにより,本手法の有効性を検証した。
物理的に互換性のあるモデルを生成する方法のおかげで、学習したモデルはモデルベースの制御ポリシーと簡単に組み合わせることができる。
論文 参考訳(メタデータ) (2024-10-31T18:37:22Z) - An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文 参考訳(メタデータ) (2021-10-28T10:14:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。