論文の概要: Gait Switching and Enhanced Stabilization of Walking Robots with Deep
Learning-based Reachability: A Case Study on Two-link Walker
- arxiv url: http://arxiv.org/abs/2409.16301v1
- Date: Tue, 10 Sep 2024 07:16:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-27 09:03:58.436839
- Title: Gait Switching and Enhanced Stabilization of Walking Robots with Deep
Learning-based Reachability: A Case Study on Two-link Walker
- Title(参考訳): 深度歩行ロボットの歩行切り替えと歩行安定化
学習に基づく到達可能性:2リンク歩行の事例研究
- Authors: Xingpeng Xia, Jason J. Choi, Ayush Agrawal, Koushil Sreenath, Claire
J. Tomlin, Somil Bansal
- Abstract要約: 安定性を検証・保証できる学習型移動制御器の設計に興味がある。
これは、脚のあるロボットの安定した歩行路へのアトラクション(RoAs)の領域を検証することで達成できる。
- 参考スコア(独自算出の注目度): 33.730544094391504
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-based approaches have recently shown notable success in legged
locomotion. However, these approaches often lack accountability, necessitating
empirical tests to determine their effectiveness. In this work, we are
interested in designing a learning-based locomotion controller whose stability
can be examined and guaranteed. This can be achieved by verifying regions of
attraction (RoAs) of legged robots to their stable walking gaits. This is a
non-trivial problem for legged robots due to their hybrid dynamics. Although
previous work has shown the utility of Hamilton-Jacobi (HJ) reachability to
solve this problem, its practicality was limited by its poor scalability. The
core contribution of our work is the employment of a deep learning-based HJ
reachability solution to the hybrid legged robot dynamics, which overcomes the
previous work's limitation. With the learned reachability solution, first, we
can estimate a library of RoAs for various gaits. Second, we can design a
one-step predictive controller that effectively stabilizes to an individual
gait within the verified RoA. Finally, we can devise a strategy that switches
gaits, in response to external perturbations, whose feasibility is guided by
the RoA analysis. We demonstrate our method in a two-link walker simulation,
whose mathematical model is well established. Our method achieves improved
stability than previous model-based methods, while ensuring transparency that
was not present in the existing learning-based approaches.
- Abstract(参考訳): 学習ベースのアプローチは、最近、足の移動において顕著な成功を収めた。
しかしながら、これらのアプローチは説明責任を欠くことが多く、その有効性を決定するために経験的テストを必要とする。
本研究では,安定度を検証・保証できる学習型移動制御器の設計に関心がある。
これは、脚のあるロボットの安定した歩行路へのアトラクション(RoAs)の領域を検証することで達成できる。
これは、そのハイブリッドなダイナミクスのため、脚のついたロボットにとって非自明な問題である。
これまでの研究は、ハミルトン・ヤコビ(HJ)がこの問題を解くのに有効であることを示してきたが、その実用性はスケーラビリティの貧弱さによって制限された。
我々の研究の中核的な貢献は、従来の作業の制限を克服するハイブリッド脚ロボットダイナミクスにディープラーニングベースのHJリーチビリティソリューションを採用することである。
まず、学習した到達性ソリューションを用いて、様々な歩行に対してRoAsのライブラリを推定する。
第2に、検証されたRoA内の個々の歩行に効果的に安定化するワンステップ予測コントローラを設計できる。
最後に、RoA分析により実現可能性を示す外部摂動に応答して、歩行を切り替える戦略を考案することができる。
数学的モデルが確立した2リンク歩行シミュレーションにおいて,本手法を実証する。
本手法は,既存の学習手法にはない透明性を確保しつつ,従来のモデルベース手法よりも安定性を向上する。
関連論文リスト
- Multi-Objective Algorithms for Learning Open-Ended Robotic Problems [1.0124625066746598]
四足歩行は、自動運転車の普及に不可欠な複雑でオープンな問題である。
従来の強化学習アプローチは、トレーニングの不安定性とサンプルの非効率のため、しばしば不足する。
自動カリキュラム学習機構として多目的進化アルゴリズムを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-11T16:26:42Z) - Single-Shot Learning of Stable Dynamical Systems for Long-Horizon Manipulation Tasks [48.54757719504994]
本稿では,必要なトレーニングデータ量を削減しつつ,タスク成功率の向上に焦点をあてる。
提案手法では,長距離実証をウェイポイントとサブゴールで定義された離散ステップに分割する手法を提案する。
シミュレーションと実世界の両方の実験を通して,本手法を検証し,シミュレーションから物理ロボットプラットフォームへの効果的移行を実証した。
論文 参考訳(メタデータ) (2024-10-01T19:49:56Z) - SERL: A Software Suite for Sample-Efficient Robotic Reinforcement
Learning [85.21378553454672]
筆者らは,報酬の計算と環境のリセットを行う手法とともに,効率的なオフ・ポリティクス・ディープ・RL法を含むライブラリを開発した。
我々は,PCBボードアセンブリ,ケーブルルーティング,オブジェクトの移動に関するポリシを,非常に効率的な学習を実現することができることを発見した。
これらの政策は完全な成功率またはほぼ完全な成功率、摂動下でさえ極端な堅牢性を実現し、突発的な堅牢性回復と修正行動を示す。
論文 参考訳(メタデータ) (2024-01-29T10:01:10Z) - Combining model-predictive control and predictive reinforcement learning
for stable quadrupedal robot locomotion [0.0]
モデル予測型と予測型強化型学習コントローラの組み合わせによりこれを実現できるかを検討する。
本研究では,両制御手法を組み合わせて,四足歩行ロボットの安定ゲート生成問題に対処する。
論文 参考訳(メタデータ) (2023-07-15T09:22:37Z) - Bridging Active Exploration and Uncertainty-Aware Deployment Using
Probabilistic Ensemble Neural Network Dynamics [11.946807588018595]
本稿では,活発な探索と不確実性を考慮した展開を橋渡しするモデルベース強化学習フレームワークを提案する。
探索と展開の対立する2つのタスクは、最先端のサンプリングベースのMPCによって最適化されている。
自動運転車と車輪付きロボットの両方で実験を行い、探索と展開の両方に有望な結果を示します。
論文 参考訳(メタデータ) (2023-05-20T17:20:12Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - Scaffolded Gait Learning of a Quadruped Robot with Bayesian Optimization [1.5853886606819705]
緩やかに削減された支持は、一定高さでの支持よりも安定した歩行を創出できることが示される。
シミュレーションと現実のギャップはロボットに壊滅的な失敗をもたらす可能性があるが、提案手法は新たな行動を学ぶ際のスピードと安全性を組み合わせたものである。
論文 参考訳(メタデータ) (2021-01-25T08:58:30Z) - Preference-Based Learning for User-Guided HZD Gait Generation on Bipedal
Walking Robots [31.994815173888806]
本稿では,制御理論と機械学習を併用して,安定かつ頑健な二足歩行を実現する枠組みを提案する。
その結果、このフレームワークは、シミュレーション環境に依存することなく、50回未満のイテレーションで安定で、堅牢で、効率的で、そして、自然な歩行を実現することがわかった。
論文 参考訳(メタデータ) (2020-11-10T22:15:56Z) - Efficient Empowerment Estimation for Unsupervised Stabilization [75.32013242448151]
エンパワーメント原理は 直立位置での 力学系の教師なし安定化を可能にする
本稿では,ガウスチャネルとして動的システムのトレーニング可能な表現に基づく代替解を提案する。
提案手法は, サンプルの複雑さが低く, 訓練時より安定であり, エンパワーメント機能の本質的特性を有し, 画像からエンパワーメントを推定できることを示す。
論文 参考訳(メタデータ) (2020-07-14T21:10:16Z) - Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。
我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。
従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文 参考訳(メタデータ) (2020-02-25T18:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。