論文の概要: Autotuning Bipedal Locomotion MPC with GRFM-Net for Efficient Sim-to-Real Transfer
- arxiv url: http://arxiv.org/abs/2409.15710v1
- Date: Tue, 24 Sep 2024 03:58:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-26 09:11:12.479146
- Title: Autotuning Bipedal Locomotion MPC with GRFM-Net for Efficient Sim-to-Real Transfer
- Title(参考訳): GRFM-Netを用いた2足歩行自動MPCの同時移動能率向上
- Authors: Qianzhong Chen, Junheng Li, Sheng Cheng, Naira Hovakimyan, Quan Nguyen,
- Abstract要約: DiffTune を用いた二足歩行制御におけるパラメータ選択の課題に対処する。
大きな困難は、モデルの忠実さと差別性とのバランスにある。
ハードウェア実験においてDiffTuneとGRFM-Netで得られたパラメータを検証する。
- 参考スコア(独自算出の注目度): 10.52309107195141
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bipedal locomotion control is essential for humanoid robots to navigate complex, human-centric environments. While optimization-based control designs are popular for integrating sophisticated models of humanoid robots, they often require labor-intensive manual tuning. In this work, we address the challenges of parameter selection in bipedal locomotion control using DiffTune, a model-based autotuning method that leverages differential programming for efficient parameter learning. A major difficulty lies in balancing model fidelity with differentiability. We address this difficulty using a low-fidelity model for differentiability, enhanced by a Ground Reaction Force-and-Moment Network (GRFM-Net) to capture discrepancies between MPC commands and actual control effects. We validate the parameters learned by DiffTune with GRFM-Net in hardware experiments, which demonstrates the parameters' optimality in a multi-objective setting compared with baseline parameters, reducing the total loss by up to 40.5$\%$ compared with the expert-tuned parameters. The results confirm the GRFM-Net's effectiveness in mitigating the sim-to-real gap, improving the transferability of simulation-learned parameters to real hardware.
- Abstract(参考訳): 二足歩行制御は、複雑な人間中心の環境をナビゲートする人型ロボットにとって不可欠である。
最適化に基づく制御設計は、ヒューマノイドロボットの洗練されたモデルを統合するのに人気があるが、労働集約的な手動チューニングを必要とすることが多い。
本研究では,DiffTuneを用いた二足歩行制御におけるパラメータ選択の課題に対処する。
大きな困難は、モデルの忠実さと微分可能性のバランスをとることだ。
我々は、MPCコマンドと実際の制御効果の相違を捉えるために、GRFM-Net(GRFM-Net)によって強化された低忠実度モデルを用いて、この課題に対処する。
ハードウェア実験において,DiffTune が GRFM-Net を用いて学習したパラメータを検証し,ベースラインパラメータと比較して多目的設定におけるパラメータの最適性を実証し,エキスパートチューニングパラメータと比較して最大 40.5$\% の損失を低減した。
その結果、GRFM-Netによるsim-to-realギャップの緩和効果を確認し、シミュレーション学習パラメータの実際のハードウェアへの転送性を改善した。
関連論文リスト
- Combining model-predictive control and predictive reinforcement learning
for stable quadrupedal robot locomotion [0.0]
モデル予測型と予測型強化型学習コントローラの組み合わせによりこれを実現できるかを検討する。
本研究では,両制御手法を組み合わせて,四足歩行ロボットの安定ゲート生成問題に対処する。
論文 参考訳(メタデータ) (2023-07-15T09:22:37Z) - Tuning Legged Locomotion Controllers via Safe Bayesian Optimization [47.87675010450171]
本稿では,ロボットハードウェアプラットフォームにおけるモデルベースコントローラの展開を効率化するための,データ駆動型戦略を提案する。
モデルフリーな安全な学習アルゴリズムを用いて制御ゲインのチューニングを自動化し、制御定式化で使用される単純化されたモデルと実システムとのミスマッチに対処する。
論文 参考訳(メタデータ) (2023-06-12T13:10:14Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Hyper-Parameter Auto-Tuning for Sparse Bayesian Learning [72.83293818245978]
我々は、疎ベイズ学習におけるハイパーパラメータチューニングのためのニューラルネットワーク(NN)ベースのオートチューニングを設計し、学習する。
コンバージェンス率とリカバリ性能の大幅な向上が達成できることを示す。
論文 参考訳(メタデータ) (2022-11-09T12:34:59Z) - Adaptive Model Predictive Control by Learning Classifiers [26.052368583196426]
制御パラメータとモデルパラメータを自動的に推定する適応型MPC変種を提案する。
我々は,BOを密度比推定として定式化できることを示す最近の結果を活用する。
その後、これはモデル予測経路積分制御フレームワークに統合され、様々な困難なロボティクスタスクのための堅牢なコントローラを生成する。
論文 参考訳(メタデータ) (2022-03-13T23:22:12Z) - Bayesian Optimization Meets Hybrid Zero Dynamics: Safe Parameter
Learning for Bipedal Locomotion Control [17.37169551675587]
両足歩行ロボットの移動制御のためのマルチドメイン制御パラメータ学習フレームワークを提案する。
BOを利用して、HZDベースのコントローラで使用される制御パラメータを学習する。
次に、物理ロボットに学習プロセスを適用し、シミュレーションで学習した制御パラメータの修正を学習する。
論文 参考訳(メタデータ) (2022-03-04T20:48:17Z) - An Artificial Neural Network-Based Model Predictive Control for
Three-phase Flying Capacitor Multi-Level Inverter [2.3513645401551333]
モデル予測制御(MPC)は、単純な概念、高速な動的応答、優れた参照追跡のため、パワーエレクトロニクスで広く使われている。
最適なスイッチング状態を予測するためにシステムの数学的モデルに依存するため、パラメトリックな不確実性に悩まされる。
本稿では,ニューラルネットワーク(ANN)に基づくモデルフリー制御戦略を提案する。
論文 参考訳(メタデータ) (2021-10-15T13:54:08Z) - MoEfication: Conditional Computation of Transformer Models for Efficient
Inference [66.56994436947441]
トランスフォーマーベースの事前学習言語モデルは、パラメータ容量が大きいため、ほとんどのNLPタスクにおいて優れた性能を実現することができるが、計算コストも大きい。
スパースアクティベーション現象に基づく条件計算により,大規模モデル推論を高速化する。
そこで本研究では,モデルサイズが等しいMoE(Mix-of-experts)バージョン,すなわちMoEficationに変換することを提案する。
論文 参考訳(メタデータ) (2021-10-05T02:14:38Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Edge Federated Learning Via Unit-Modulus Over-The-Air Computation
(Extended Version) [64.76619508293966]
本稿では,効率の良いエッジフェデレーション学習を実現するために,UM-AirCompフレームワークを提案する。
ローカルモデルパラメータを同時にアップロードし、アナログビームフォーミングを通じてグローバルモデルパラメータを更新する。
車両間自動運転シミュレーションプラットフォームにおけるUM-AirCompの実装を実演する。
論文 参考訳(メタデータ) (2021-01-28T15:10:22Z) - A Learning-Based Tune-Free Control Framework for Large Scale Autonomous
Driving System Deployment [5.296964852594282]
このフレームワークは、自律運転のための制御パラメータチューニングを共同で自動化する3つの機械学習ベースの手順で構成されている。
シミュレーションと道路試験の両方において,パラメータ調整効率が大幅に向上し,制御性能が向上したことを示す。
論文 参考訳(メタデータ) (2020-11-09T08:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。