論文の概要: Meta Reinforcement Learning for Optimal Design of Legged Robots
- arxiv url: http://arxiv.org/abs/2210.02750v1
- Date: Thu, 6 Oct 2022 08:37:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 17:39:43.707260
- Title: Meta Reinforcement Learning for Optimal Design of Legged Robots
- Title(参考訳): 足ロボットの最適設計のためのメタ強化学習
- Authors: \'Alvaro Belmonte-Baeza, Joonho Lee, Giorgio Valsecchi, Marco Hutter
- Abstract要約: モデルなしメタ強化学習を用いた設計最適化フレームワークを提案する。
提案手法は,事前定義された動作や歩行パターンに制約されずに,より高い性能を実現することができることを示す。
- 参考スコア(独自算出の注目度): 9.054187238463212
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The process of robot design is a complex task and the majority of design
decisions are still based on human intuition or tedious manual tuning. A more
informed way of facing this task is computational design methods where design
parameters are concurrently optimized with corresponding controllers. Existing
approaches, however, are strongly influenced by predefined control rules or
motion templates and cannot provide end-to-end solutions. In this paper, we
present a design optimization framework using model-free meta reinforcement
learning, and its application to the optimizing kinematics and actuator
parameters of quadrupedal robots. We use meta reinforcement learning to train a
locomotion policy that can quickly adapt to different designs. This policy is
used to evaluate each design instance during the design optimization. We
demonstrate that the policy can control robots of different designs to track
random velocity commands over various rough terrains. With controlled
experiments, we show that the meta policy achieves close-to-optimal performance
for each design instance after adaptation. Lastly, we compare our results
against a model-based baseline and show that our approach allows higher
performance while not being constrained by predefined motions or gait patterns.
- Abstract(参考訳): ロボット設計のプロセスは複雑な作業であり、設計決定の大部分は、人間の直感や退屈なマニュアルチューニングに基づいている。
この課題に直面するよりインフォームドな方法は、設計パラメータが対応するコントローラで同時に最適化される計算設計手法である。
しかし、既存のアプローチは事前定義された制御ルールやモーションテンプレートの影響を強く受けており、エンドツーエンドのソリューションを提供できない。
本稿では,モデルフリーなメタ強化学習を用いた設計最適化フレームワークとその四足歩行ロボットの運動学およびアクチュエータパラメータの最適化への応用について述べる。
我々はメタ強化学習を用いて、異なる設計に迅速に適応できる移動ポリシーを訓練する。
このポリシーは、設計最適化中の各設計インスタンスを評価するために使用される。
このポリシーは異なる設計のロボットを制御し、様々な荒地でランダムな速度指令を追跡できることを実証する。
制御された実験により、メタポリシーが適応後の各設計インスタンスの近接最適性能を達成することを示す。
最後に,モデルベースのベースラインと比較し,事前定義された動作や歩行パターンに制約されることなく,より高いパフォーマンスを実現する方法を示す。
関連論文リスト
- Co-Optimization of Robot Design and Control: Enhancing Performance and Understanding Design Complexity [0.8999666725996974]
ロボットの設計と制御の協調最適化は、どちらもタスクに適合する設計と制御を生成する。
協調最適化プロセス終了後に追加のリソースでロボットのコントローラを再訓練することで、ロボットの性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2024-09-13T08:18:01Z) - Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。
拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。
N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文 参考訳(メタデータ) (2024-01-24T01:33:39Z) - ECoDe: A Sample-Efficient Method for Co-Design of Robotic Agents [11.449817465618658]
自律ロボットエージェントを共同設計するには、エージェントのコントローラと物理的設計を同時に最適化する必要がある。
デザインスペースが大きくなると、これは難しくなります。
共設計のサンプル効率を向上させるための多要素探索手法を提案する。
論文 参考訳(メタデータ) (2023-09-08T02:54:31Z) - Parameter-Efficient Fine-Tuning Design Spaces [63.954953653386106]
パラメータ効率の良いファインチューニング設計パラダイムを提案し、異なる実験環境に適用可能な設計パターンを探索する。
実験により,これらの手法は,異なるバックボーンモデルと自然言語処理における異なるタスク間のパラメータ効率の高い微調整戦略を連続的に,かつ著しく上回ることを示した。
論文 参考訳(メタデータ) (2023-01-04T21:00:18Z) - Design Space Exploration and Explanation via Conditional Variational
Autoencoders in Meta-model-based Conceptual Design of Pedestrian Bridges [52.77024349608834]
本稿では,条件付き変分オートエンコーダ(CVAE)による人間設計者向上のための性能駆動型設計探索フレームワークを提案する。
CVAEはスイスの歩行者橋の合成例18万件で訓練されている。
論文 参考訳(メタデータ) (2022-11-29T17:28:31Z) - Investigating Positive and Negative Qualities of Human-in-the-Loop
Optimization for Designing Interaction Techniques [55.492211642128446]
設計者は、与えられた目的の集合を最大化する設計パラメータの組み合わせを見つけるよう求められる設計最適化タスクに苦労すると言われている。
モデルベースの計算設計アルゴリズムは、設計中に設計例を生成することでデザイナを支援する。
一方、補助のためのブラックボックスメソッドは、あらゆる設計問題に対処できる。
論文 参考訳(メタデータ) (2022-04-15T20:40:43Z) - Physical Design using Differentiable Learned Simulators [9.380022457753938]
逆設計では、学習したフォワードシミュレータは勾配に基づく設計最適化と組み合わせられる。
この枠組みは数百歩の軌跡を伝播することで高品質な設計を行う。
この結果から,機械学習をベースとしたシミュレータは,いくつかの課題があるにもかかわらず,汎用設計の最適化をサポートできる段階まで成熟していることが示唆された。
論文 参考訳(メタデータ) (2022-02-01T19:56:39Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z) - An End-to-End Differentiable Framework for Contact-Aware Robot Design [37.715596272425316]
我々は、接触認識ロボット設計のためのエンドツーエンドの差別化可能なフレームワークを構築した。
変形に基づく新しいパラメータ化により、任意の複雑な幾何学を持つ剛体ロボットを設計することができる。
微分可能な剛体シミュレータは、接触豊富なシナリオを処理し、運動パラメータと動的パラメータの完全なスペクトルに対する解析的勾配を計算することができる。
論文 参考訳(メタデータ) (2021-07-15T17:53:44Z) - Conservative Objective Models for Effective Offline Model-Based
Optimization [78.19085445065845]
計算設計の問題は、合成生物学からコンピュータアーキテクチャまで、様々な場面で発生している。
本研究では,分布外入力に対する接地的目標の実際の値を低くする目的関数のモデルを学習する手法を提案する。
COMは、様々なMBO問題に対して、既存のメソッドの実装と性能の面では単純である。
論文 参考訳(メタデータ) (2021-07-14T17:55:28Z) - Meta-Reinforcement Learning for Adaptive Motor Control in Changing Robot
Dynamics and Environments [3.5309638744466167]
この研究は、ロバストな移動のための異なる条件に制御ポリシーを適応させるメタラーニングアプローチを開発した。
提案手法は, インタラクションモデルを更新し, 推定された状態-作用軌道のアクションをサンプル化し, 最適なアクションを適用し, 報酬を最大化する。
論文 参考訳(メタデータ) (2021-01-19T12:57:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。