論文の概要: Learning Stabilizing Control Policies for a Tensegrity Hopper with
Augmented Random Search
- arxiv url: http://arxiv.org/abs/2004.02641v1
- Date: Mon, 6 Apr 2020 13:06:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 07:39:32.888232
- Title: Learning Stabilizing Control Policies for a Tensegrity Hopper with
Augmented Random Search
- Title(参考訳): 拡張ランダム探索を用いたテンセグリティホッパーの学習安定化制御ポリシー
- Authors: Vladislav Kurenkov, Hany Hamed, Sergei Savin
- Abstract要約: 本稿では,Augmented Random Search法を用いて得られた安定化制御ポリシーの設計に焦点をあてる。
ホッパーは、異なる初期条件と制御周波数の変化を条件として、垂直な構成を維持できることが実証された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we consider tensegrity hopper - a novel tensegrity-based
robot, capable of moving by hopping. The paper focuses on the design of the
stabilizing control policies, which are obtained with Augmented Random Search
method. In particular, we search for control policies which allow the hopper to
maintain vertical stability after performing a single jump. It is demonstrated,
that the hopper can maintain a vertical configuration, subject to the different
initial conditions and with changing control frequency rates. In particular,
lowering control frequency from 1000Hz in training to 500Hz in execution did
not affect the success rate of the balancing task.
- Abstract(参考訳): 本稿では,ホップで移動できる新しいテンセグリティロボットであるtensegrity hopperについて考察する。
本稿では,Augmented Random Search法を用いて得られた安定化制御ポリシーの設計に焦点をあてる。
特に,ジャンプを1回行った後,ホッパーが垂直安定性を維持するための制御ポリシーを探索する。
ホッパーは, 異なる初期条件と制御周波数率の変化により, 垂直配置を維持できることが実証された。
特に,1000Hzから500Hzまでの制御周波数の低下は,バランスタスクの成功率に影響を与えなかった。
関連論文リスト
- From Flies to Robots: Inverted Landing in Small Quadcopters with Dynamic
Perching [15.57055572401334]
逆着陸は、多くの動物のチラシの中で日常的な行動である。
我々は,任意の天井面接触条件に対する制御ポリシーを策定する。
小型クワッドコプターにおいて,強靭な逆着陸動作を達成できた。
論文 参考訳(メタデータ) (2024-02-29T21:09:08Z) - End-to-End Reinforcement Learning for Torque Based Variable Height
Hopping [5.34772724436823]
足の移動は自然または非構造地形を扱うのに最も適しており、多用途であることは間違いない。
本稿では,ジャンプ位相を暗黙的に検出するエンド・ツー・エンドのRL型トルクコントローラを提案する。
また、学習した制御器がリッチな動的タスクに接触できるように、シミュレーション手法を拡張し、ロボットへの展開を成功させる。
論文 参考訳(メタデータ) (2023-07-31T13:51:29Z) - Controlling Chaotic Maps using Next-Generation Reservoir Computing [0.0]
非線形システム制御技術と次世代貯水池計算を併用し,動的システムの挙動を予測するための最良クラス機械学習手法を提案する。
カオスなH'enonマップに対する一連の制御タスクにおいて,コントローラの性能を示す。
我々の制御器はこれらのタスクに成功し、トレーニングに10点のデータポイントしか必要とせず、1回の繰り返しで所望の軌道にシステムを制御することができ、ノイズやモデリングエラーに対して堅牢であることを示す。
論文 参考訳(メタデータ) (2023-07-07T19:44:16Z) - Learning Low-Frequency Motion Control for Robust and Dynamic Robot
Locomotion [10.838285018473725]
実ANYmal C四重極上で8Hzの低速動作を行う学習モーションコントローラを用いて,ロバストでダイナミックな移動を実演する。
このロボットは、1.5m/sの高速度を頑健かつ反復的に達成し、不均一な地形を横切ることができ、予期せぬ外乱に抵抗することができる。
論文 参考訳(メタデータ) (2022-09-29T15:55:33Z) - Actor-Critic based Improper Reinforcement Learning [61.430513757337486]
我々は,未知のマルコフ決定プロセスに対して,学習者に100万ドルのベースコントローラを付与する不適切な強化学習環境を考える。
本稿では,(1)ポリシーグラディエントに基づくアプローチ,(2)単純なアクター・クリティカル・スキームとNatural Actor-Criticスキームを切り替えるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-19T05:55:02Z) - Thompson Sampling Achieves $\tilde O(\sqrt{T})$ Regret in Linear
Quadratic Control [85.22735611954694]
我々はトンプソンサンプリング(TS)を用いた安定化可能な線形四元系レギュレータ(LQR)の適応制御問題について検討する。
我々は,LQRの適応制御のための効率的なTSアルゴリズムTSACを提案し,多次元システムであっても,$tilde O(sqrtT)$ regretを実現する。
論文 参考訳(メタデータ) (2022-06-17T02:47:53Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - A homotopy approach to coherent quantum LQG control synthesis using
discounted performance criteria [2.0508733018954843]
本稿では,プラントとコヒーレント(測定不要)制御器のフィールド経由フィードバック接続に対する線形四重項ガウス制御について述べる。
制御の目的は、クローズドループシステムを内部的に安定させ、植物変数を含む無限水平コストを最小化することである。
論文 参考訳(メタデータ) (2020-02-06T18:52:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。