論文の概要: Selecting Mechanical Parameters of a Monopode Jumping System with
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2212.01303v1
- Date: Fri, 2 Dec 2022 16:53:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 17:35:07.568476
- Title: Selecting Mechanical Parameters of a Monopode Jumping System with
Reinforcement Learning
- Title(参考訳): 強化学習によるモノポール跳躍系の機械的パラメータの選択
- Authors: Andrew Albright, Joshua Vaughan
- Abstract要約: 脚付きシステムは車輪付きシステムに比べて多くの利点がある。
極端に不均一な地形を移動することができる。
しかし、特にシステムの非線形性をモデル化することの難しさにも欠点がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Legged systems have many advantages when compared to their wheeled
counterparts. For example, they can more easily navigate extreme, uneven
terrain. However, there are disadvantages as well, particularly the difficulty
seen in modeling the nonlinearities of the system. Research has shown that
using flexible components within legged locomotive systems improves performance
measures such as efficiency and running velocity. Because of the difficulties
encountered in modeling flexible systems, control methods such as reinforcement
learning can be used to define control strategies. Furthermore, reinforcement
learning can be tasked with learning mechanical parameters of a system to match
a control input. It is shown in this work that when deploying reinforcement
learning to find design parameters for a pogo-stick jumping system, the designs
the agents learn are optimal within the design space provided to the agents.
- Abstract(参考訳): 脚付きシステムは車輪付きシステムに比べて多くの利点がある。
例えば、極端に不均一な地形をもっと簡単に移動できる。
しかし、特にシステムの非線形性をモデル化する上での困難さという欠点もある。
レッグド・ロコモティブ・システムにおける柔軟な部品の使用は効率や走行速度などの性能向上をもたらすことが研究で示されている。
フレキシブルシステムのモデリングでは困難が伴うため、強化学習などの制御手法を用いて制御戦略を定義することができる。
さらに、強化学習は、制御入力にマッチするシステムの機械的パラメータの学習を課題とする。
本研究は,ポゴスティックジャンプシステムの設計パラメータを求めるために強化学習を展開させる場合,エージェントが学習する設計はエージェントに提供される設計空間内で最適であることを示す。
関連論文リスト
- Leveraging Symmetry to Accelerate Learning of Trajectory Tracking Controllers for Free-Flying Robotic Systems [24.360194697715382]
トラッキングコントローラにより、ロボットシステムは計画された基準軌道を正確に追従することができる。
本研究では,フローティングベースを持つロボットシステムの固有リー群対称性を活用して,トラッキングコントローラの学習における課題を軽減する。
その結果,対称性を意識したアプローチはトレーニングを加速し,同一のトレーニングステップの後に追跡誤差を減少させることがわかった。
論文 参考訳(メタデータ) (2024-09-17T14:39:24Z) - A stabilizing reinforcement learning approach for sampled systems with
partially unknown models [0.0]
純粋オンライン学習環境におけるシステム制御器閉ループの実用的安定性を保証する手法を提案する。
要求された結果を達成するため、我々は古典的な適応制御技術を採用する。
この方法は適応的なトラクション制御とクルーズ制御でテストされ、コストを大幅に削減することが判明した。
論文 参考訳(メタデータ) (2022-08-31T09:20:14Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Port-Hamiltonian Neural Networks with State Dependent Ports [58.720142291102135]
本手法は,数個の内力および外力を持つ単純な質量スプリングシステムと,より複雑で現実的なシステムの両方において,ストレス試験を行う。
ポート-ハミルトンニューラルネットワークは、状態依存型ポートでより大きな次元に拡張することができる。
スパースデータとノイズデータのトレーニングを改善するための対称高次積分器を提案する。
論文 参考訳(メタデータ) (2022-06-06T14:57:25Z) - Complex Locomotion Skill Learning via Differentiable Physics [30.868690308658174]
微分物理学は、ニューラルネットワーク(NN)コントローラの効率的な最適化を可能にする。
本稿では,複雑度と多様性を著しく向上したタスクが可能な統一NNコントローラを出力する実践的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-06T04:01:12Z) - GEM: Group Enhanced Model for Learning Dynamical Control Systems [78.56159072162103]
サンプルベースの学習が可能な効果的なダイナミクスモデルを構築します。
リー代数ベクトル空間上のダイナミクスの学習は、直接状態遷移モデルを学ぶよりも効果的であることを示す。
この研究は、ダイナミクスの学習とリー群の性質の関連性を明らかにし、新たな研究の方向への扉を開く。
論文 参考訳(メタデータ) (2021-04-07T01:08:18Z) - Trajectory Tracking of Underactuated Sea Vessels With Uncertain
Dynamics: An Integral Reinforcement Learning Approach [2.064612766965483]
積分強化学習に基づくオンライン機械学習メカニズムを提案し,非線形追跡問題のクラスに対する解を求める。
このソリューションは、適応的批評家と勾配降下アプローチを用いて実現されるオンライン価値反復プロセスを用いて実装される。
論文 参考訳(メタデータ) (2021-04-01T01:41:49Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - Enhanced Adversarial Strategically-Timed Attacks against Deep
Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。
実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-20T21:39:25Z) - Learning to Control PDEs with Differentiable Physics [102.36050646250871]
本稿では,ニューラルネットワークが長い時間をかけて複雑な非線形物理系の理解と制御を学べる新しい階層型予測器・相関器手法を提案する。
本手法は,複雑な物理系の理解に成功し,PDEに関わるタスクに対してそれらを制御できることを実証する。
論文 参考訳(メタデータ) (2020-01-21T11:58:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。