論文の概要: Towards Crossing the Reality Gap with Evolved Plastic Neurocontrollers
- arxiv url: http://arxiv.org/abs/2002.09854v2
- Date: Fri, 8 May 2020 03:57:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 09:47:31.627567
- Title: Towards Crossing the Reality Gap with Evolved Plastic Neurocontrollers
- Title(参考訳): 進化するプラスチックニューロコントローラによるリアルギャップの交差
- Authors: Huanneng Qiu, Matthew Garratt, David Howard and Sreenatha Anavatti
- Abstract要約: 進化ロボティクスにおける重要な問題は、シミュレーションで学んだコントローラーを現実に移すことである。
ここでは、シナプス可塑性を利用して、オンライン適応を介して現実のギャップを横断するスパイクニューロコントローラを設計することで、転送問題を克服しようとする。
進化したプラスチックスパイクコントローラは、進化訓練後に発生するモデル変化に自己適応することで、その機能を維持することができることを示す。
- 参考スコア(独自算出の注目度): 3.492636597449942
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A critical issue in evolutionary robotics is the transfer of controllers
learned in simulation to reality. This is especially the case for small
Unmanned Aerial Vehicles (UAVs), as the platforms are highly dynamic and
susceptible to breakage. Previous approaches often require simulation models
with a high level of accuracy, otherwise significant errors may arise when the
well-designed controller is being deployed onto the targeted platform. Here we
try to overcome the transfer problem from a different perspective, by designing
a spiking neurocontroller which uses synaptic plasticity to cross the reality
gap via online adaptation. Through a set of experiments we show that the
evolved plastic spiking controller can maintain its functionality by
self-adapting to model changes that take place after evolutionary training, and
consequently exhibit better performance than its non-plastic counterpart.
- Abstract(参考訳): 進化ロボティクスにおける重要な問題は、シミュレーションで学んだコントローラーを現実に移すことである。
特に小型無人航空機(UAV)では、プラットフォームが非常にダイナミックで破損しやすいため、これは特にそうである。
以前のアプローチでは、しばしば高い精度でシミュレーションモデルを必要とするが、そうでなければ、よく設計されたコントローラがターゲットプラットフォームにデプロイされているときに重大なエラーが発生することがある。
ここでは,シナプス可塑性を利用したスパイキングニューロコントローラを,オンライン適応による現実のギャップを越えるように設計することで,トランスファー問題を異なる視点から克服する。
一連の実験を通して、進化したプラスチックスパイクコントローラは、進化訓練後のモデル変化に自己適応することで機能を維持することができ、その結果、非塑性よりも優れた性能を示すことを示す。
関連論文リスト
- A Timeline and Analysis for Representation Plasticity in Large Language Models [0.0]
本稿では, 異なる微調整段階において抽出したステアリングを応用することにより, 「正直」 と モデル塑性がいかに進化するかを理解することを目的とする。
初期のステアリングは高い塑性を示すが、後期は驚くほど反応のよい臨界窓を持つ。
これらの洞察は、AI透明性の分野に大きく貢献し、効率の急激な欠如に対処し、モデルの振る舞いを効果的に操る能力を制限する。
論文 参考訳(メタデータ) (2024-10-08T17:34:15Z) - Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-09-25T06:48:25Z) - Innate Motivation for Robot Swarms by Minimizing Surprise: From Simple Simulations to Real-World Experiments [6.21540494241516]
大規模モバイルマルチロボットシステムは、堅牢性とスケーラビリティの可能性が高いため、モノリシックロボットよりも有益である。
マルチロボットシステムのためのコントローラの開発は、対話の多さが予測し難く、モデル化が難しいため、難しい。
本質的にモチベーションは報酬の特定の定式化を避け、好奇心などの異なるドライバで作業しようとする。
Swarmのロボットケースのユニークな利点は、Swarmのメンバーがロボットの環境に飛び込み、自己参照ループでより活発な行動を引き起こすことができることである。
論文 参考訳(メタデータ) (2024-05-04T06:25:58Z) - DiffuseBot: Breeding Soft Robots With Physics-Augmented Generative
Diffusion Models [102.13968267347553]
本稿では,様々なタスクにおいて優れたソフトロボット形態を生成する物理拡張拡散モデルであるDiffuseBotを提案する。
我々は、その能力とともに、シミュレーションされた、そして製造された様々なロボットを紹介します。
論文 参考訳(メタデータ) (2023-11-28T18:58:48Z) - Combining model-predictive control and predictive reinforcement learning
for stable quadrupedal robot locomotion [0.0]
モデル予測型と予測型強化型学習コントローラの組み合わせによりこれを実現できるかを検討する。
本研究では,両制御手法を組み合わせて,四足歩行ロボットの安定ゲート生成問題に対処する。
論文 参考訳(メタデータ) (2023-07-15T09:22:37Z) - Emergent Agentic Transformer from Chain of Hindsight Experience [96.56164427726203]
簡単なトランスフォーマーベースモデルが時間差と模倣学習に基づくアプローチの両方と競合することを示す。
単純なトランスフォーマーベースのモデルが時間差と模倣学習ベースのアプローチの両方で競合するのはこれが初めてである。
論文 参考訳(メタデータ) (2023-05-26T00:43:02Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - Adaptation through prediction: multisensory active inference torque
control [0.0]
本稿では,産業用アームのための多感能動型トルクコントローラを提案する。
私たちのコントローラは、予測的脳仮説にインスパイアされ、現在のアクティブな推論アプローチの能力を向上します。
論文 参考訳(メタデータ) (2021-12-13T16:03:18Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。