論文の概要: A good body is all you need: avoiding catastrophic interference via
agent architecture search
- arxiv url: http://arxiv.org/abs/2108.08398v2
- Date: Fri, 20 Aug 2021 19:39:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-18 03:09:33.975589
- Title: A good body is all you need: avoiding catastrophic interference via
agent architecture search
- Title(参考訳): 良い体は必要なものだけだ。エージェントアーキテクチャーサーチによる破滅的な干渉を避ける
- Authors: Joshua Powers, Ryan Grindle, Lapo Frati, Josh Bongard
- Abstract要約: ロボット工学では、破滅的な干渉が環境横断の政策訓練を抑え続けている。
破滅的干渉のプロキシ尺度が,いくつかの探索手法におけるサンプル効率と相関することを示す。
本研究では,ロボットの構造と制御ポリシを同時に最適化することで,そのような構造を見つけることができることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In robotics, catastrophic interference continues to restrain policy training
across environments. Efforts to combat catastrophic interference to date focus
on novel neural architectures or training methods, with a recent emphasis on
policies with good initial settings that facilitate training in new
environments. However, none of these methods to date have taken into account
how the physical architecture of the robot can obstruct or facilitate
catastrophic interference, just as the choice of neural architecture can. In
previous work we have shown how aspects of a robot's physical structure
(specifically, sensor placement) can facilitate policy learning by increasing
the fraction of optimal policies for a given physical structure. Here we show
for the first time that this proxy measure of catastrophic interference
correlates with sample efficiency across several search methods, proving that
favorable loss landscapes can be induced by the correct choice of physical
structure. We show that such structures can be found via co-optimization --
optimization of a robot's structure and control policy simultaneously --
yielding catastrophic interference resistant robot structures and policies, and
that this is more efficient than control policy optimization alone. Finally, we
show that such structures exhibit sensor homeostasis across environments and
introduce this as the mechanism by which certain robots overcome catastrophic
interference.
- Abstract(参考訳): ロボット工学では、破滅的な干渉が環境横断の政策訓練を抑え続けている。
これまでの破滅的な干渉に対処する取り組みは、新しいニューラルアーキテクチャやトレーニング手法にフォーカスしており、新しい環境でのトレーニングを容易にする適切な初期設定のポリシーに最近注目が集まっている。
しかし、これらの方法のいずれも、ニューラルネットワークの選択と同じように、ロボットの物理的アーキテクチャが破壊的干渉を阻害したり、促進したりする方法を考慮に入れていない。
これまでの研究で、ロボットの物理的構造(特にセンサー配置)の側面が、所定の物理的構造に対する最適なポリシーの比率を増加させることで、ポリシー学習をいかに促進できるかを示してきた。
ここでは、この破滅的干渉のプロキシ尺度が、いくつかの探索方法にまたがるサンプル効率と相関し、物理構造の正しい選択によって、良好な損失景観を誘導できることを初めて示す。
ロボットの構造と制御方針を同時に最適化することで、このような構造が発見できることを示すとともに、破滅的な干渉耐性ロボットの構造と方針を同時に実現し、制御ポリシーのみよりも効率的であることを示す。
最後に,これらの構造は環境全体にわたってセンサホメオスタシスを示し,これをロボットが破滅的な干渉を克服するメカニズムとして紹介する。
関連論文リスト
- HEIGHT: Heterogeneous Interaction Graph Transformer for Robot Navigation in Crowded and Constrained Environments [8.974071308749007]
廊下や家具などの環境制約のある密集した対話型群集におけるロボットナビゲーションの問題点について検討する。
従来の手法ではエージェントと障害物間のあらゆる種類の相互作用を考慮できないため、安全で非効率なロボット経路につながる。
本稿では,ロボットナビゲーションポリシーを強化学習で学習するための構造化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-19T00:56:35Z) - Robot Navigation with Entity-Based Collision Avoidance using Deep Reinforcement Learning [0.0]
本稿では,ロボットのさまざまなエージェントや障害物との相互作用を高める新しい手法を提案する。
このアプローチでは、エンティティタイプに関する情報を使用し、衝突回避を改善し、より安全なナビゲーションを保証する。
本研究では,大人,自転車乗り,子供,静的障害物など,さまざまな物体との衝突に対してロボットをペナルティ化する新たな報酬関数を提案する。
論文 参考訳(メタデータ) (2024-08-26T11:16:03Z) - Disentangling the Causes of Plasticity Loss in Neural Networks [55.23250269007988]
可塑性の喪失は複数の独立したメカニズムに分解できることを示す。
種々の非定常学習タスクにおいて, 層正規化と重み劣化の組み合わせは, 可塑性維持に極めて有効であることを示す。
論文 参考訳(メタデータ) (2024-02-29T00:02:33Z) - Rapid post-disaster infrastructure damage characterisation enabled by remote sensing and deep learning technologies -- a tiered approach [0.4837072536850576]
交通網や橋梁は戦争中は体系的に標的にされ、自然災害時には被害を受ける。
複数スケールで損傷を自動評価する手法は存在しない。
この能力ギャップを埋める統合的,マルチスケールな階層化手法を提案する。
論文 参考訳(メタデータ) (2024-01-31T11:36:12Z) - Epistemic Prediction and Planning with Implicit Coordination for
Multi-Robot Teams in Communication Restricted Environments [2.781492199939609]
通信制限環境において、マルチロボットシステムは、例えば、一定の通信を維持しながら、近接制約による運用効率を犠牲にする、あるいは、切断を許容して環境被覆効率を高める、どのように、いつ、どこで再接続するかの課題(ランデブー問題)のいずれかにデプロイすることができる。
本稿では,探索とカバレッジ,タスクの発見と完了,待ち行列アプリケーションなどのコミュニケーションを伴わずにコンセンサスを実現するための協調予測と計画の枠組みを提案する。
論文 参考訳(メタデータ) (2023-02-21T01:52:21Z) - SERA: Safe and Efficient Reactive Obstacle Avoidance for Collaborative
Robotic Planning in Unstructured Environments [1.5229257192293197]
本稿では,リアクティブな全身障害物回避手法を提案する。
ロボットアームは、直接接触することなく、任意の3次元形状の障害物を積極的に回避することができる。
本手法は,非定常環境における安全ロボット協調のための堅牢で効果的なソリューションを提供する。
論文 参考訳(メタデータ) (2022-03-24T21:11:43Z) - Simultaneous Navigation and Construction Benchmarking Environments [73.0706832393065]
モバイル構築のためのインテリジェントなロボット、環境をナビゲートし、幾何学的設計に従ってその構造を変更するプロセスが必要です。
このタスクでは、ロボットのビジョンと学習の大きな課題は、GPSなしでデザインを正確に達成する方法です。
我々は,手工芸政策の性能を,基礎的なローカライゼーションと計画,最先端の深層強化学習手法を用いて評価した。
論文 参考訳(メタデータ) (2021-03-31T00:05:54Z) - Cognitive architecture aided by working-memory for self-supervised
multi-modal humans recognition [54.749127627191655]
人間パートナーを認識する能力は、パーソナライズされた長期的な人間とロボットの相互作用を構築するための重要な社会的スキルです。
ディープラーニングネットワークは最先端の結果を達成し,そのような課題に対処するための適切なツールであることが実証された。
1つの解決策は、ロボットに自己スーパービジョンで直接の感覚データから学習させることである。
論文 参考訳(メタデータ) (2021-03-16T13:50:24Z) - Adversarial Training is Not Ready for Robot Learning [55.493354071227174]
対人訓練は,ノルム有界摂動に耐性のあるディープラーニングモデルを訓練する有効な方法である。
敵訓練により得られたニューラルコントローラが3種類の欠陥を受けることを理論的および実験的に示す。
この結果から, ロボット学習にはまだ対応できていないことが示唆された。
論文 参考訳(メタデータ) (2021-03-15T07:51:31Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。