論文の概要: Learning Emergent Behavior in Robot Swarms with NEAT
- arxiv url: http://arxiv.org/abs/2309.14663v1
- Date: Tue, 26 Sep 2023 04:40:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 15:05:30.253297
- Title: Learning Emergent Behavior in Robot Swarms with NEAT
- Title(参考訳): ロボット群における創発的行動の学習
- Authors: Pranav Rajbhandari, Donald Sofge
- Abstract要約: 本稿では,分散ロボット群アルゴリズムを訓練し,創発的行動を生成する方法を提案する。
動物における創発的行動の生物学的進化に触発され、進化的アルゴリズムを用いて個々の行動の「集団」を訓練する。
我々は,コッペリアシムシミュレータで実施したジョージア工科大学小型自律飛行場(GT-MABs)の空中ロボットプラットフォームシミュレーションを用いて実験を行った。
- 参考スコア(独自算出の注目度): 1.2315709793304113
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When researching robot swarms, many studies observe complex group behavior
emerging from the individual agents' simple local actions. However, the task of
learning an individual policy to produce a desired emergent behavior remains a
challenging and largely unsolved problem. We present a method of training
distributed robotic swarm algorithms to produce emergent behavior. Inspired by
the biological evolution of emergent behavior in animals, we use an
evolutionary algorithm to train a 'population' of individual behaviors to
approximate a desired group behavior. We perform experiments using simulations
of the Georgia Tech Miniature Autonomous Blimps (GT-MABs) aerial robotics
platforms conducted in the CoppeliaSim simulator. Additionally, we test on
simulations of Anki Vector robots to display our algorithm's effectiveness on
various modes of actuation. We evaluate our algorithm on various tasks where a
somewhat complex group behavior is required for success. These tasks include an
Area Coverage task, a Surround Target task, and a Wall Climb task. We compare
behaviors evolved using our algorithm against 'designed policies', which we
create in order to exhibit the emergent behaviors we desire.
- Abstract(参考訳): ロボット群を研究する際には、個々のエージェントの単純な局所行動から生じる複雑な集団行動が観察される。
しかしながら、望ましい緊急行動を生み出すために個々のポリシーを学ぶというタスクは、依然として挑戦的でほとんど解決されていない問題である。
本稿では,分散ロボット群アルゴリズムを用いて創発的行動を生成する方法を提案する。
動物における創発行動の生物学的進化に着想を得て,個体行動の「集団化」を学習し,望ましい集団行動の近似を行う。
コッペリアシムシミュレータで実施した,ジョージア工科大学の小型自律blimps(gt-mabs)空中ロボットプラットフォームのシミュレーションを用いて実験を行う。
さらに,Anki Vectorロボットのシミュレーションを用いて,様々な動作モードにおけるアルゴリズムの有効性を検証した。
このアルゴリズムは、成功のためにやや複雑なグループ動作を必要とする様々なタスクで評価する。
これらのタスクには、エリアカバレッジタスク、サラウンドターゲットタスク、ウォールクライミングタスクが含まれる。
アルゴリズムを用いて進化した行動と、我々が望む創発的な行動を示すために作成する「設計されたポリシー」を比較します。
関連論文リスト
- RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning
via Generative Simulation [64.51563634951394]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Leveraging Human Feedback to Evolve and Discover Novel Emergent
Behaviors in Robot Swarms [14.404339094377319]
我々は、人間の入力を活用して、特定のマルチエージェントシステムから現れる可能性のある集団行動の分類を自動で発見することを目指している。
提案手法は,Swarm集団行動に対する類似性空間を学習することにより,ユーザの嗜好に適応する。
我々は,2つのロボット能力モデルを用いたシミュレーションにおいて,本手法が従来よりも豊かな創発的行動の集合を常に発見できることを検証した。
論文 参考訳(メタデータ) (2023-04-25T15:18:06Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - Discovering Unsupervised Behaviours from Full-State Trajectories [1.827510863075184]
本稿では,自律的に行動特性を見出す品質多様性アルゴリズムとして,自律型ロボットの能力を実現する手法を提案する。
本手法は,ロボットが実状態の軌道から自律的にその能力を見いださなければならないシミュレーションロボット環境において評価する。
より具体的には、分析されたアプローチは、ロボットを多様な位置に移動させるポリシーを自律的に見つけるだけでなく、脚を多様な方法で活用し、ハーフロールも行う。
論文 参考訳(メタデータ) (2022-11-22T16:57:52Z) - Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors [72.62423312645953]
人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
論文 参考訳(メタデータ) (2022-10-17T16:42:59Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Investigation of Warrior Robots Behavior by Using Evolutionary
Algorithms [0.09668407688201358]
この種のアルゴリズムは、ロボットの行動が集団行動に類似する性質にインスパイアされている。
インテリジェンスを持たないロボットに対しては、アルゴリズムを定義し、簡単なシミュレーションで結果を示すことができる。
論文 参考訳(メタデータ) (2020-11-18T18:31:27Z) - Learning Behavior Trees with Genetic Programming in Unpredictable
Environments [7.839247285151348]
遺伝的プログラミングは行動木の構造を学習するのに有効であることを示す。
我々は,学習したBTが現実的なシミュレータで同じタスクを解くことを実証し,タスク特定を必要とせずに収束することを示した。
論文 参考訳(メタデータ) (2020-11-06T09:28:23Z) - Thinking While Moving: Deep Reinforcement Learning with Concurrent
Control [122.49572467292293]
本研究では,制御システムの時間的進化とともに,ポリシーからのアクションのサンプリングを同時に行わなければならないような環境下での強化学習について検討する。
人や動物のように、ロボットは思考と移動を同時に行わなければならず、前の動作が完了する前に次の動作を決定する。
論文 参考訳(メタデータ) (2020-04-13T17:49:29Z) - SAPIEN: A SimulAted Part-based Interactive ENvironment [77.4739790629284]
SAPIENは現実的で物理に富んだシミュレートされた環境であり、音声オブジェクトのための大規模なセットをホストしている。
部品検出と動作特性認識のための最先端の視覚アルゴリズムの評価を行い,ロボットインタラクションタスクの実証を行った。
論文 参考訳(メタデータ) (2020-03-19T00:11:34Z) - On Simple Reactive Neural Networks for Behaviour-Based Reinforcement
Learning [5.482532589225552]
本稿では,Brookの仮定アーキテクチャに着想を得た行動に基づく強化学習手法を提案する。
作業上の前提は、ロボット開発者のドメイン知識を活用することで、ロボットのピック・アンド・プレイス・タスクを単純化できるということです。
提案手法では,8000エピソードのピック・アンド・プレイス・タスクを学習し,エンド・ツー・エンドアプローチで必要とされるトレーニング・エピソードの数を劇的に削減する。
論文 参考訳(メタデータ) (2020-01-22T11:49:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。