論文の概要: Learning NEAT Emergent Behaviors in Robot Swarms
- arxiv url: http://arxiv.org/abs/2309.14663v2
- Date: Thu, 8 Aug 2024 21:57:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-12 21:01:50.320009
- Title: Learning NEAT Emergent Behaviors in Robot Swarms
- Title(参考訳): ロボット群におけるNEAT創発行動の学習
- Authors: Pranav Rajbhandari, Donald Sofge,
- Abstract要約: 本稿では,分散ロボット群アルゴリズムを訓練し,創発的行動を生成する方法を提案する。
動物における創発的行動の生物学的進化に触発され、進化的アルゴリズムを用いて個体集団を訓練する。
このアルゴリズムは、成功のためにやや複雑なグループ動作を必要とする様々なタスクで評価する。
- 参考スコア(独自算出の注目度): 1.0958014189747356
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When researching robot swarms, many studies observe complex group behavior emerging from the individual agents' simple local actions. However, the task of learning an individual policy to produce a desired group behavior remains a challenging problem. We present a method of training distributed robotic swarm algorithms to produce emergent behavior. Inspired by the biological evolution of emergent behavior in animals, we use an evolutionary algorithm to train a population of individual behaviors to produce a desired group behavior. We perform experiments using simulations of the Georgia Tech Miniature Autonomous Blimps (GT-MABs) aerial robotics platforms conducted in the CoppeliaSim simulator. Additionally, we test on simulations of Anki Vector robots to display our algorithm's effectiveness on various modes of actuation. We evaluate our algorithm on various tasks where a somewhat complex group behavior is required for success. These tasks include an Area Coverage task and a Wall Climb task. We compare behaviors evolved using our algorithm against designed policies, which we create in order to exhibit the emergent behaviors we desire.
- Abstract(参考訳): ロボット群を研究する際には、個々のエージェントの単純な局所的な行動から生じる複雑な集団行動が観察される。
しかし、望ましい集団行動を生み出すために個別の政策を学ぶという課題は、依然として難しい問題である。
本稿では,分散ロボット群アルゴリズムを訓練し,創発的行動を生成する方法を提案する。
動物における創発的行動の生物学的進化にインスパイアされた私たちは、進化的アルゴリズムを使って、個々の行動の個体群を訓練し、望ましい集団行動を生成する。
我々は,コッペリアシムシミュレータで実施したジョージア工科大学小型自律飛行場(GT-MABs)の空中ロボットプラットフォームシミュレーションを用いて実験を行った。
さらに,Anki Vectorロボットのシミュレーションを用いて,様々な動作モードにおけるアルゴリズムの有効性を検証した。
このアルゴリズムは、成功のためにやや複雑なグループ動作を必要とする様々なタスクで評価する。
これらのタスクには、エリアカバレッジタスクとウォールクライムタスクが含まれる。
私たちは、望む創発的な行動を示すために、デザインされたポリシーに対してアルゴリズムを使って進化した行動を比較する。
関連論文リスト
- Reinforcement Learning with Action Sequence for Data-Efficient Robot Learning [62.3886343725955]
本稿では,行動列上のQ値を出力する批判ネットワークを学習する新しいRLアルゴリズムを提案する。
提案アルゴリズムは,現在および将来の一連の行動の実行結果を学習するために値関数を明示的に訓練することにより,ノイズのある軌道から有用な値関数を学習することができる。
論文 参考訳(メタデータ) (2024-11-19T01:23:52Z) - No-brainer: Morphological Computation driven Adaptive Behavior in Soft Robots [0.24554686192257422]
ロボット制御のための分離された明示的な脳がなくても、インテリジェントな行動が作成できることを示す。
具体的には, 簡単な反応材料を用いて, ボクセルをベースとした仮想ソフトロボットにおいて適応的かつ複雑な動作を創出できることを示す。
論文 参考訳(メタデータ) (2024-07-23T16:20:36Z) - Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。
本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。
GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文 参考訳(メタデータ) (2024-07-22T06:12:21Z) - Interactive Multi-Robot Flocking with Gesture Responsiveness and Musical Accompaniment [0.7659052547635159]
この研究は魅力的なマルチロボットタスクを示し、その主な目的は熱意と関心を喚起することである。
このタスクでは、人間と一緒に動き、ダイナミックで表現力のあるロボット群に参加することが目標である。
この目的に向けて、研究チームはロボットの動きとジェスチャーや音といった対話モードを関連づけるアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-03-30T18:16:28Z) - Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment [92.48012013825988]
展開中のシナリオにオンザフライで適応する問題について検討する。
ROAM(RObust Autonomous Modulation)は,事前学習した行動の知覚値に基づくメカニズムを提案する。
ROAMによりロボットはシミュレーションと実Go1の四足歩行の両方の動的変化に迅速に適応できることを示す。
論文 参考訳(メタデータ) (2023-11-02T08:22:28Z) - Leveraging Human Feedback to Evolve and Discover Novel Emergent
Behaviors in Robot Swarms [14.404339094377319]
我々は、人間の入力を活用して、特定のマルチエージェントシステムから現れる可能性のある集団行動の分類を自動で発見することを目指している。
提案手法は,Swarm集団行動に対する類似性空間を学習することにより,ユーザの嗜好に適応する。
我々は,2つのロボット能力モデルを用いたシミュレーションにおいて,本手法が従来よりも豊かな創発的行動の集合を常に発見できることを検証した。
論文 参考訳(メタデータ) (2023-04-25T15:18:06Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors [72.62423312645953]
人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
論文 参考訳(メタデータ) (2022-10-17T16:42:59Z) - Investigation of Warrior Robots Behavior by Using Evolutionary
Algorithms [0.09668407688201358]
この種のアルゴリズムは、ロボットの行動が集団行動に類似する性質にインスパイアされている。
インテリジェンスを持たないロボットに対しては、アルゴリズムを定義し、簡単なシミュレーションで結果を示すことができる。
論文 参考訳(メタデータ) (2020-11-18T18:31:27Z) - Learning Behavior Trees with Genetic Programming in Unpredictable
Environments [7.839247285151348]
遺伝的プログラミングは行動木の構造を学習するのに有効であることを示す。
我々は,学習したBTが現実的なシミュレータで同じタスクを解くことを実証し,タスク特定を必要とせずに収束することを示した。
論文 参考訳(メタデータ) (2020-11-06T09:28:23Z) - Thinking While Moving: Deep Reinforcement Learning with Concurrent
Control [122.49572467292293]
本研究では,制御システムの時間的進化とともに,ポリシーからのアクションのサンプリングを同時に行わなければならないような環境下での強化学習について検討する。
人や動物のように、ロボットは思考と移動を同時に行わなければならず、前の動作が完了する前に次の動作を決定する。
論文 参考訳(メタデータ) (2020-04-13T17:49:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。