論文の概要: Simulation of robot swarms for learning communication-aware coordination
- arxiv url: http://arxiv.org/abs/2302.13124v1
- Date: Sat, 25 Feb 2023 17:17:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 18:48:22.180125
- Title: Simulation of robot swarms for learning communication-aware coordination
- Title(参考訳): コミュニケーション認識協調学習のためのロボット群シミュレーション
- Authors: Giorgia Adorni
- Abstract要約: 我々は、全能集中型コントローラから得られる局所的な観測を入力として、エンドツーエンドのニューラルネットワークを訓練する。
実験は、平面ロボットの高性能オープンソースシミュレータであるEnkiで実施されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robotics research has been focusing on cooperative multi-agent problems,
where agents must work together and communicate to achieve a shared objective.
To tackle this challenge, we explore imitation learning algorithms. These
methods learn a controller by observing demonstrations of an expert, such as
the behaviour of a centralised omniscient controller, which can perceive the
entire environment, including the state and observations of all agents.
Performing tasks with complete knowledge of the state of a system is
relatively easy, but centralised solutions might not be feasible in real
scenarios since agents do not have direct access to the state but only to their
observations. To overcome this issue, we train end-to-end Neural Networks that
take as input local observations obtained from an omniscient centralised
controller, i.e., the agents' sensor readings and the communications received,
producing as output the action to be performed and the communication to be
transmitted.
This study concentrates on two cooperative tasks using a distributed
controller: distributing the robots evenly in space and colouring them based on
their position relative to others. While an explicit exchange of messages
between the agents is required to solve the second task, in the first one, a
communication protocol is unnecessary, although it may increase performance.
The experiments are run in Enki, a high-performance open-source simulator for
planar robots, which provides collision detection and limited physics support
for robots evolving on a flat surface. Moreover, it can simulate groups of
robots hundreds of times faster than real-time.
The results show how applying a communication strategy improves the
performance of the distributed model, letting it decide which actions to take
almost as precisely and quickly as the expert controller.
- Abstract(参考訳): ロボティクス研究は協力的なマルチエージェント問題に焦点を当てており、エージェントは共通の目的を達成するために協力し、コミュニケーションしなければならない。
この課題に取り組むために,模倣学習アルゴリズムを探求する。
これらの方法は、すべてのエージェントの状態や観察を含む環境全体を知覚できる集中型全能コントローラの振る舞いのような専門家のデモンストレーションを観察することで、コントローラを学習する。
システムの状態に関する完全な知識を持つタスクの実行は比較的容易であるが、エージェントが状態に直接アクセスするわけではなく、観察にのみアクセスするため、現実のシナリオでは集中型ソリューションは実現できないかもしれない。
本課題を克服するために,全知集中型コントローラ,すなわちエージェントのセンサ読取と受信した通信から得られる入力局所的観測を行うエンド・ツー・エンドニューラルネットワークを訓練し,実行すべき動作と送信すべき通信を出力として生成する。
本研究は,ロボットを空間に均等に分散させ,その位置に応じて色づけする分散コントローラを用いた2つの協調作業に焦点を当てた。
エージェント間のメッセージの明示的な交換は、第2のタスクを解決するために要求されるが、第1のタスクでは、通信プロトコルは不要である。
実験は、平面ロボットのための高性能オープンソースシミュレータであるEnkiで行われ、平面上で進化するロボットの衝突検出と物理サポートが制限されている。
さらに、ロボットのグループを、リアルタイムの何百倍も高速にシミュレートできる。
結果は、コミュニケーション戦略の適用が分散モデルのパフォーマンスをいかに改善するかを示し、どのアクションをエキスパートコントローラと同じくらい正確かつ迅速に行うかを決定する。
関連論文リスト
- Real-Time Multimodal Signal Processing for HRI in RoboCup: Understanding a Human Referee [1.7456666582626115]
本研究では、キーポイント抽出と分類によるジェスチャー認識のための2段階パイプラインと、効率的なwhi検出のための連続畳み込みニューラルネットワーク(CCNN)を実装した。
提案されたアプローチは、RoboCupのような競合する環境でのリアルタイムな人間とロボットのインタラクションを強化し、人間と協力できる自律システムの開発を前進させるためのツールを提供する。
論文 参考訳(メタデータ) (2024-11-26T11:39:43Z) - Human-Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition [48.65867987106428]
本稿では,人間とロボットの協調学習システムについて紹介する。
これにより、ロボットエンドエフェクターの制御を学習支援エージェントと共有することができる。
これにより、ダウンストリームタスクにおいて、収集されたデータが十分な品質であることを保証しながら、人間の適応の必要性を減らすことができる。
論文 参考訳(メタデータ) (2024-06-29T03:37:29Z) - LPAC: Learnable Perception-Action-Communication Loops with Applications
to Coverage Control [80.86089324742024]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。
CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。
評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-01-10T00:08:00Z) - Asynchronous Perception-Action-Communication with Graph Neural Networks [93.58250297774728]
グローバルな目的を達成するため,大規模なロボット群における協調作業は,大規模環境における課題である。
ロボットはパーセプション・アクション・コミュニケーションループを実行し、ローカル環境を認識し、他のロボットと通信し、リアルタイムで行動を起こす必要がある。
近年では、フロッキングやカバレッジ制御などのアプリケーションでグラフニューラルネットワーク(GNN)を使用してこの問題に対処している。
本稿では、分散化されたGNNを用いてナビゲーション動作を計算し、通信のためのメッセージを生成するロボット群における非同期PACフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T21:20:50Z) - Communication-Efficient Reinforcement Learning in Swarm Robotic Networks
for Maze Exploration [2.958532752589616]
コミュニケーションは、Swarmロボットの協調の成功の鍵である。
本稿では,Swarmロボットをコーディネートする通信効率の高い分散協調強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-26T16:56:00Z) - AdverSAR: Adversarial Search and Rescue via Multi-Agent Reinforcement
Learning [4.843554492319537]
本稿では,敵対的エージェント間コミュニケーションの存在下で,ロボットの戦略を効率的に調整するアルゴリズムを提案する。
ロボットは対象の場所について事前の知識を持っておらず、隣接するロボットのサブセットのみといつでも対話できると仮定される。
提案手法の有効性は, グリッドワールド環境のプロトタイプで実証した。
論文 参考訳(メタデータ) (2022-12-20T08:13:29Z) - A Robot Web for Distributed Many-Device Localisation [18.417301483203996]
ロボットの分散ネットワークは、効率的なアドホックピアからピアコミュニケーションを通じて、グローバルなローカライズに協力できることを示す。
任意のパターンで対話する最大1000個のロボットによるシミュレーションにおいて、我々の解は非線形因子グラフ解法と同じくらいの精度でグローバルに精度を達成できることを示す。
論文 参考訳(メタデータ) (2022-02-07T16:00:25Z) - Graph Neural Networks for Decentralized Multi-Robot Submodular Action
Selection [101.38634057635373]
ロボットがチームサブモジュールの目的を最大化するために共同で行動を選択する必要があるアプリケーションに焦点を当てる。
分散通信によるサブモジュール化に向けた汎用学習アーキテクチャを提案する。
大規模ロボットネットワークによるアクティブターゲットカバレッジのシナリオにおいて、GNNベースの学習アプローチのパフォーマンスを実証します。
論文 参考訳(メタデータ) (2021-05-18T15:32:07Z) - Learning Connectivity for Data Distribution in Robot Teams [96.39864514115136]
グラフニューラルネットワーク(GNN)を用いたアドホックネットワークにおけるデータ分散のためのタスク非依存,分散化,低レイテンシ手法を提案する。
当社のアプローチは、グローバル状態情報に基づいたマルチエージェントアルゴリズムを各ロボットで利用可能にすることで機能させます。
我々は,情報の平均年齢を報酬関数として強化学習を通じて分散gnn通信政策を訓練し,タスク固有の報酬関数と比較してトレーニング安定性が向上することを示す。
論文 参考訳(メタデータ) (2021-03-08T21:48:55Z) - Learning to Communicate and Correct Pose Errors [75.03747122616605]
本稿では、V2VNetで提案された設定について検討し、近くにある自動運転車が共同で物体検出と動き予測を協調的に行う方法を提案する。
本稿では,コミュニケーションを学習し,潜在的な誤りを推定し,それらの誤りについてコンセンサスを得るための新しいニューラルネットワーク推論フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-10T18:19:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。