論文の概要: Learning Connectivity for Data Distribution in Robot Teams
- arxiv url: http://arxiv.org/abs/2103.05091v1
- Date: Mon, 8 Mar 2021 21:48:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-11 07:46:48.996976
- Title: Learning Connectivity for Data Distribution in Robot Teams
- Title(参考訳): ロボットチームにおけるデータ分散のためのコネクティビティ学習
- Authors: Ekaterina Tolstaya, Landon Butler, Daniel Mox, James Paulos, Vijay
Kumar, Alejandro Ribeiro
- Abstract要約: グラフニューラルネットワーク(GNN)を用いたアドホックネットワークにおけるデータ分散のためのタスク非依存,分散化,低レイテンシ手法を提案する。
当社のアプローチは、グローバル状態情報に基づいたマルチエージェントアルゴリズムを各ロボットで利用可能にすることで機能させます。
我々は,情報の平均年齢を報酬関数として強化学習を通じて分散gnn通信政策を訓練し,タスク固有の報酬関数と比較してトレーニング安定性が向上することを示す。
- 参考スコア(独自算出の注目度): 96.39864514115136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many algorithms for control of multi-robot teams operate under the assumption
that low-latency, global state information necessary to coordinate agent
actions can readily be disseminated among the team. However, in harsh
environments with no existing communication infrastructure, robots must form
ad-hoc networks, forcing the team to operate in a distributed fashion. To
overcome this challenge, we propose a task-agnostic, decentralized, low-latency
method for data distribution in ad-hoc networks using Graph Neural Networks
(GNN). Our approach enables multi-agent algorithms based on global state
information to function by ensuring it is available at each robot. To do this,
agents glean information about the topology of the network from packet
transmissions and feed it to a GNN running locally which instructs the agent
when and where to transmit the latest state information. We train the
distributed GNN communication policies via reinforcement learning using the
average Age of Information as the reward function and show that it improves
training stability compared to task-specific reward functions. Our approach
performs favorably compared to industry-standard methods for data distribution
such as random flooding and round robin. We also show that the trained policies
generalize to larger teams of both static and mobile agents.
- Abstract(参考訳): マルチロボットチームの制御のための多くのアルゴリズムは、エージェントアクションの調整に必要な低遅延、グローバル状態情報をチーム間で容易に広めることができると仮定して動作する。
しかし、既存の通信インフラのない厳しい環境では、ロボットはアドホックなネットワークを形成しなければならない。
この課題を克服するために,グラフニューラルネットワーク(gnn)を用いたアドホックネットワークにおけるデータ分散のためのタスク非依存,分散,低遅延手法を提案する。
当社のアプローチは、グローバル状態情報に基づいたマルチエージェントアルゴリズムを各ロボットで利用可能にすることで機能させます。
これを実現するために、エージェントはパケット送信からネットワークのトポロジーに関する情報を収集し、ローカルに実行中のgnnに送信し、最新の状態情報をいつどこで送信するかをエージェントに指示する。
我々は,情報の平均年齢を報酬関数として強化学習を通じて分散gnn通信政策を訓練し,タスク固有の報酬関数と比較してトレーニング安定性が向上することを示す。
本手法はランダムフラッディングやラウンドロビンといった業界標準のデータ分散手法と比較して好適に機能する。
また、訓練されたポリシーが静的エージェントとモバイルエージェントの両方のより大きなチームに一般化されることも示します。
関連論文リスト
- Generalizability of Graph Neural Networks for Decentralized Unlabeled Motion Planning [72.86540018081531]
ラベルなしの動作計画では、衝突回避を確保しながら、ロボットのセットを目標の場所に割り当てる。
この問題は、探査、監視、輸送などの応用において、マルチロボットシステムにとって不可欠なビルディングブロックを形成している。
この問題に対処するために、各ロボットは、その400ドルのアネレストロボットと$k$アネレストターゲットの位置のみを知っている分散環境で対処する。
論文 参考訳(メタデータ) (2024-09-29T23:57:25Z) - LPAC: Learnable Perception-Action-Communication Loops with Applications
to Coverage Control [80.86089324742024]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。
CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。
評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-01-10T00:08:00Z) - Robot Fleet Learning via Policy Merging [58.5086287737653]
我々はFLEET-MERGEを提案し、艦隊設定における政策を効率的にマージする。
本稿では,FLEET-MERGEがメタワールド環境における50のタスクで訓練されたポリシーの行動を統合することを示す。
合成・接触に富んだロボット操作タスクにおけるフリートポリシー学習のための新しいロボットツール用ベンチマークであるFLEET-TOOLSを導入する。
論文 参考訳(メタデータ) (2023-10-02T17:23:51Z) - Asynchronous Perception-Action-Communication with Graph Neural Networks [93.58250297774728]
グローバルな目的を達成するため,大規模なロボット群における協調作業は,大規模環境における課題である。
ロボットはパーセプション・アクション・コミュニケーションループを実行し、ローカル環境を認識し、他のロボットと通信し、リアルタイムで行動を起こす必要がある。
近年では、フロッキングやカバレッジ制御などのアプリケーションでグラフニューラルネットワーク(GNN)を使用してこの問題に対処している。
本稿では、分散化されたGNNを用いてナビゲーション動作を計算し、通信のためのメッセージを生成するロボット群における非同期PACフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T21:20:50Z) - Mean-Field Multi-Agent Reinforcement Learning: A Decentralized Network
Approach [6.802025156985356]
本稿では,MARLを状態ネットワークで学習するために,局所学習と分散実行というフレームワークを提案する。
鍵となる考え方は、エージェントの均質性を利用し、それらの状態に応じてそれらを再分類することであり、それによってネットワーク化されたマルコフ決定過程が定式化される。
論文 参考訳(メタデータ) (2021-08-05T16:52:36Z) - Graph Neural Networks for Decentralized Multi-Robot Submodular Action
Selection [101.38634057635373]
ロボットがチームサブモジュールの目的を最大化するために共同で行動を選択する必要があるアプリケーションに焦点を当てる。
分散通信によるサブモジュール化に向けた汎用学習アーキテクチャを提案する。
大規模ロボットネットワークによるアクティブターゲットカバレッジのシナリオにおいて、GNNベースの学習アプローチのパフォーマンスを実証します。
論文 参考訳(メタデータ) (2021-05-18T15:32:07Z) - BayGo: Joint Bayesian Learning and Information-Aware Graph Optimization [48.30183416069897]
BayGoは、ベイズ学習とグラフ最適化のフレームワークである。
本研究の枠組みは、完全連結および恒星トポロジーグラフと比較して、より高速な収束と精度を実現する。
論文 参考訳(メタデータ) (2020-11-09T11:16:55Z) - Who2com: Collaborative Perception via Learnable Handshake Communication [34.29310680302486]
本稿では,ロボットが周囲のエージェントと局所的な観察を組み合わせて学習可能な方法で認識タスクの精度を向上する,協調的知覚の問題を提案する。
ネットワーク通信プロトコルにヒントを得た多段階ハンドシェイク通信機構を提案する。
セマンティックセグメンテーションタスクにおいて、ハンドシェイク通信方式は、分散ベースラインよりも約20%精度が向上し、帯域幅の4分の1を使用した集中型セグメンテーションに匹敵することを示す。
論文 参考訳(メタデータ) (2020-03-21T04:16:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。