論文の概要: VariAntNet: Learning Decentralized Control of Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2509.02271v1
- Date: Tue, 02 Sep 2025 12:48:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:04.025725
- Title: VariAntNet: Learning Decentralized Control of Multi-Agent Systems
- Title(参考訳): VariAntNet:マルチエージェントシステムの分散制御学習
- Authors: Yigal Koifman, Erez Koifman, Eran Iceland, Ariel Barel, Alfred M. Bruckstein,
- Abstract要約: 単純なマルチエージェントシステムは、消防などの災害対応アプリケーションに効果的に利用することができる。
これらの単純なロボットエージェントは、Ant Robotsとしても知られており、限定的な知覚能力を持ち、共有座標系を持たない匿名エージェントとして定義されている。
本稿では,エージェントスワーミングと協調的なタスク実行を容易にするために,ディープラーニングに基づく分散制御モデルであるVariAntNetを提案する。
- 参考スコア(独自算出の注目度): 2.5950969608246797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A simple multi-agent system can be effectively utilized in disaster response applications, such as firefighting. Such a swarm is required to operate in complex environments with limited local sensing and no reliable inter-agent communication or centralized control. These simple robotic agents, also known as Ant Robots, are defined as anonymous agents that possess limited sensing capabilities, lack a shared coordinate system, and do not communicate explicitly with one another. A key challenge for simple swarms lies in maintaining cohesion and avoiding fragmentation despite limited-range sensing. Recent advances in machine learning offer effective solutions to some of the classical decentralized control challenges. We propose VariAntNet, a deep learning-based decentralized control model designed to facilitate agent swarming and collaborative task execution. VariAntNet includes geometric features extraction from unordered, variable-sized local observations. It incorporates a neural network architecture trained with a novel, differentiable, multi-objective, mathematically justified loss function that promotes swarm cohesiveness by utilizing the properties of the visibility graph Laplacian matrix. VariAntNet is demonstrated on the fundamental multi-agent gathering task, where agents with bearing-only and limited-range sensing must gather at some location. VariAntNet significantly outperforms an existing analytical solution, achieving more than double the convergence rate while maintaining high swarm connectivity across varying swarm sizes. While the analytical solution guarantees cohesion, it is often too slow in practice. In time-critical scenarios, such as emergency response operations where lives are at risk, slower analytical methods are impractical and justify the loss of some agents within the swarm. This paper presents and analyzes this trade-off in detail.
- Abstract(参考訳): 単純なマルチエージェントシステムは、消防などの災害対応アプリケーションに効果的に利用することができる。
このようなSwarmは、ローカルセンシングが制限され、信頼できるエージェント間通信や集中管理が不要な複雑な環境で運用する必要がある。
これらの単純なロボットエージェントは、Ant Robotsとしても知られており、限定的な知覚能力を持ち、共有座標系を持たない匿名エージェントとして定義されている。
単純な群れにとって重要な課題は、限られた範囲のセンシングにもかかわらず凝集を維持し、断片化を避けることである。
機械学習の最近の進歩は、古典的な分散制御課題に対する効果的な解決策を提供する。
本稿では,エージェントスワーミングと協調的なタスク実行を容易にするために,ディープラーニングに基づく分散制御モデルであるVariAntNetを提案する。
VariAntNetには、未順序で可変サイズの局所的な観測から抽出される幾何学的特徴が含まれている。
このアーキテクチャは、新しい、微分可能、多目的、数学的に正当化された損失関数で訓練されたニューラルネットワークアーキテクチャを組み込んでいる。
VariAntNetは基本的なマルチエージェント収集タスクで実証されており、ベアリングのみのエージェントとリミテッドレンジのセンサーを持つエージェントがどこかの場所に集まる必要がある。
VariAntNetは既存の分析ソリューションを著しく上回り、様々なSwarmサイズにわたる高いSwarm接続を維持しながら収束率を2倍以上に向上させる。
解析解は凝集を保証するが、実際は遅すぎることが多い。
生命が危険にさらされている緊急対応操作のような時間クリティカルなシナリオでは、遅い分析手法は非現実的であり、Swarm内の一部のエージェントの損失を正当化する。
本稿では,このトレードオフを詳細に提示し,分析する。
関連論文リスト
- Benchmarking LLMs' Swarm intelligence [50.544186914115045]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。
分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。
本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文 参考訳(メタデータ) (2025-05-07T12:32:01Z) - Graph Based Deep Reinforcement Learning Aided by Transformers for Multi-Agent Cooperation [2.8169258551959544]
本稿では、グラフニューラルネットワーク(GNN)、深層強化学習(DRL)、マルチエージェント協調と集合タスク実行の強化のためのトランスフォーマーベースのメカニズムを統合する新しいフレームワークを提案する。
提案手法はGNNを用いて,適応グラフ構築によるエージェントエージェントとエージェントゴールの相互作用をモデル化し,制約付き通信下での効率的な情報集約と意思決定を可能にする。
論文 参考訳(メタデータ) (2025-04-11T01:46:18Z) - Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
MADiffは拡散型マルチエージェント学習フレームワークである。
分散ポリシと集中型コントローラの両方として機能する。
実験の結果,MADiffは様々なマルチエージェント学習タスクにおいて,ベースラインアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2023-05-27T02:14:09Z) - Distributed Online Rollout for Multivehicle Routing in Unmapped
Environments [0.8437187555622164]
我々は、よく知られた多車両ルーティング問題に対して、完全に分散し、オンラインでスケーラブルな強化学習アルゴリズムを提案する。
エージェントはローカルクラスタに自己組織化し、各クラスタにローカルにマルチエージェントロールアウトスキームを独立に適用する。
提案アルゴリズムは, 放射半径の2倍と3倍の精度で, 基本方針よりも約2倍のコスト向上を実現している。
論文 参考訳(メタデータ) (2023-05-24T22:06:44Z) - Scalable Task-Driven Robotic Swarm Control via Collision Avoidance and
Learning Mean-Field Control [23.494528616672024]
我々は、最先端平均場制御技術を用いて、多くのエージェントSwarm制御を分散の古典的な単一エージェント制御に変換する。
そこで我々は,衝突回避と平均場制御の学習を,知的ロボット群動作を牽引的に設計するための統一的な枠組みに統合する。
論文 参考訳(メタデータ) (2022-09-15T16:15:04Z) - Multi-Agent Routing Value Iteration Network [88.38796921838203]
疎結合グラフの学習値に基づいてマルチエージェントルーティングを行うことができるグラフニューラルネットワークに基づくモデルを提案する。
最大25ノードのグラフ上で2つのエージェントでトレーニングしたモデルでは,より多くのエージェントやノードを持つ状況に容易に一般化できることが示されている。
論文 参考訳(メタデータ) (2020-07-09T22:16:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。