論文の概要: SPIN: Decentralized Swarm Control via Tensorized Policy Coordination
- arxiv url: http://arxiv.org/abs/2606.07557v1
- Date: Mon, 25 May 2026 07:45:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.717072
- Title: SPIN: Decentralized Swarm Control via Tensorized Policy Coordination
- Title(参考訳): SPIN:テンソル化政策調整による分散Swarm制御
- Authors: Zhaowen Fan,
- Abstract要約: 本稿では,Swarm Policy Interference Network(SPIN)フレームワークを紹介する。
局所多エージェント傾斜角の合同ポリシーテンソルを行列積状態鎖に分解する。
局所的な連続空間幾何学をこの離散代数的バックエンドでブリッジするために、分離されたハイブリッド型ニューロシンボリック制御パイプラインを導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Decentralized multi-agent swarm coordination on resource-constrained edge platforms remains fundamentally bottlenecked by the exponential scaling of joint action spaces and high-latency communication overhead. This paper introduces the Swarm Policy Interference Network (SPIN) framework, an architectural paradigm that bypasses these limitations by modeling swarm topologies as a compressed tensor network. We factorize the joint policy tensors of local multi-agent cliques into Matrix Product State (MPS) chains, reducing the computational complexity of evaluation from an exponential $O(n^m)$ wall to a strictly linear $O(m \cdot n \cdot χ^2)$ constraint. To bridge local continuous spatial geometry with this discrete algebraic backend without requiring power-intensive online training loops, we introduce a decoupled, hybrid neuro-symbolic control pipeline. Local multi-layered neural networks operate as structural coordination encoders, pre-trained offline to nonlinearly map hand-engineered geometric descriptors into abstract environmental target measures. At runtime, edge agents execute instantaneous behavioral adaptations by applying the Radon-Nikodým derivative directly as a zero-shot importance-reweighting filter. We validate the framework within a discrete-time multi-agent simulation sandbox spanning tracking, decentralized dispersion/area coverage, and multi-goal coordination regimes. Qualitative telemetry demonstrates that the integrated pipeline achieves stable target-directed motion, anti-collapse spatial spreading under decentralized constraints, and structured subgroup formation across multiple targets, providing a mathematically grounded route to tractable, low-power edge swarm intelligence.
- Abstract(参考訳): 資源制約されたエッジプラットフォーム上での分散マルチエージェントSwarm調整は、ジョイントアクション空間の指数的スケーリングと高遅延通信オーバーヘッドにより、基本的にボトルネックとなる。
本稿では,Swarm Policy Interference Network(SPIN)フレームワークを紹介し,Swarmトポロジを圧縮テンソルネットワークとしてモデル化することにより,これらの制約を回避するアーキテクチャパラダイムを提案する。
局所的マルチエージェント傾斜角の合同ポリシーテンソルを行列積状態(MPS)連鎖に分解し、指数的な$O(n^m)$壁から厳密な線形な$O(m \cdot n \cdot )^2)$制約への評価の計算複雑性を低減させる。
局所的な連続空間幾何学をこの離散代数的バックエンドにブリッジするために、パワー集約型オンライントレーニングループを必要とせず、分離されたハイブリッド型ニューロシンボリック制御パイプラインを導入する。
局所的な多層ニューラルネットワークは構造調整エンコーダとして機能し、オフラインでトレーニングされ、手書きの幾何学的記述子を抽象的な環境目標尺度にマッピングする。
実行時に、エッジエージェントは、ゼロショットの重要度重み付けフィルタとして直接ラドン-ニコデム微分を適用することにより、瞬時的な行動適応を実行する。
離散時間マルチエージェントシミュレーションサンドボックスにおいて,分散分散領域の分散,分散領域の分散,マルチゴール調整の仕組みを検証した。
定性的テレメトリは、統合パイプラインが安定な目標指向運動、分散された制約の下での反崩壊空間の広がり、複数の目標にわたる構造化されたサブグループの形成を実現し、引き分け可能な低消費電力のエッジ群知能への数学的基盤を提供することを示した。
関連論文リスト
- Bypassing the CSI Bottleneck: MARL-Driven Spatial Control for Reflector Arrays [8.046649921554472]
本稿では,機械的に調整可能な金属リフレクタアレイを制御するための,完全自律型マルチエージェント強化学習(MARL)フレームワークを提案する。
動的非線形(NLOS)環境における高忠実光線トレーシングシミュレーションは、このマルチエージェントアプローチがユーザモビリティに迅速に適応することを示す。
これらの結果は,MARLによる空間抽象化の有効性を,AIを利用した無線ネットワークへのスケーラブルで実用的な経路として検証した。
論文 参考訳(メタデータ) (2026-04-06T20:47:50Z) - Mean-Field Control on Sparse Graphs: From Local Limits to GNNs via Neighborhood Distributions [5.081469534056712]
平均場制御(MFC)は、マルチエージェントシステムにおける次元性の呪いに対するスケーラブルな解決策を提供する。
我々は、大きなスパースグラフ上のMFCのための厳密なフレームワークを提案することによって、現実世界のネットワーク構造にギャップを埋める。
論文 参考訳(メタデータ) (2026-01-29T09:57:48Z) - Power Grid Control with Graph-Based Distributed Reinforcement Learning [60.49805771047161]
この作業は、リアルタイムでスケーラブルなグリッド管理のためのグラフベースの分散強化学習フレームワークを前進させる。
グラフニューラルネットワーク(GNN)を使用して、ネットワークのトポロジ情報を単一の低レベルエージェントの観測内にエンコードする。
Grid2Opシミュレーション環境での実験は、このアプローチの有効性を示している。
論文 参考訳(メタデータ) (2025-09-02T22:17:25Z) - Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [86.99017195607077]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Distributed Policy Gradient for Linear Quadratic Networked Control with
Limited Communication Range [23.500806437272487]
局所的な情報のみを用いて正確な勾配を近似できることを示す。
集中型最適制御器と比較して、通信と制御範囲が増加するにつれて性能ギャップは指数関数的に減少する。
論文 参考訳(メタデータ) (2024-03-05T15:38:54Z) - DSGD-CECA: Decentralized SGD with Communication-Optimal Exact Consensus
Algorithm [30.728112082204724]
Decentralized Gradient Descent(SGD)は、複数のエージェントが協調的に同時にモデルをトレーニングすることを可能にする、新たなニューラルネットワークトレーニングアプローチである。
本稿では,Underline Decentralized UnderlineSGD with UnderlineCommunication-Optimal UnderlineExact UnderlineAlgorithm (DSGD-CECA)を提案する。
我々の証明は,ゴシップ重量行列の新たに発見された性質とDSGと組み合わせた新しいアプローチに基づくものである。
論文 参考訳(メタデータ) (2023-06-01T00:29:52Z) - Decentralized Learning Made Easy with DecentralizePy [3.1848820580333737]
分散学習(DL)は、スケーラビリティ、プライバシ、フォールトトレランスの面でその潜在的な利点で有名になった。
本稿では,大規模学習ネットワークを任意のトポロジでエミュレート可能な分散機械学習フレームワークDecentralizePyを提案する。
いくつかのトポロジ上にスパーシフィケーションやセキュアアグリゲーションといったテクニックを配置することで、分散Pyの能力を実証する。
論文 参考訳(メタデータ) (2023-04-17T14:42:33Z) - Learning Autonomy in Management of Wireless Random Networks [102.02142856863563]
本稿では,任意の数のランダム接続ノードを持つ無線ネットワークにおいて,分散最適化タスクに取り組む機械学習戦略を提案する。
我々は,ネットワークトポロジとは無関係に,前方および後方に計算を行う分散メッセージパスニューラルネットワーク(DMPNN)と呼ばれる,柔軟な深層ニューラルネットワーク形式を開発した。
論文 参考訳(メタデータ) (2021-06-15T09:03:28Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。