論文の概要: Sensor to Pixels: Decentralized Swarm Gathering via Image-Based Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2601.03413v1
- Date: Tue, 06 Jan 2026 20:58:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.070895
- Title: Sensor to Pixels: Decentralized Swarm Gathering via Image-Based Reinforcement Learning
- Title(参考訳): Sensor to Pixels:イメージベース強化学習による分散Swarmゲザリング
- Authors: Yigal Koifman, Eran Iceland, Erez Koifman, Ariel Barel, Alfred M. Bruckstein,
- Abstract要約: マルチエージェントシステムの分散制御のための画像に基づく強化学習手法を提案する。
観測はニューラルネットワークによって処理できる構造化された視覚入力として符号化される。
我々は,限られた範囲とベアリングのみを感知するエージェントのマルチエージェント収束タスクに対するアプローチを評価する。
- 参考スコア(独自算出の注目度): 2.5950969608246797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study highlights the potential of image-based reinforcement learning methods for addressing swarm-related tasks. In multi-agent reinforcement learning, effective policy learning depends on how agents sense, interpret, and process inputs. Traditional approaches often rely on handcrafted feature extraction or raw vector-based representations, which limit the scalability and efficiency of learned policies concerning input order and size. In this work we propose an image-based reinforcement learning method for decentralized control of a multi-agent system, where observations are encoded as structured visual inputs that can be processed by Neural Networks, extracting its spatial features and producing novel decentralized motion control rules. We evaluate our approach on a multi-agent convergence task of agents with limited-range and bearing-only sensing that aim to keep the swarm cohesive during the aggregation. The algorithm's performance is evaluated against two benchmarks: an analytical solution proposed by Bellaiche and Bruckstein, which ensures convergence but progresses slowly, and VariAntNet, a neural network-based framework that converges much faster but shows medium success rates in hard constellations. Our method achieves high convergence, with a pace nearly matching that of VariAntNet. In some scenarios, it serves as the only practical alternative.
- Abstract(参考訳): 本研究は,Swarm関連課題に対処するためのイメージベース強化学習手法の可能性を明らかにする。
多エージェント強化学習では、効果的なポリシー学習はエージェントがどのように理解し、解釈し、プロセス入力するかに依存する。
伝統的なアプローチは手作りの特徴抽出や生ベクトルベースの表現に依存しており、入力順序とサイズに関する学習ポリシーのスケーラビリティと効率を制限している。
本研究では,ニューラルネットワークが処理し,空間的特徴を抽出し,新たな分散動作制御ルールを生成する,マルチエージェントシステムの分散制御のための画像ベース強化学習手法を提案する。
我々は,群集の凝集性を維持することを目的とした,限られた範囲とベアリングのみの感覚を有するエージェントのマルチエージェント収束タスクに対するアプローチを評価した。
アルゴリズムのパフォーマンスは、2つのベンチマークで評価されている: Bellaiche と Bruckstein によって提案された、収束を保証するが、ゆっくりと進行する分析ソリューションと、より高速に収束するがハードコンステレーションで中程度の成功率を示すニューラルネットワークベースのフレームワーク VariAntNet である。
VariAntNetとほぼ一致するペースで高収束を実現する。
いくつかのシナリオでは、唯一の実用的な代替手段として機能する。
関連論文リスト
- Resource-Aware Neural Network Pruning Using Graph-based Reinforcement Learning [0.8890833546984916]
本稿では,グラフベースの観測空間をAutoMLフレームワークに統合することで,ニューラルネットワークのプルーニングに新たなアプローチを提案する。
本フレームワークは,対象ニューラルネットワークのグラフ表現を導入することにより,刈り込み処理を変換する。
作用空間に対しては、連続プルーニング比から細粒な二分作用空間へ遷移する。
論文 参考訳(メタデータ) (2025-09-04T15:05:05Z) - VariAntNet: Learning Decentralized Control of Multi-Agent Systems [2.5950969608246797]
単純なマルチエージェントシステムは、消防などの災害対応アプリケーションに効果的に利用することができる。
これらの単純なロボットエージェントは、Ant Robotsとしても知られており、限定的な知覚能力を持ち、共有座標系を持たない匿名エージェントとして定義されている。
本稿では,エージェントスワーミングと協調的なタスク実行を容易にするために,ディープラーニングに基づく分散制御モデルであるVariAntNetを提案する。
論文 参考訳(メタデータ) (2025-09-02T12:48:15Z) - Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [86.99017195607077]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Learning Transferable Adversarial Robust Representations via Multi-view
Consistency [57.73073964318167]
デュアルエンコーダを用いたメタ逆多視点表現学習フレームワークを提案する。
未確認領域からの少数ショット学習タスクにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-19T11:48:01Z) - SA-MATD3:Self-attention-based multi-agent continuous control method in
cooperative environments [12.959163198988536]
既存のアルゴリズムは、エージェントの数が増加するにつれて、不均一な学習度の問題に悩まされる。
マルチエージェントアクター批評家のための新しい構造を提案し,批評家ネットワークに自己注意機構を適用した。
提案アルゴリズムは、リプレイメモリバッファ内のサンプルをフル活用して、エージェントのクラスの振る舞いを学習する。
論文 参考訳(メタデータ) (2021-07-01T08:15:05Z) - Decentralized Deep Learning using Momentum-Accelerated Consensus [15.333413663982874]
複数のエージェントが協調して分散データセットから学習する分散ディープラーニングの問題を考える。
本稿では,エージェントが固定された通信トポロジ上で対話する分散ディープラーニングアルゴリズムを提案し,解析する。
本アルゴリズムは,勾配に基づくプロトコルで用いられるヘビーボール加速度法に基づく。
論文 参考訳(メタデータ) (2020-10-21T17:39:52Z) - A general framework for decentralized optimization with first-order
methods [11.50057411285458]
ノードネットワーク上の関数の有限和を最小化する分散最適化は、制御と信号処理の研究において重要な焦点となっている。
高度なコンピューティングと大規模データサイエンスの必要性の出現は、この分野における活動の復活につながった。
本稿では、制御、信号処理、機械学習問題に多大な成功を収めた分散一階勾配法について論じる。
論文 参考訳(メタデータ) (2020-09-12T17:52:10Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。