論文の概要: IMAGINE: Intelligent Multi-Agent Godot-based Indoor Networked Exploration
- arxiv url: http://arxiv.org/abs/2602.02858v1
- Date: Mon, 02 Feb 2026 22:08:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.110166
- Title: IMAGINE: Intelligent Multi-Agent Godot-based Indoor Networked Exploration
- Title(参考訳): IMAGINE:Intelligent Multi-Agent Godot-based Indoor Networked Exploration
- Authors: Tiago Leite, Maria Conceição, António Grilo,
- Abstract要約: 本稿では,2次元屋内環境における課題に対処するために,MARL(Multi-Agent Reinforcement Learning)を実装した。
政策訓練は、不確実性の下で創発的な協調行動と意思決定を達成することを目的としている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The exploration of unknown, Global Navigation Satellite System (GNSS) denied environments by an autonomous communication-aware and collaborative group of Unmanned Aerial Vehicles (UAVs) presents significant challenges in coordination, perception, and decentralized decision-making. This paper implements Multi-Agent Reinforcement Learning (MARL) to address these challenges in a 2D indoor environment, using high-fidelity game-engine simulations (Godot) and continuous action spaces. Policy training aims to achieve emergent collaborative behaviours and decision-making under uncertainty using Network-Distributed Partially Observable Markov Decision Processes (ND-POMDPs). Each UAV is equipped with a Light Detection and Ranging (LiDAR) sensor and can share data (sensor measurements and a local occupancy map) with neighbouring agents. Inter-agent communication constraints include limited range, bandwidth and latency. Extensive ablation studies evaluated MARL training paradigms, reward function, communication system, neural network (NN) architecture, memory mechanisms, and POMDP formulations. This work jointly addresses several key limitations in prior research, namely reliance on discrete actions, single-agent or centralized formulations, assumptions of a priori knowledge and permanent connectivity, inability to handle dynamic obstacles, short planning horizons and architectural complexity in Recurrent NNs/Transformers. Results show that the scalable training paradigm, combined with a simplified architecture, enables rapid autonomous exploration of an indoor area. The implementation of Curriculum-Learning (five increasingly complex levels) also enabled faster, more robust training. This combination of high-fidelity simulation, MARL formulation, and computational efficiency establishes a strong foundation for deploying learned cooperative strategies in physical robotic systems.
- Abstract(参考訳): 未知のグローバルナビゲーション衛星システム(GNSS)の探索は、無人航空車両(UAV)の自律的コミュニケーション意識と協調的なグループによる環境を否定し、協調、認識、分散化された意思決定において大きな課題を提起している。
本稿では,高忠実度ゲームエンジンシミュレーション(Godot)と連続アクション空間を用いて,屋内2次元環境におけるこれらの課題に対処するために,マルチエージェント強化学習(MARL)を実装した。
政策訓練は、ネットワーク分散部分観測可能マルコフ決定プロセス(ND-POMDP)を用いて、創発的な協調行動と不確実性の下での意思決定を実現することを目的としている。
各UAVは、光検出・照準センサ(LiDAR)を備えており、データ(センサーの測定と局所占有マップ)を近隣のエージェントと共有することができる。
エージェント間通信の制約には、制限範囲、帯域幅、レイテンシが含まれる。
大規模なアブレーション研究は、MARLトレーニングパラダイム、報酬関数、通信システム、ニューラルネットワーク(NN)アーキテクチャ、メモリ機構、POMDPの定式化を評価した。
この研究は、個別の行動への依存、単一エージェントまたは集中的な定式化、事前知識の仮定と永続的な接続性、動的障害の処理能力の欠如、短い計画の地平線、リカレントNN/トランスフォーマーにおけるアーキテクチャ上の複雑さなど、先行研究におけるいくつかの重要な制限に共同で対処する。
その結果、スケーラブルなトレーニングパラダイムと単純化されたアーキテクチャが組み合わさって、屋内領域の迅速な自律的な探索を可能にすることがわかった。
Curriculum-Learning(5つのより複雑なレベル)の実装も、より速く、より堅牢なトレーニングを可能にした。
高忠実度シミュレーション、MARL定式化、計算効率の組み合わせは、物理ロボットシステムに学習された協調戦略を展開するための強力な基盤を確立する。
関連論文リスト
- Multi-Agent Collaborative Intrusion Detection for Low-Altitude Economy IoT: An LLM-Enhanced Agentic AI Framework [60.72591149679355]
低高度経済の急速な拡大により、インターネット・オブ・モノ(LAE-IoT)ネットワークは前例のないセキュリティ上の課題を生んだ。
従来の侵入検知システムは、空中IoT環境のユニークな特徴に対処できない。
LAE-IoTネットワークにおける侵入検出を強化するための大規模言語モデル(LLM)対応エージェントAIフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-25T12:47:25Z) - Multiagent Reinforcement Learning with Neighbor Action Estimation [5.226225544973531]
本稿では,エージェントの振る舞いを推論するための行動推定ニューラルネットワークを用いたマルチエージェント強化学習フレームワークを提案する。
工学的応用レベルでは、このフレームワークはデュアルアームロボット操作タスクで実装され、検証されている。
論文 参考訳(メタデータ) (2026-01-08T02:26:57Z) - Multi-Agent Deep Reinforcement Learning for Collaborative UAV Relay Networks under Jamming Atatcks [36.380478794869234]
本稿では,この課題を,分散実行トレーニング(CTDE)フレームワークを用いて解決したMARL(Multi-Agent Reinforcement Learning)問題として定式化する。
提案手法はベースラインを著しく上回り,システム全体のスループットを約50%向上し,同時にほぼゼロの衝突速度を実現した。
重要な発見は、エージェントが明示的なプログラミングなしに創発的なアンチジャミング戦略を開発することである。
論文 参考訳(メタデータ) (2025-12-09T08:11:21Z) - Hierarchical Task Offloading and Trajectory Optimization in Low-Altitude Intelligent Networks Via Auction and Diffusion-based MARL [37.79695337425523]
低高度インテリジェントネットワーク(LAIN)は、災害対応、環境モニタリング、リアルタイムセンシングといったミッションクリティカルなアプリケーションをサポートすることができる。
これらのシステムは、エネルギー制約のあるUAV、タスク到着、異種コンピューティングリソースなど、重要な課題に直面している。
本稿では,UAV軌道計画とタスクオフロード決定を協調的に最適化する,時間依存型整数型非線形計画問題の解法を提案する。
論文 参考訳(メタデータ) (2025-12-05T08:14:45Z) - CREW-WILDFIRE: Benchmarking Agentic Multi-Agent Collaborations at Scale [4.464959191643012]
我々は、次世代マルチエージェントエージェントAIフレームワークを評価するために設計されたオープンソースのベンチマークであるCREW-Wildfireを紹介する。
CREW-Wildfireは、大きな地図、異種エージェント、部分観測可能性、ダイナミックス、長期計画目的を含む手続き的に生成された山火事対応シナリオを提供する。
我々は、最先端のLLMベースのマルチエージェントエージェントAIフレームワークの実装と評価を行い、重要なパフォーマンスギャップを明らかにした。
論文 参考訳(メタデータ) (2025-07-07T16:33:42Z) - Benchmarking LLMs' Swarm intelligence [51.648605206159125]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。
分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。
本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文 参考訳(メタデータ) (2025-05-07T12:32:01Z) - RIS-empowered Topology Control for Distributed Learning in Urban Air
Mobility [35.04722426910211]
アーバン・エアモビリティ(UAM)は、輸送システムの革命として想定される、地上から地上に近い空間に車両を拡大する。
この課題を克服するために、リソース制限されたデバイスが協調的に深層学習(DL)を行うことを可能にするために、フェデレーション・ラーニング(FL)や他の協調学習が提案されている。
本稿では,分散学習を支援する再構成可能なインテリジェントサーフェス (RIS) について検討する。
論文 参考訳(メタデータ) (2024-03-08T08:05:50Z) - Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots [58.980293789967575]
通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。
室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。
調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
論文 参考訳(メタデータ) (2020-11-23T21:45:01Z) - Phase Configuration Learning in Wireless Networks with Multiple
Reconfigurable Intelligent Surfaces [50.622375361505824]
RIS(Reconfigurable Intelligent Surfaces)は、電磁波伝搬の動的制御を提供する、高度にスケーラブルな技術である。
RISを内蔵した無線通信における大きな課題の1つは、複数のRISの低オーバーヘッドダイナミックな構成である。
RISの位相構成に対する低複雑さ教師あり学習手法を考案する。
論文 参考訳(メタデータ) (2020-10-09T05:35:27Z) - Deep Multi-Task Learning for Cooperative NOMA: System Design and
Principles [52.79089414630366]
我々は,近年のディープラーニング(DL)の進歩を反映した,新しいディープ・コラボレーティブなNOMAスキームを開発する。
我々は,システム全体を包括的に最適化できるように,新しいハイブリッドカスケードディープニューラルネットワーク(DNN)アーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-07-27T12:38:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。