論文の概要: UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery
- arxiv url: http://arxiv.org/abs/2603.10528v1
- Date: Wed, 11 Mar 2026 08:31:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:32.851017
- Title: UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery
- Title(参考訳): UAV-MARL:時間的・動的医療提供のためのマルチエージェント強化学習
- Authors: Islam Guven, Mehmet Parlak,
- Abstract要約: 無人航空機(UAV)は、時間的に重要な医療用品の供給を支援するためにますます使われてきている。
本稿では,医療提供シナリオにおけるUAV艦隊の調整のための強化学習フレームワークを提案する。
このフレームワークは、医療タスクを優先順位付けし、UAVリソースをリアルタイムで再配置し、緊急ロジスティクスを管理するために医療スタッフを支援する決定支援層を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Unmanned aerial vehicles (UAVs) are increasingly used to support time-critical medical supply delivery, providing rapid and flexible logistics during emergencies and resource shortages. However, effective deployment of UAV fleets requires coordination mechanisms capable of prioritizing medical requests, allocating limited aerial resources, and adapting delivery schedules under uncertain operational conditions. This paper presents a multi-agent reinforcement learning (MARL) framework for coordinating UAV fleets in stochastic medical delivery scenarios where requests vary in urgency, location, and delivery deadlines. The problem is formulated as a partially observable Markov decision process (POMDP) in which UAV agents maintain awareness of medical delivery demands while having limited visibility of other agents due to communication and localization constraints. The proposed framework employs Proximal Policy Optimization (PPO) as the primary learning algorithm and evaluates several variants, including asynchronous extensions, classical actor--critic methods, and architectural modifications to analyze scalability and performance trade-offs. The model is evaluated using real-world geographic data from selected clinics and hospitals extracted from the OpenStreetMap dataset. The framework provides a decision-support layer that prioritizes medical tasks, reallocates UAV resources in real time, and assists healthcare personnel in managing urgent logistics. Experimental results show that classical PPO achieves superior coordination performance compared to asynchronous and sequential learning strategies, highlighting the potential of reinforcement learning for adaptive and scalable UAV-assisted healthcare logistics.
- Abstract(参考訳): 無人航空機(UAV)は、緊急時や資源不足時に、迅速かつ柔軟な物流を提供するため、時間的に重要な医療物資の供給を支援するためにますます利用されている。
しかし、UAV艦隊の効果的な配備には、医療要求の優先順位付け、限られた航空資源の割り当て、不確実な運用条件下での配送スケジュールの適応といった調整機構が必要である。
本稿では, 緊急時, 場所, 納期によって要求が変化する確率的医療提供シナリオにおいて, UAV艦隊を調整するためのマルチエージェント強化学習(MARL)フレームワークを提案する。
この問題は部分的に観察可能なマルコフ決定プロセス(POMDP)として定式化され、UAVエージェントは医療提供要求の認識を維持しつつ、通信やローカライゼーションの制約により他のエージェントの視認性が制限される。
提案フレームワークは,PPO(Proximal Policy Optimization)を初等学習アルゴリズムとして採用し,非同期拡張,古典的アクタ批判手法,拡張性やパフォーマンスのトレードオフを解析するためのアーキテクチャ修正など,いくつかの変種を評価する。
このモデルは,OpenStreetMapデータセットから抽出した選択された診療所や病院の実際の地理データを用いて評価する。
このフレームワークは、医療タスクを優先順位付けし、UAVリソースをリアルタイムで再配置し、緊急ロジスティクスを管理するために医療スタッフを支援する決定支援層を提供する。
実験結果から,従来のPPOは,適応的かつスケーラブルなUAV支援医療ロジスティクスのための強化学習の可能性を強調し,非同期およびシーケンシャルな学習戦略よりも優れたコーディネーション性能を実現することが示された。
関連論文リスト
- MedSAM-Agent: Empowering Interactive Medical Image Segmentation with Multi-turn Agentic Reinforcement Learning [53.37068897861388]
MedSAM-Agentは、対話的なセグメンテーションを多段階の自律的な意思決定プロセスとして再構築するフレームワークである。
マルチターン・エンド・ツー・エンドの成果検証を統合した2段階のトレーニングパイプラインを開発した。
6つの医療モダリティと21のデータセットにわたる実験は、MedSAM-Agentが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-03T09:47:49Z) - From Coordination to Personalization: A Trust-Aware Simulation Framework for Emergency Department Decision Support [0.0]
本研究では,医師や看護婦をコンピュータ信頼機構によって誘導されるインテリジェントエージェントとしてモデル化するためのシミュレーションベースのフレームワークを提案する。
提案手法は,緊急医療におけるエビデンスに基づく意思決定支援のための計算信頼の可能性を示すものである。
論文 参考訳(メタデータ) (2025-09-09T18:00:44Z) - LLM Meets the Sky: Heuristic Multi-Agent Reinforcement Learning for Secure Heterogeneous UAV Networks [57.27815890269697]
この研究は、エネルギー制約下での不均一なUAVネットワーク(HetUAVN)における機密率の最大化に焦点を当てている。
本稿では,Large Language Model (LLM) を用いたマルチエージェント学習手法を提案する。
その結果,本手法は機密性やエネルギー効率において,既存のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-07-23T04:22:57Z) - Age of Information Minimization in UAV-Enabled Integrated Sensing and Communication Systems [34.92822911897626]
統合センシング通信(ISAC)機能を備えた無人航空機(UAV)は、将来の無線ネットワークにおいて重要な役割を果たすと想定されている。
ターゲットセンシングとマルチユーザ通信を同時に行う老化情報(AoI)システムを提案する。
論文 参考訳(メタデータ) (2025-07-18T18:17:09Z) - Efficient UAV Swarm-Based Multi-Task Federated Learning with Dynamic Task Knowledge Sharing [13.143754448388927]
災害救助のシナリオでは、UAVは、群衆検出、道路実現可能性分析、災害評価などのタスクを実行する。
本稿では,地上緊急車両(EV)がUAVと協調して複数のタスクを効率的に遂行する,UAVスワムに基づくマルチタスクFLフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-12T08:13:39Z) - Cooperative Cognitive Dynamic System in UAV Swarms: Reconfigurable Mechanism and Framework [80.39138462246034]
UAVスワムの管理を最適化するための協調認知力学システム(CCDS)を提案する。
CCDSは階層的かつ協調的な制御構造であり、リアルタイムのデータ処理と意思決定を可能にする。
さらに、CCDSは、UAVスワムのタスクを効率的に割り当てるための生体模倣機構と統合することができる。
論文 参考訳(メタデータ) (2024-05-18T12:45:00Z) - Multi-Agent Reinforcement Learning for Offloading Cellular Communications with Cooperating UAVs [21.195346908715972]
無人航空機は、地上のBSからデータトラフィックをオフロードする代替手段を提供する。
本稿では,地上BSからデータオフロードを行うために,複数のUAVを効率的に利用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-02-05T12:36:08Z) - Integrated Sensing, Computation, and Communication for UAV-assisted
Federated Edge Learning [52.7230652428711]
フェデレーションエッジ学習(FEEL)は、エッジデバイスとサーバ間の定期的な通信を通じて、プライバシ保護モデルトレーニングを可能にする。
無人航空機(UAV)搭載エッジデバイスは、効率的なデータ収集における柔軟性と移動性のため、FEELにとって特に有利である。
論文 参考訳(メタデータ) (2023-06-05T16:01:33Z) - Robust and Efficient Medical Imaging with Self-Supervision [80.62711706785834]
医用画像AIの堅牢性とデータ効率を向上させるための統一表現学習戦略であるREMEDISを提案する。
様々な医療画像タスクを研究し, 振り返りデータを用いて3つの現実的な応用シナリオをシミュレートする。
論文 参考訳(メタデータ) (2022-05-19T17:34:18Z) - Optimization for Master-UAV-powered Auxiliary-Aerial-IRS-assisted IoT
Networks: An Option-based Multi-agent Hierarchical Deep Reinforcement
Learning Approach [56.84948632954274]
本稿では,無人航空機(MUAV)搭載のIoT(Internet of Things)ネットワークについて検討する。
本稿では、インテリジェント反射面(IRS)を備えた充電可能な補助UAV(AUAV)を用いて、MUAVからの通信信号を強化することを提案する。
提案モデルでは,IoTネットワークの蓄積スループットを最大化するために,これらのエネルギー制限されたUAVの最適協調戦略について検討する。
論文 参考訳(メタデータ) (2021-12-20T15:45:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。