論文の概要: Collaborative Target Search with a Visual Drone Swarm: An Adaptive
Curriculum Embedded Multi-stage Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2204.12181v2
- Date: Wed, 27 Apr 2022 06:08:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-28 10:57:44.102123
- Title: Collaborative Target Search with a Visual Drone Swarm: An Adaptive
Curriculum Embedded Multi-stage Reinforcement Learning Approach
- Title(参考訳): 視覚的ドローン群を用いた協調目標探索--適応型カリキュラム組込み多段階強化学習アプローチ
- Authors: Jiaping Xiao, Phumrapee Pisutsin and Mir Feroskhan
- Abstract要約: 一つのドローンをデプロイする代わりに、互いに協力できるインテリジェントなドローン群が、より短時間でターゲットの検索を達成できる。
本稿では,視覚的ドローン群を用いた協調目標探索の課題に対処する,データ効率の強化学習に基づくアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Equipping drones with target search capabilities is desirable for
applications in disaster management scenarios and smart warehouse delivery
systems. Instead of deploying a single drone, an intelligent drone swarm that
can collaborate with one another in maneuvering among obstacles will be more
effective in accomplishing the target search in a shorter amount of time. In
this work, we propose a data-efficient reinforcement learning-based approach,
Adaptive Curriculum Embedded Multi-Stage Learning (ACEMSL), to address the
challenges of carrying out a collaborative target search with a visual drone
swarm, namely the 3D sparse reward space exploration and the collaborative
behavior requirement. Specifically, we develop an adaptive embedded curriculum,
where the task difficulty level can be adaptively adjusted according to the
success rate achieved in training. Meanwhile, with multi-stage learning, ACEMSL
allows data-efficient training and individual-team reward allocation for the
collaborative drone swarm. The effectiveness and generalization capability of
our approach are validated using simulations and actual flight tests.
- Abstract(参考訳): ドローンにターゲット検索機能を搭載することは、災害管理シナリオやスマート倉庫配送システムでの利用に望ましい。
単一のドローンを配置する代わりに、障害物間の操作で互いに協調できるインテリジェントなドローン群は、ターゲット検索を短時間で達成する上でより効果的である。
本研究では,データ効率向上のための強化学習手法である適応カリキュラム埋め込み型多段階学習(ACEMSL)を提案し,視覚ドローン群を用いた協調目標探索の課題,すなわち3次元スパース報酬空間探索と協調行動要求に対処する。
具体的には,学習で得られた成功率に応じて課題難易度を適応的に調整できる適応型組込みカリキュラムを開発する。
一方、多段階学習では、ACEMSLはコラボレーティブなドローン群に対して、データ効率のトレーニングとチーム毎の報酬配分を可能にする。
本手法の有効性と一般化はシミュレーションと実飛行試験を用いて検証した。
関連論文リスト
- Energy-Aware Multi-Agent Reinforcement Learning for Collaborative Execution in Mission-Oriented Drone Networks [3.4918110778972458]
ミッション指向ドローンネットワークは、構造検査、災害監視、国境監視などに広く利用されている。
ドローンのバッテリ容量が限られているため、ミッション実行戦略はネットワークの性能とミッション完了に影響を及ぼす。
本研究では,マルチエージェント強化学習(MARL)を活用し,その課題を管理する。
論文 参考訳(メタデータ) (2024-10-29T22:43:26Z) - A Dual Curriculum Learning Framework for Multi-UAV Pursuit-Evasion in Diverse Environments [15.959963737956848]
本稿では,無人機群が障害物のある制限された環境で高速離着陸機を捕獲するために協力するマルチUAV追跡回避について述べる。
追従回避問題を単純化する既存のアルゴリズムは、しばしば表現力のある協調戦略を欠き、極端なシナリオで回避者を捕まえるのに苦労する。
多様な環境下でのマルチUAV追従回避に対処し,未知のシナリオに対するゼロショット転送能力を実証するデュアルカリキュラム学習フレームワークDualCLを導入する。
論文 参考訳(メタデータ) (2023-12-19T15:39:09Z) - Efficient Adaptive Human-Object Interaction Detection with
Concept-guided Memory [64.11870454160614]
概念誘導メモリ(ADA-CM)を用いた適応型HOI検出器を提案する。
ADA-CMには2つの操作モードがある。最初のモードでは、トレーニング不要のパラダイムで新しいパラメータを学習することなくチューニングできる。
提案手法は, HICO-DET と V-COCO のデータセットに対して, より少ないトレーニング時間で, 最新技術による競合的な結果を得る。
論文 参考訳(メタデータ) (2023-09-07T13:10:06Z) - Multi-Objective Optimization for UAV Swarm-Assisted IoT with Virtual
Antenna Arrays [55.736718475856726]
無人航空機(UAV)ネットワークはIoT(Internet-of-Things)を支援するための有望な技術である
既存のUAV支援データ収集および普及スキームでは、UAVはIoTとアクセスポイントの間を頻繁に飛行する必要がある。
協調ビームフォーミングをIoTとUAVに同時に導入し、エネルギーと時間効率のデータ収集と普及を実現した。
論文 参考訳(メタデータ) (2023-08-03T02:49:50Z) - Learning Multi-Pursuit Evasion for Safe Targeted Navigation of Drones [0.0]
本稿では,非同期多段階深部強化学習(AMS-DRL)による対向ニューラルネットワークの学習手法を提案する。
AMS-DRLは、追従者および回避者を二部グラフで非同期に訓練する追従回避ゲームにおいて、敵エージェントを進化させる。
本手法を広範囲なシミュレーションで評価し,航法成功率の高いベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-04-07T01:59:16Z) - Effective Adaptation in Multi-Task Co-Training for Unified Autonomous
Driving [103.745551954983]
本稿では,3つの下流タスクにおけるMoCoやSimCLRなど,多種多様な自己監督手法の転送性能について検討する。
彼らのパフォーマンスは、サブ最適か、あるいはシングルタスクベースラインよりもはるかに遅れていることに気付きました。
汎用マルチタスクトレーニングのための,単純かつ効果的な事前訓練-適応-ファインチューンパラダイムを提案する。
論文 参考訳(メタデータ) (2022-09-19T12:15:31Z) - DL-DRL: A double-level deep reinforcement learning approach for
large-scale task scheduling of multi-UAV [65.07776277630228]
分割・征服フレームワーク(DCF)に基づく二重レベル深層強化学習(DL-DRL)手法を提案する。
特に,上層部DRLモデルにおけるエンコーダ・デコーダ構成ポリシネットワークを設計し,タスクを異なるUAVに割り当てる。
また、低レベルDRLモデルにおける別の注意に基づくポリシーネットワークを利用して、各UAVの経路を構築し、実行されたタスク数を最大化する。
論文 参考訳(メタデータ) (2022-08-04T04:35:53Z) - Decentralized Reinforcement Learning for Multi-Target Search and
Detection by a Team of Drones [12.055303570215335]
対象の探索と検出は、カバレッジ、監視、探索、観測、追跡回避など、さまざまな決定問題を含む。
我々は,未知の領域における静的な目標のセットを特定するために,航空機群(ドローン)を協調させるマルチエージェント深部強化学習法(MADRL)を開発した。
論文 参考訳(メタデータ) (2021-03-17T09:04:47Z) - Distributed Reinforcement Learning for Flexible and Efficient UAV Swarm
Control [28.463670610865837]
本稿では,大規模群に拡大する分散強化学習(RL)手法を提案する。
本実験では, 本手法がコミュニケーションチャネル障害に強い効果的な戦略を導出できることを示した。
また,本手法は計算集約的なルックアヘッドに比べて優れた性能を実現することを示す。
論文 参考訳(メタデータ) (2021-03-08T11:06:28Z) - Batch Exploration with Examples for Scalable Robotic Reinforcement
Learning [63.552788688544254]
BEE(Batch Exploration with Examples)は、重要状態の画像の少ない数の人間がガイドする状態空間の関連領域を探索する。
BEEは、シミュレーションと本物のフランカロボットの両方で、視覚ベースの操作に挑戦することができる。
論文 参考訳(メタデータ) (2020-10-22T17:49:25Z) - Planning to Explore via Self-Supervised World Models [120.31359262226758]
Plan2Exploreは自己監督型強化学習エージェントである。
我々は、自己監督型探索と、新しいタスクへの迅速な適応に対する新しいアプローチを提案する。
Plan2Exploreは、訓練の監督やタスク固有の相互作用がなければ、自己監督型の探査方法よりも優れている。
論文 参考訳(メタデータ) (2020-05-12T17:59:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。