論文の概要: DSSE: a drone swarm search environment
- arxiv url: http://arxiv.org/abs/2307.06240v1
- Date: Wed, 12 Jul 2023 15:28:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-13 12:43:40.569549
- Title: DSSE: a drone swarm search environment
- Title(参考訳): dsse: ドローン群検索環境
- Authors: Manuel Castanares and Luis F. S. Carrete and Enrico F. Damiani and
Leonardo D. M. de Abreu and Jos\'e Fernando B. Brancalion and Fabr\'icio J.
Barth
- Abstract要約: Drone Swarm Searchプロジェクトは、PettingZooをベースにした環境であり、マルチエージェント(またはシングルエージェント)強化学習アルゴリズムと組み合わせて使用される。
本研究の目的は,入力として動的確率を必要とする強化学習アルゴリズムの研究を支援することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Drone Swarm Search project is an environment, based on PettingZoo, that
is to be used in conjunction with multi-agent (or single-agent) reinforcement
learning algorithms. It is an environment in which the agents (drones), have to
find the targets (shipwrecked people). The agents do not know the position of
the target and do not receive rewards related to their own distance to the
target(s). However, the agents receive the probabilities of the target(s) being
in a certain cell of the map. The aim of this project is to aid in the study of
reinforcement learning algorithms that require dynamic probabilities as inputs.
- Abstract(参考訳): Drone Swarm Searchプロジェクトは、PettingZooをベースにした環境であり、マルチエージェント(またはシングルエージェント)強化学習アルゴリズムと組み合わせて使用される。
エージェント(ドロネス)がターゲット(難破した人々)を見つけなければならない環境である。
エージェントはターゲットの位置を知らないし、ターゲットへの自身の距離に関する報酬を受け取らない。
しかし、これらのエージェントは、地図の特定のセル内にあるターゲット(s)の確率を受け取る。
このプロジェクトの目的は、インプットとして動的確率を必要とする強化学習アルゴリズムの研究を支援することである。
関連論文リスト
- CoNav: A Benchmark for Human-Centered Collaborative Navigation [66.6268966718022]
協調ナビゲーション(CoNav)ベンチマークを提案する。
われわれのCoNavは、現実的で多様な人間の活動を伴う3Dナビゲーション環境を構築するという重要な課題に取り組む。
本研究では,長期的意図と短期的意図の両方を推論する意図認識エージェントを提案する。
論文 参考訳(メタデータ) (2024-06-04T15:44:25Z) - Planning Goals for Exploration [22.047797646698527]
Planning Exploratory Goals(PEG)は,本質的な探索報酬を直接最適化する訓練エピソード毎の目標を設定する手法である。
PEGは世界モデルを学び、サンプリングベースの計画アルゴリズムを適用して"目標コマンドを計画"する
論文 参考訳(メタデータ) (2023-03-23T02:51:50Z) - A Search and Detection Autonomous Drone System: from Design to
Implementation [7.760962597460447]
ターゲットを見つけるのに要する時間の観点からの探索効率は、山火事の検出に不可欠である。
経路計画と目標検出という2つのアルゴリズムが提案されている。
その結果,提案アルゴリズムはミッションの平均時間を大幅に短縮することがわかった。
論文 参考訳(メタデータ) (2022-11-29T01:44:29Z) - Discrete Factorial Representations as an Abstraction for Goal
Conditioned Reinforcement Learning [99.38163119531745]
離散化ボトルネックを適用することにより,目標条件付きRLセットアップの性能が向上することを示す。
分布外目標に対する期待した回帰を実験的に証明し、同時に表現的な構造で目標を指定できるようにします。
論文 参考訳(メタデータ) (2022-11-01T03:31:43Z) - Collaborative Target Search with a Visual Drone Swarm: An Adaptive
Curriculum Embedded Multistage Reinforcement Learning Approach [0.0]
適応型カリキュラム組込み多段階学習(ACEMSL)という,データ効率の高い深層強化学習(DRL)手法を提案する。
我々は、協調対象探索タスクを、個別の障害物回避、対象探索、エージェント間協調を含むいくつかのサブタスクに分解し、多段階学習でエージェントを段階的に訓練する。
我々は、訓練されたモデルを実際の視覚ドローン群に展開し、微調整なしでCTS操作を行う。
論文 参考訳(メタデータ) (2022-04-26T09:32:22Z) - Object Manipulation via Visual Target Localization [64.05939029132394]
オブジェクトを操作するための訓練エージェントは、多くの課題を提起します。
本研究では,対象物体を探索する環境を探索し,位置が特定されると3次元座標を計算し,対象物が見えない場合でも3次元位置を推定する手法を提案する。
評価の結果,同じ感覚スイートにアクセス可能なモデルに比べて,成功率が3倍に向上したことが示された。
論文 参考訳(メタデータ) (2022-03-15T17:59:01Z) - Uncertainty with UAV Search of Multiple Goal-oriented Targets [25.918290198644122]
本稿では,不確実性下でのUAVの探索対象の複雑な問題について考察する。
エントロピーと時間的信念を組み合わせた,UAVのためのリアルタイムアルゴリズムフレームワークを提案する。
我々は,アルゴリズムの枠組みを実証的に評価し,その効率と大幅な性能向上を実証した。
論文 参考訳(メタデータ) (2022-03-03T09:57:00Z) - Cooperative Exploration for Multi-Agent Deep Reinforcement Learning [127.4746863307944]
深層強化学習のための協調型マルチエージェント探索(CMAE)を提案する。
ゴールは正規化エントロピーに基づく手法により、複数の射影状態空間から選択される。
CMAEが様々なタスクのベースラインを一貫して上回っていることを実証する。
論文 参考訳(メタデータ) (2021-07-23T20:06:32Z) - A Multi-UAV System for Exploration and Target Finding in Cluttered and
GPS-Denied Environments [68.31522961125589]
複雑なGPSを用いた複雑な環境において,UAVのチームが協調して目標を探索し,発見するための枠組みを提案する。
UAVのチームは自律的にナビゲートし、探索し、検出し、既知の地図で散らばった環境でターゲットを見つける。
その結果, 提案方式は, 時間的コスト, 調査対象地域の割合, 捜索・救助ミッションの成功率などの面で改善されていることがわかった。
論文 参考訳(メタデータ) (2021-07-19T12:54:04Z) - Automatic Curriculum Learning through Value Disagreement [95.19299356298876]
新しい未解決タスクを継続的に解決することが、多様な行動を学ぶための鍵です。
エージェントが複数の目標を達成する必要があるマルチタスク領域では、トレーニング目標の選択はサンプル効率に大きな影響を与える可能性がある。
そこで我々は,エージェントが解決すべき目標のための自動カリキュラムを作成することを提案する。
提案手法は,13のマルチゴールロボットタスクと5つのナビゲーションタスクにまたがって評価し,現在の最先端手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2020-06-17T03:58:25Z) - Reinforcement Learning for UAV Autonomous Navigation, Mapping and Target
Detection [36.79380276028116]
本研究では,無人航空機(UAV)に低高度レーダーを装備し,未知の環境下での飛行における共同検出・マッピング・ナビゲーション問題について検討する。
目的は、マッピング精度を最大化する目的で軌道を最適化することであり、目標検出の観点からは、測定が不十分な領域を避けることである。
論文 参考訳(メタデータ) (2020-05-05T20:39:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。