論文の概要: HOLA-Drone: Hypergraphic Open-ended Learning for Zero-Shot Multi-Drone Cooperative Pursuit
- arxiv url: http://arxiv.org/abs/2409.08767v1
- Date: Fri, 13 Sep 2024 12:20:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-16 16:39:02.444523
- Title: HOLA-Drone: Hypergraphic Open-ended Learning for Zero-Shot Multi-Drone Cooperative Pursuit
- Title(参考訳): HOLA-Drone: ゼロショット多次元協調探索のためのハイパーグラフィックオープンエンドラーニング
- Authors: Yang Li, Dengyu Zhang, Junfan Chen, Ying Wen, Qingrui Zhang, Shaoshuai Mou, Wei Pan,
- Abstract要約: 本稿では,複数の未確認パートナーと協調して複数のエバダを捕獲できるドローンエージェントの構築方法について検討する。
学習目的を継続的に適応させる新しいハイパーグラフィックオープンエンド学習アルゴリズム(HOLA-Drone)を提案する。
実験により、HOLA-Droneは、目に見えないドローンチームメイトとの協調において、ベースラインの手法よりも優れていることが示された。
- 参考スコア(独自算出の注目度): 19.568674953117142
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Zero-shot coordination (ZSC) is a significant challenge in multi-agent collaboration, aiming to develop agents that can coordinate with unseen partners they have not encountered before. Recent cutting-edge ZSC methods have primarily focused on two-player video games such as OverCooked!2 and Hanabi. In this paper, we extend the scope of ZSC research to the multi-drone cooperative pursuit scenario, exploring how to construct a drone agent capable of coordinating with multiple unseen partners to capture multiple evaders. We propose a novel Hypergraphic Open-ended Learning Algorithm (HOLA-Drone) that continuously adapts the learning objective based on our hypergraphic-form game modeling, aiming to improve cooperative abilities with multiple unknown drone teammates. To empirically verify the effectiveness of HOLA-Drone, we build two different unseen drone teammate pools to evaluate their performance in coordination with various unseen partners. The experimental results demonstrate that HOLA-Drone outperforms the baseline methods in coordination with unseen drone teammates. Furthermore, real-world experiments validate the feasibility of HOLA-Drone in physical systems. Videos can be found on the project homepage~\url{https://sites.google.com/view/hola-drone}.
- Abstract(参考訳): ゼロショットコーディネート(ZSC)は、これまで遭遇したことのないパートナーと協調できるエージェントを開発することを目的として、マルチエージェントコラボレーションにおいて重要な課題である。
最近の最先端ZSC手法は、主にOverCooked!のような2プレイヤーのビデオゲームに焦点を当てている。
2とハナビ。
本稿では,ZSC研究の範囲を,複数の未確認パートナーと協調して複数のエバダを捕獲できるドローンエージェントを構築する方法について検討する。
本稿では,複数の未知のドローンチームメイトとの協調能力向上を目的とした,ハイパーグラフィック形式のゲームモデリングに基づく学習目標を継続的に適用する新しいハイパーグラフィックオープンエンド学習アルゴリズム(HOLA-Drone)を提案する。
HOLA-Droneの有効性を実証的に検証するため、2つの異なる無人チームメイトプールを構築し、その性能を評価する。
実験の結果,HOLA-Droneは無人ドローンチームメイトとの協調において,ベースライン法よりも優れていた。
さらに、実世界の実験は、物理システムにおけるHOLA-Droneの実現可能性を検証する。
ビデオはプロジェクトのホームページ~\url{https://sites.google.com/view/hola-drone}で見ることができる。
関連論文リスト
- Scheduling Drone and Mobile Charger via Hybrid-Action Deep Reinforcement Learning [7.577251571044739]
ドローンは一定の関心点を観察するために配置され、充電器はドローンのバッテリーを充電するために移動することができる。
我々は、ドローンと移動充電器のルートと充電スケジュールに焦点を合わせ、可能な限り短時間で高観測ユーティリティーを得る。
本稿では、標準ポリシー学習アルゴリズムを用いて遅延連続動作を生成するハイブリッドアクション深層強化学習フレームワークHaDMCを提案する。
論文 参考訳(メタデータ) (2024-03-16T01:51:42Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - Self-Motivated Multi-Agent Exploration [38.55811936029999]
協調型マルチエージェント強化学習(CMARL)では,エージェントが自己探索とチームコラボレーションのバランスをとることが重要である。
近年の研究は主にエージェントの協調探索に焦点が当てられ、州空間の指数的に成長した探索をもたらした。
我々は,自己探索とチーム協力のトレードオフを適応的に見つけることで,チームのタスクの成功を目指す,自己運動型マルチエージェント探索(SMMAE)を提案する。
論文 参考訳(メタデータ) (2023-01-05T14:42:39Z) - TransVisDrone: Spatio-Temporal Transformer for Vision-based
Drone-to-Drone Detection in Aerial Videos [57.92385818430939]
視覚的フィードを用いたドローンからドローンへの検知は、ドローンの衝突の検出、ドローンの攻撃の検出、他のドローンとの飛行の調整など、重要な応用がある。
既存の手法は計算コストがかかり、非エンドツーエンドの最適化に追随し、複雑なマルチステージパイプラインを持つため、エッジデバイス上でのリアルタイムデプロイメントには適さない。
計算効率を向上したエンドツーエンドのソリューションを提供する,シンプルで効果的なフレームワークであるitTransVisDroneを提案する。
論文 参考訳(メタデータ) (2022-10-16T03:05:13Z) - Collaborative Target Search with a Visual Drone Swarm: An Adaptive
Curriculum Embedded Multistage Reinforcement Learning Approach [0.0]
適応型カリキュラム組込み多段階学習(ACEMSL)という,データ効率の高い深層強化学習(DRL)手法を提案する。
我々は、協調対象探索タスクを、個別の障害物回避、対象探索、エージェント間協調を含むいくつかのサブタスクに分解し、多段階学習でエージェントを段階的に訓練する。
我々は、訓練されたモデルを実際の視覚ドローン群に展開し、微調整なしでCTS操作を行う。
論文 参考訳(メタデータ) (2022-04-26T09:32:22Z) - Drone swarm patrolling with uneven coverage requirements [22.475492500154573]
本稿では,ドローン搭載カメラセンサによる視覚的カバレッジの最適化に焦点を当てる。
我々は、これらのカバレッジ要件を関連マップでモデル化し、Swarmをガイドする深層強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-07-01T10:58:57Z) - Dogfight: Detecting Drones from Drones Videos [58.158988162743825]
本稿では,他の飛行ドローンからドローンを検知する問題に対処する。
ソースとターゲットドローンのエロティックな動き、小型、任意の形状、大きな強度、および閉塞は、この問題を非常に困難にします。
これに対処するため,地域提案に基づく手法ではなく,2段階のセグメンテーションに基づく手法を提案する。
論文 参考訳(メタデータ) (2021-03-31T17:43:31Z) - Multi-Agent Collaboration via Reward Attribution Decomposition [75.36911959491228]
本稿では,StarCraftのマルチエージェントチャレンジにおいて,最先端のパフォーマンスを実現するコラボレーション型Q-ラーニング(CollaQ)を提案する。
CollaQは様々なStarCraft属性マップで評価され、既存の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-16T17:42:11Z) - AirSim Drone Racing Lab [56.68291351736057]
AirSim Drone Racing Labは、この領域で機械学習研究を可能にするシミュレーションフレームワークである。
本フレームワークは,複数の写真リアル環境下でのレーストラック生成を可能にする。
当社のフレームワークを使用して,NeurIPS 2019で,シミュレーションベースのドローンレースコンペティションを開催しました。
論文 参考訳(メタデータ) (2020-03-12T08:06:06Z) - "Other-Play" for Zero-Shot Coordination [21.607428852157273]
その他の遊び学習アルゴリズムは、より堅牢な戦略を探すことによって、セルフプレイを強化する。
本研究では,協力型カードゲーム「はなび」について検討し,OPエージェントが単独で訓練されたエージェントとペアを組むと,より高いスコアが得られることを示す。
論文 参考訳(メタデータ) (2020-03-06T00:39:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。