論文の概要: A Learning Framework For Cooperative Collision Avoidance of UAV Swarms Leveraging Domain Knowledge
- arxiv url: http://arxiv.org/abs/2507.10913v1
- Date: Tue, 15 Jul 2025 02:09:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:02.953276
- Title: A Learning Framework For Cooperative Collision Avoidance of UAV Swarms Leveraging Domain Knowledge
- Title(参考訳): ドメイン知識を活用したUAVスワーミングの協調的衝突回避のための学習フレームワーク
- Authors: Shuangyao Huang, Haibo Zhang, Zhiyi Huang,
- Abstract要約: 本稿では,UAVSwarmの衝突回避のためのマルチエージェント強化学習(MARL)フレームワークを提案する。
報酬は画像処理の領域における知識から導かれ、2次元の場の輪郭を近似する。
我々のフレームワークはエージェントの相互作用を最小限に抑えるため、大きなSwarmサイズでのトレーニングを可能にする。
- 参考スコア(独自算出の注目度): 3.0937791269083705
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a multi-agent reinforcement learning (MARL) framework for cooperative collision avoidance of UAV swarms leveraging domain knowledge-driven reward. The reward is derived from knowledge in the domain of image processing, approximating contours on a two-dimensional field. By modeling obstacles as maxima on the field, collisions are inherently avoided as contours never go through peaks or intersect. Additionally, counters are smooth and energy-efficient. Our framework enables training with large swarm sizes as the agent interaction is minimized and the need for complex credit assignment schemes or observation sharing mechanisms in state-of-the-art MARL approaches are eliminated. Moreover, UAVs obtain the ability to adapt to complex environments where contours may be non-viable or non-existent through intensive training. Extensive experiments are conducted to evaluate the performances of our framework against state-of-the-art MARL algorithms.
- Abstract(参考訳): 本稿では,UAVスワムの協調衝突回避のための多エージェント強化学習(MARL)フレームワークを提案する。
報酬は画像処理の領域における知識から導かれ、2次元の場の輪郭を近似する。
障害物をフィールド上の最大値としてモデル化することで、輪郭がピークを通過したり交差したりすることがないため、衝突は本質的に避けられる。
さらにカウンターは滑らかでエネルギー効率が良い。
我々のフレームワークはエージェントのインタラクションを最小限に抑え、最先端のMARLアプローチにおける複雑な信用割当スキームや観察共有機構の必要性を排除し、大きなSwarmサイズでのトレーニングを可能にする。
さらに、UAVは複雑な環境に適応する能力があり、輪郭は、集中的な訓練によって、動かない、あるいは存在しない可能性がある。
最先端のMARLアルゴリズムに対して,我々のフレームワークの性能を評価するために大規模な実験を行った。
関連論文リスト
- LLM Meets the Sky: Heuristic Multi-Agent Reinforcement Learning for Secure Heterogeneous UAV Networks [57.27815890269697]
この研究は、エネルギー制約下での不均一なUAVネットワーク(HetUAVN)における機密率の最大化に焦点を当てている。
本稿では,Large Language Model (LLM) を用いたマルチエージェント学習手法を提案する。
その結果,本手法は機密性やエネルギー効率において,既存のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-07-23T04:22:57Z) - Pulling Back the Curtain: Unsupervised Adversarial Detection via Contrastive Auxiliary Networks [0.0]
本稿では,補助的特徴表現内での敵対行動を明らかにするために,補助的コントラストネットワーク(U-CAN)による教師なし敵検出を提案する。
本手法は、既存の非教師付き対向検出手法を超越し、4つの異なる攻撃方法に対して優れたF1スコアを達成している。
論文 参考訳(メタデータ) (2025-02-13T09:40:26Z) - Multi-Agent Path Finding in Continuous Spaces with Projected Diffusion Models [57.45019514036948]
MAPF(Multi-Agent Path Finding)は、ロボット工学における基本的な問題である。
連続空間におけるMAPFの拡散モデルと制約付き最適化を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-12-23T21:27:19Z) - RaCIL: Ray Tracing based Multi-UAV Obstacle Avoidance through Composite Imitation Learning [1.934627691560021]
本研究では,無人航空機(UAV)における障害物回避の課題を,革新的な模倣学習アプローチによって解決する。
本研究は,障害物検出と回避能力向上におけるレイトレーシングの意義を明らかにするものである。
我々のアプローチは、混雑した環境や動的な環境での高度自律型UAV運用の道を開くものである。
論文 参考訳(メタデータ) (2024-06-24T17:43:24Z) - Deep Boosting Learning: A Brand-new Cooperative Approach for Image-Text Matching [53.05954114863596]
画像テキストマッチングのための新しいDeep Boosting Learning (DBL)アルゴリズムを提案する。
アンカーブランチは、まずデータプロパティに関する洞察を提供するために訓練される。
ターゲットブランチは、一致したサンプルと未一致のサンプルとの相対距離をさらに拡大するために、より適応的なマージン制約を同時に課される。
論文 参考訳(メタデータ) (2024-04-28T08:44:28Z) - MADRL-based UAVs Trajectory Design with Anti-Collision Mechanism in
Vehicular Networks [1.9662978733004604]
今後6Gネットワークでは、無人航空機(UAV)が移動基地局として機能することが期待される。
最も困難な問題の1つは、複数のUAVのための軌道の設計であり、同じ領域に協調して機能する。
本稿では,これらの問題に対処するためのランクベースのバイナリマスキング手法を提案する。
論文 参考訳(メタデータ) (2024-01-21T20:08:32Z) - Towards Full-scene Domain Generalization in Multi-agent Collaborative Bird's Eye View Segmentation for Connected and Autonomous Driving [49.03947018718156]
協調的な知覚の訓練と推論の段階で利用される統合されたドメイン一般化フレームワークを提案する。
また、システム内ドメインアライメント機構を導入し、コネクテッドおよび自律走行車間のドメインの差を減らし、潜在的に排除する。
論文 参考訳(メタデータ) (2023-11-28T12:52:49Z) - Scalable Task-Driven Robotic Swarm Control via Collision Avoidance and
Learning Mean-Field Control [23.494528616672024]
我々は、最先端平均場制御技術を用いて、多くのエージェントSwarm制御を分散の古典的な単一エージェント制御に変換する。
そこで我々は,衝突回避と平均場制御の学習を,知的ロボット群動作を牽引的に設計するための統一的な枠組みに統合する。
論文 参考訳(メタデータ) (2022-09-15T16:15:04Z) - Efficient Reinforcement Learning in Block MDPs: A Model-free
Representation Learning Approach [73.62265030773652]
ブロック構造力学を用いたマルコフ決定過程における効率的な強化学習アルゴリズムであるBRIEEを提案する。
BRIEEは、潜伏状態の発見、探索、搾取を相互にインターリーブし、ほぼ最適な政策を確実に学べる。
我々は、BRIEEが最先端のBlock MDPアルゴリズムであるHOMER RLや、リッチ・オブザーブレーションの組み合わせロック問題に挑戦する経験的ベースラインよりも、より標本効率が高いことを示す。
論文 参考訳(メタデータ) (2022-01-31T19:47:55Z) - Fusion and Orthogonal Projection for Improved Face-Voice Association [15.938463726577128]
顔と声の関連性について検討する。
両モードの相補的手がかりを利用して, リッチなフューズド埋め込みを形成する軽量なプラグアンドプレイ機構を提案する。
論文 参考訳(メタデータ) (2021-12-20T12:33:33Z) - A Hamiltonian Monte Carlo Method for Probabilistic Adversarial Attack
and Learning [122.49765136434353]
本稿では,HMCAM (Acumulated Momentum) を用いたハミルトニアンモンテカルロ法を提案する。
また, 対数的対数的対数的学習(Contrastive Adversarial Training, CAT)と呼ばれる新たな生成法を提案し, 対数的例の平衡分布にアプローチする。
いくつかの自然画像データセットと実用システムに関する定量的および定性的な解析により、提案アルゴリズムの優位性が確認された。
論文 参考訳(メタデータ) (2020-10-15T16:07:26Z) - Boosting Adversarial Training with Hypersphere Embedding [53.75693100495097]
敵対的訓練は、ディープラーニングモデルに対する敵対的攻撃に対する最も効果的な防御の1つである。
本研究では,超球埋め込み機構をATプロシージャに組み込むことを提唱する。
我々は,CIFAR-10 と ImageNet データセットに対する幅広い敵対攻撃の下で本手法を検証した。
論文 参考訳(メタデータ) (2020-02-20T08:42:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。