論文の概要: Decentralized Swarm Collision Avoidance for Quadrotors via End-to-End
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2104.14912v1
- Date: Fri, 30 Apr 2021 11:19:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 13:47:13.852726
- Title: Decentralized Swarm Collision Avoidance for Quadrotors via End-to-End
Reinforcement Learning
- Title(参考訳): エンド・ツー・エンド強化学習によるクアドロレータの分散Swarm衝突回避
- Authors: Ramzi Ourari, Kai Cui, Heinz Koeppl
- Abstract要約: 我々は、スターリングの群れから生物学的インスピレーションを受け、その洞察をエンドツーエンドの学習された分散衝突回避に適用する。
生体模倣トポロジカル相互作用規則に基づく新しいスケーラブルな観測モデルを提案する。
学習したポリシーはシミュレーションでテストされ、その後実世界のドローンに転送され、実世界の応用性を検証する。
- 参考スコア(独自算出の注目度): 28.592704336574158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collision avoidance algorithms are of central interest to many drone
applications. In particular, decentralized approaches may be the key to
enabling robust drone swarm solutions in cases where centralized communication
becomes computationally prohibitive. In this work, we draw biological
inspiration from flocks of starlings (Sturnus vulgaris) and apply the insight
to end-to-end learned decentralized collision avoidance. More specifically, we
propose a new, scalable observation model following a biomimetic topological
interaction rule that leads to stable learning and robust avoidance behavior.
Additionally, prior work primarily focuses on invoking a separation principle,
i.e. designing collision avoidance independent of specific tasks. By applying a
general reinforcement learning approach, we propose a holistic learning-based
approach to integrating collision avoidance with various tasks and dynamics. To
validate the generality of this approach, we successfully apply our methodology
to a number of configurations. Our learned policies are tested in simulation
and subsequently transferred to real-world drones to validate their real-world
applicability.
- Abstract(参考訳): 衝突回避アルゴリズムは多くのドローンアプリケーションにとって重要な関心事である。
特に、集中型通信が計算的に禁止される場合、分散化されたアプローチがロバストなドローン群ソリューションを実現する鍵となるかもしれない。
本研究では,ヒトデの群集(Sturnus vulgaris)から生物学的インスピレーションを得て,その知見をエンドツーエンドの分散衝突回避に応用する。
具体的には,生物模倣的トポロジカル相互作用則に従って,安定した学習と頑健な回避行動をもたらす新しいスケーラブルな観測モデルを提案する。
さらに、先行研究は主に分離原則、すなわち分離原則の提唱に焦点を当てている。
特定のタスクに依存しない衝突回避設計。
一般的な強化学習手法を適用することで,衝突回避を様々なタスクやダイナミクスと統合するための全体論的学習に基づくアプローチを提案する。
このアプローチの汎用性を検証するため,提案手法を多数の構成に適用した。
学習したポリシーはシミュレーションでテストされ、その後実世界のドローンに転送され、実世界の応用性を検証する。
関連論文リスト
- Generalizability of Graph Neural Networks for Decentralized Unlabeled Motion Planning [72.86540018081531]
ラベルなしの動作計画では、衝突回避を確保しながら、ロボットのセットを目標の場所に割り当てる。
この問題は、探査、監視、輸送などの応用において、マルチロボットシステムにとって不可欠なビルディングブロックを形成している。
この問題に対処するために、各ロボットは、その400ドルのアネレストロボットと$k$アネレストターゲットの位置のみを知っている分散環境で対処する。
論文 参考訳(メタデータ) (2024-09-29T23:57:25Z) - Towards Universal Dense Blocking for Entity Resolution [49.06313308481536]
ドメインに依存しない、容易に観測可能なコーパス上で事前学習を行う密集型ブロッカであるUniBlockerを提案する。
ドメインに依存しない事前トレーニングを行うことで、UniBlockerはドメイン固有の微調整を必要とせずに、さまざまなダウンストリームブロッキングシナリオに適応できる。
提案したUniBlockerは、ドメイン固有の学習を一切行わず、従来の自己および教師なしの密なブロッキング手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-04-23T08:39:29Z) - Multi-granular Adversarial Attacks against Black-box Neural Ranking Models [111.58315434849047]
多粒性摂動を取り入れた高品質な逆数例を作成する。
我々は,多粒体攻撃を逐次的意思決定プロセスに変換する。
本手法は,攻撃の有効性と非受容性の両方において,一般的なベースラインを超えている。
論文 参考訳(メタデータ) (2024-04-02T02:08:29Z) - Denoising Heat-inspired Diffusion with Insulators for Collision Free
Motion Planning [3.074694788117593]
拡散モデルは、柔軟性とマルチモダリティのために、ロボット工学の強力なツールとして台頭している。
本稿では,到達可能な目標のみを同時に生成し,障害物を回避する動作を計画する手法を提案する。
論文 参考訳(メタデータ) (2023-10-19T09:39:07Z) - Sequential Neural Barriers for Scalable Dynamic Obstacle Avoidance [7.375976854181687]
SNCBF(Sequential Neural Control Barrier Model)の合成学習法を提案する。
複数の動的障害物の空間的相互作用パターンを分解し,各障害物の状態列を通じて予測することができる。
提案手法の利点は,既存の手法と比較して動的衝突回避を改善することである。
論文 参考訳(メタデータ) (2023-07-06T14:24:17Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Scalable Task-Driven Robotic Swarm Control via Collision Avoidance and
Learning Mean-Field Control [23.494528616672024]
我々は、最先端平均場制御技術を用いて、多くのエージェントSwarm制御を分散の古典的な単一エージェント制御に変換する。
そこで我々は,衝突回避と平均場制御の学習を,知的ロボット群動作を牽引的に設計するための統一的な枠組みに統合する。
論文 参考訳(メタデータ) (2022-09-15T16:15:04Z) - Object-Aware Regularization for Addressing Causal Confusion in Imitation
Learning [131.1852444489217]
本稿では,オブジェクト認識方式で模倣ポリシーを標準化する手法として,オブジェクト認識型RegularizatiOn(OREO)を提案する。
我々の主な考えは、政策が専門家の行動と強く相関するニュアンス変数を悪用することを防ぐために、政策が全ての意味オブジェクトに均一に出席することを奨励することである。
論文 参考訳(メタデータ) (2021-10-27T01:56:23Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。