論文の概要: Integrating Symbolic RL Planning into a BDI-based Autonomous UAV Framework: System Integration and SIL Validation
- arxiv url: http://arxiv.org/abs/2508.11890v1
- Date: Sat, 16 Aug 2025 03:27:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.435976
- Title: Integrating Symbolic RL Planning into a BDI-based Autonomous UAV Framework: System Integration and SIL Validation
- Title(参考訳): シンボリックRLプランニングをBDIベースの自律型UAVフレームワークに統合する:システム統合とSIL検証
- Authors: Sangwoo Jeon, Juchul Shin, YeonJe Cho, Gyeong-Tae Kim, Seongwoo Kim,
- Abstract要約: 本稿では,自律ミッションエージェント・フォー・ドローン(AMAD)認知マルチエージェントアーキテクチャの拡張版を提案する。
我々は、ハードウェア・イン・ザ・ループ・シミュレーション(HILS)プラットフォームと同じ構成のSoftware-in-the-Loop(SIL)環境で、我々のフレームワークを検証した。
実験の結果、モジュールの安定な統合と相互運用、BDI駆動と象徴的なRL駆動の計画フェーズ間の遷移の成功、一貫したミッション性能が示された。
- 参考スコア(独自算出の注目度): 3.5966087153300057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern autonomous drone missions increasingly require software frameworks capable of seamlessly integrating structured symbolic planning with adaptive reinforcement learning (RL). Although traditional rule-based architectures offer robust structured reasoning for drone autonomy, their capabilities fall short in dynamically complex operational environments that require adaptive symbolic planning. Symbolic RL (SRL), using the Planning Domain Definition Language (PDDL), explicitly integrates domain-specific knowledge and operational constraints, significantly improving the reliability and safety of unmanned aerial vehicle (UAV) decision making. In this study, we propose the AMAD-SRL framework, an extended and refined version of the Autonomous Mission Agents for Drones (AMAD) cognitive multi-agent architecture, enhanced with symbolic reinforcement learning for dynamic mission planning and execution. We validated our framework in a Software-in-the-Loop (SIL) environment structured identically to an intended Hardware-In-the-Loop Simulation (HILS) platform, ensuring seamless transition to real hardware. Experimental results demonstrate stable integration and interoperability of modules, successful transitions between BDI-driven and symbolic RL-driven planning phases, and consistent mission performance. Specifically, we evaluate a target acquisition scenario in which the UAV plans a surveillance path followed by a dynamic reentry path to secure the target while avoiding threat zones. In this SIL evaluation, mission efficiency improved by approximately 75% over a coverage-based baseline, measured by travel distance reduction. This study establishes a robust foundation for handling complex UAV missions and discusses directions for further enhancement and validation.
- Abstract(参考訳): 現代の自律ドローンミッションでは、構造化された象徴的計画と適応強化学習(RL)をシームレスに統合できるソフトウェアフレームワークがますます求められている。
従来のルールベースのアーキテクチャは、ドローン自律性のための堅牢な構造化された推論を提供するが、その能力は適応的なシンボリックプランニングを必要とする動的に複雑な運用環境では不足する。
シンボリックRL(SRL)は、計画ドメイン定義言語(PDDL)を使用して、ドメイン固有の知識と運用上の制約を明示的に統合し、無人航空機(UAV)による意思決定の信頼性と安全性を大幅に向上させる。
本研究では,AMAD(Autonomous Mission Agents for Drones)認知マルチエージェントアーキテクチャの拡張版であるAMAD-SRLフレームワークを提案する。
我々は,ハードウェア・イン・ザ・ループ・シミュレーション(HILS)プラットフォームと同じ構成のSoftware-in-the-Loop(SIL)環境において,実ハードウェアへのシームレスな移行を保証するため,我々のフレームワークを検証した。
実験の結果、モジュールの安定な統合と相互運用、BDI駆動と象徴的RL駆動の計画フェーズ間の遷移の成功、一貫したミッション性能が示された。
具体的には、UAVが監視経路を計画し、次に動的再突入経路を計画し、脅威帯を避けながら目標を確保できる目標獲得シナリオを評価する。
このSIL評価では、走行距離の低減により、カバーベースベースラインよりも約75%効率が向上した。
本研究は、複雑なUAVミッションを扱うための堅牢な基盤を確立し、さらなる強化と検証の方向性について論じる。
関連論文リスト
- LLM Meets the Sky: Heuristic Multi-Agent Reinforcement Learning for Secure Heterogeneous UAV Networks [57.27815890269697]
この研究は、エネルギー制約下での不均一なUAVネットワーク(HetUAVN)における機密率の最大化に焦点を当てている。
本稿では,Large Language Model (LLM) を用いたマルチエージェント学習手法を提案する。
その結果,本手法は機密性やエネルギー効率において,既存のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-07-23T04:22:57Z) - SOLVE: Synergy of Language-Vision and End-to-End Networks for Autonomous Driving [51.47621083057114]
SOLVEは、ビジョンランゲージモデルとエンド・ツー・エンド(E2E)モデルを相乗化して自動運転車の計画を強化する革新的なフレームワークである。
提案手法は,VLMとE2Eコンポーネント間の包括的インタラクションを実現するために,共有ビジュアルエンコーダによる機能レベルでの知識共有を重視している。
論文 参考訳(メタデータ) (2025-05-22T15:44:30Z) - Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application [3.206131271136423]
本稿では, 自律誘導, ナビゲーション, タスク分散のための総合的な枠組みを提案する。
我々は,2つの遅延型Deep Deterministic Policy Gradientアルゴリズムを利用して,DRLに基づく指導機構を提唱する。
DRL学習グラフ畳み込みネットワーク(GCN)による協調型UAV間のタスク分散問題に取り組む。
論文 参考訳(メタデータ) (2025-02-27T17:53:16Z) - Integrated Sensing and Communications for Low-Altitude Economy: A Deep Reinforcement Learning Approach [20.36806314683902]
低高度経済(LAE)のための統合センシング・通信(ISAC)システムについて検討する。
所定の飛行期間における通信総和レートは、GBSとUAVの軌道でのビームフォーミングを共同最適化することにより最大化する。
本稿では, 深部強化学習(DRL)技術を活用して, 深部LAE-ISAC(Deep LAE-ISAC)と呼ばれる新しいLEE指向ISAC方式を提案する。
論文 参考訳(メタデータ) (2024-12-05T11:12:46Z) - A Cross-Scene Benchmark for Open-World Drone Active Tracking [54.235808061746525]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。
DATと呼ばれるオープンワールドドローンアクティブトラッキングのためのクロスシーンクロスドメインベンチマークを提案する。
また、R-VATと呼ばれる強化学習に基づくドローン追跡手法を提案する。
論文 参考訳(メタデータ) (2024-12-01T09:37:46Z) - Cooperative Cognitive Dynamic System in UAV Swarms: Reconfigurable Mechanism and Framework [80.39138462246034]
UAVスワムの管理を最適化するための協調認知力学システム(CCDS)を提案する。
CCDSは階層的かつ協調的な制御構造であり、リアルタイムのデータ処理と意思決定を可能にする。
さらに、CCDSは、UAVスワムのタスクを効率的に割り当てるための生体模倣機構と統合することができる。
論文 参考訳(メタデータ) (2024-05-18T12:45:00Z) - Large-scale Autonomous Flight with Real-time Semantic SLAM under Dense
Forest Canopy [48.51396198176273]
本研究では,大規模自律飛行とリアルタイムセマンティックマッピングを,挑戦的なアンダーキャノピー環境下で実現可能な統合システムを提案する。
我々は、スキャン全体で関連付けられ、木のトランクモデルと同様にロボットのポーズを制約するために使用されるLiDARデータから、木の幹と地面の平面を検出し、モデル化する。
ドリフト補償機構は、プランナー最適性とコントローラ安定性を維持しつつ、セマンティックSLAM出力を用いたドリフトをリアルタイムで最小化するように設計されている。
論文 参考訳(メタデータ) (2021-09-14T07:24:53Z) - Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots [58.980293789967575]
通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。
室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。
調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
論文 参考訳(メタデータ) (2020-11-23T21:45:01Z) - UAV Path Planning for Wireless Data Harvesting: A Deep Reinforcement
Learning Approach [18.266087952180733]
本稿では,IoT(Internet of Things)デバイスからのUAV対応データ収集に対するエンドツーエンド強化学習手法を提案する。
自律ドローンは、限られた飛行時間と障害物回避を受ける分散センサーノードからデータを収集する。
提案するネットワークアーキテクチャにより,エージェントが様々なシナリオパラメータの移動決定を行うことができることを示す。
論文 参考訳(メタデータ) (2020-07-01T15:14:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。