論文の概要: Selective Agentic Recovery for UAV Autonomy with a Persistent Mission Runtime
- arxiv url: http://arxiv.org/abs/2606.14219v1
- Date: Fri, 12 Jun 2026 07:57:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.81238
- Title: Selective Agentic Recovery for UAV Autonomy with a Persistent Mission Runtime
- Title(参考訳): 永続ミッションランタイムを用いたUAVオートノミーのための選択的エージェントリカバリ
- Authors: Taewoo Park, Kyeonghyun Yoo, Seunghyun Yoo, Hwangnam Kim,
- Abstract要約: 物理的UAVでは、リモート推論は選択的に呼び出されるときに最も有用である。
本稿では,ミッションループと安全クリティカルな実行をローカルに保持する回復フレームワークであるPersistent Mission(PMR)を提案する。
PMRは、遠隔エージェント推論が短期ミッションの進捗を改善する可能性があることを見積もる、コンパクトな入場ゲートである学習された認知的行動価値(Learned-CVI)を導入している。
- 参考スコア(独自算出の注目度): 1.189955933770711
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agentic AI can support unmanned aerial vehicle (UAV) autonomy by providing high-level recovery reasoning when local waypoint- or setpoint-based execution encounters blocked passages, repeated no-progress behavior, or mission-level ambiguity. On physical UAVs, however, remote reasoning is most useful when it is invoked selectively, since each call introduces latency, resource cost, backend uncertainty, and a need to validate the returned decision. This paper presents Persistent Mission Runtime (PMR), a UAV recovery framework that keeps the mission loop and safety-critical execution local while using an external agentic reasoner only as an on-demand recovery module. The reasoner selects from predefined recovery skills, and each returned decision is parsed, verified, safety-filtered, and mapped to local executor actions before it can affect flight. PMR introduces learned Cognitive Value of Invocation (learned-CVI), a compact admission gate that estimates when remote agentic reasoning is likely to improve near-term mission progress enough to justify its operational cost. Across a fixed 400-run Gazebo/PX4 benchmark with eight scenarios, learned-CVI raises hard/ambiguous-regime success from 5.0% under local-only autonomy to 95.0%, outperforms one-shot and periodic reasoning baselines by 20.0 and 32.5 percentage points, and reduces remote-agent calls by 16.7% and logged tokens by 29.2% relative to a manually tuned rule-based invocation baseline.
- Abstract(参考訳): エージェントAIは、ローカルなウェイポイントまたはセグポイントベースの実行がブロックされたパス、繰り返しの非プログレッシブな振る舞い、またはミッションレベルの曖昧さに遭遇した場合に、高いレベルのリカバリ推論を提供することで、無人航空機(UAV)の自律性をサポートすることができる。
しかし、物理的UAVでは、各呼び出しがレイテンシ、リソースコスト、バックエンドの不確実性、そして返却された決定を検証する必要があるため、リモート推論が選択的に呼び出されるときに最も有用である。
本稿では,ミッションループと安全クリティカルな実行をローカルに維持するUAVリカバリフレームワークであるPersistent Mission Runtime(PMR)を,オンデマンドリカバリモジュールとしてのみ外部エージェント推論器を用いて提案する。
推論者は事前に定義された回復スキルから選択し、返却された各決定は解析され、検証され、安全フィルタされ、飛行に影響を与える前に地元の実行者行動にマップされる。
PMRは、遠隔エージェント推論が運用コストを正当化するのに十分な短期的なミッション進捗を改善する可能性があることを見積もる、コンパクトな受け入れゲートである学習された認知的呼び出しの価値(Learned-CVI)を導入している。
固定400ランのGazebo/PX4ベンチマークの8つのシナリオで、Lucled-CVIは、ローカルのみの自主性の下でハード/アンビグラス・レジデンスを5.0%から95.0%に引き上げ、ワンショットおよび周期的推論ベースラインを20.0ポイントと32.5ポイントで上回り、リモートエージェント呼び出しを16.7%削減し、手動でチューニングされたルールベースの呼び出しベースラインと比較してトークンを29.2%削減した。
関連論文リスト
- LAEI: Layered Autonomous Edge Intelligence Framework for Robust UAV Swarm Operations [3.8233569758620054]
レイヤエッジインテリジェンス(Layered Edge Intelligence,LAEI)は、オンボードで学んだポリシと軽量なミッションレベルの監視を組み合わせた、UAV(UAV-swarm)フレームワークである。
LAEIはミッション完了時間を短縮し、衝突対応UAVレベルの分散意思決定を維持しながら、運用効率を向上させる。
論文 参考訳(メタデータ) (2026-06-08T06:50:15Z) - Market-Based Replanning for Safety-Critical UAV Swarms in Search and Rescue Missions [0.0]
SAR(Search and Rescue)ミッションにおける信頼性の高い自律型UAV群は、エージェントの劣化にもかかわらず、動作を持続できるフォールトトレラント調整を必要とする。
本稿では,資源制約環境向けに設計された分散協調アーキテクチャであるIntelligent Replanning Drone Swarm (IRDS)を紹介する。
論文 参考訳(メタデータ) (2026-06-01T09:33:15Z) - Pedestrian-Aware LLM-Driven Behavioral Planning for Autonomous Vehicles [5.343135467323389]
歩行者対応行動計画のための大規模言語モデル(LLM)に基づく意思決定フレームワーク。
システムは、構造化されたシーンの観察を自然言語による推論のプロンプトに変換し、LLMは歩行者の意図を推測し、リスクを予測し、慎重な戦術的な運転決定を生成する。
本研究では, 予期せぬ歩行, ターンバック・クロス, ためらい, 双方向横断など, 複数の歩行者行動シナリオにおけるSUMOの枠組みを評価した。
論文 参考訳(メタデータ) (2026-05-16T07:41:42Z) - Metis: Learning to Jailbreak LLMs via Self-Evolving Metacognitive Policy Optimization [51.11398557420066]
我々は、推論時ポリシー最適化としてジェイルブレイクを改定するフレームワークであるMetisを紹介する。
メティスは比較手法の中でも89.2%で最強のアタック成功率(ASR)を達成している。
冗長な探索を最適化に置き換えることで、Metisはトークンコストを平均8.2倍、最大11.4倍に削減する。
論文 参考訳(メタデータ) (2026-05-11T06:45:00Z) - When Should a Robot Think? Resource-Aware Reasoning via Reinforcement Learning for Embodied Robotic Decision-Making [68.12864562049957]
身体ロボットシステムは、高レベルの推論をサポートするために、大規模言語モデル(LLM)ベースのエージェントにますます依存している。
エージェントはいつ、いつ、いつ行動すべきか?
本稿では,エンボディエージェントのリソース・アウェア・オーケストレーションのための階層的なフレームワークであるRARRL(Resource-Aware Reasoning via Reinforcement Learning)を提案する。
論文 参考訳(メタデータ) (2026-03-17T15:38:50Z) - AOI: Turning Failed Trajectories into Training Signals for Autonomous Cloud Diagnosis [19.899469614370478]
大規模言語モデル(LLM)エージェントは、SRE(Site Reliability Engineering)を自動化するための有望なデータ駆動型アプローチを提供する
本稿では,セキュリティ制約下での構造化軌道学習問題として,自動操作を定式化したトレーニング可能なマルチエージェントフレームワークAOIを提案する。
論文 参考訳(メタデータ) (2026-03-03T02:57:33Z) - Verified Critical Step Optimization for LLM Agents [67.05296684575445]
クリティカルステップ最適化は、検証されたクリティカルステップに優先学習を集中する。
メソッドは、専門家のデモンストレーションではなく、失敗するポリシーの軌道から始まります。
GAIA-Text-103とXBench-DeepSearchの実験では、CSOはSFTベースラインよりも37%、相対的に26%改善している。
論文 参考訳(メタデータ) (2026-02-03T11:41:02Z) - Learning to Undo: Rollback-Augmented Reinforcement Learning with Reversibility Signals [1.9537983097153042]
本稿では,価値に基づく強化学習エージェントの堅牢性と効率を向上させるための可逆学習フレームワークを提案する。
このフレームワークには2つの補完的なコア機構がある: s の Phi と割り込みと呼ばれる経験的に導出された遷移可逆性測度、選択状態のロールバック演算である。
論文 参考訳(メタデータ) (2025-10-16T09:48:54Z) - SEEA-R1: Tree-Structured Reinforcement Fine-Tuning for Self-Evolving Embodied Agents [58.174206358223415]
自己進化型エボダイドエージェント(SeEA-R1)は、自己進化型エボダイドエージェント用に設計された最初の強化微細調整フレームワークである。
本研究は,SEEA-R1が自律適応と報酬駆動型自己進化をサポートすることを示す。
論文 参考訳(メタデータ) (2025-06-26T18:00:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。