論文の概要: Reasoning Knowledge-Gap in Drone Planning via LLM-based Active Elicitation
- arxiv url: http://arxiv.org/abs/2603.07824v1
- Date: Sun, 08 Mar 2026 22:00:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.075325
- Title: Reasoning Knowledge-Gap in Drone Planning via LLM-based Active Elicitation
- Title(参考訳): LLMを用いたアクティブエミュレーションによるドローン計画における知識ギャップの推論
- Authors: Zeyu Fang, Beomyeol Yu, Cheng Liu, Zeyuan Yang, Rongqian Chen, Yuxin Lin, Mahdi Imani, Tian Lan,
- Abstract要約: 無人航空機(UAV)における人間とAIの共同計画は通常、環境の不確実性に直面した際の制御の引き渡しに依存している。
本稿では,協調パラダイムを制御テイクオーバからアクティブな情報提供に移行する新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 15.477731207334793
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human-AI joint planning in Unmanned Aerial Vehicles (UAVs) typically relies on control handover when facing environmental uncertainties, which is often inefficient and cognitively demanding for non-expert operators. To address this, we propose a novel framework that shifts the collaboration paradigm from control takeover to active information elicitation. We introduce the Minimal Information Neuro-Symbolic Tree (MINT), a reasoning mechanism that explicitly structures knowledge gaps regarding obstacles and goals into a queryable format. By leveraging large language models, our system formulates optimal binary queries to resolve specific ambiguities with minimal human interaction. We demonstrate the efficacy of this approach through a comprehensive workflow integrating a vision-language model for perception, voice interfaces, and a low-level UAV control module in both high-fidelity NVIDIA Isaac simulations and real-world deployments. Experimental results show that our method achieves a significant improvement in the success rate for complex search-and-rescue tasks while significantly reducing the frequency of human interaction compared to exhaustive querying baselines.
- Abstract(参考訳): 無人航空機(UAV)における人間とAIの共同計画は通常、環境の不確実性に直面した際の制御のハンドオーバに依存している。
そこで本稿では,コラボレーションのパラダイムをコントロールテイクオーバからアクティブな情報活用へとシフトさせる新しいフレームワークを提案する。
障害や目標に関する知識ギャップを問合せ可能な形式に明示的に構造化する推論機構であるミニマルインフォメーションニューロシンボリックツリー(MINT)を導入する。
大規模言語モデルを活用することで,人間のインタラクションを最小限に抑えて,特定のあいまいさを解決するために最適なバイナリクエリを定式化する。
本稿では,高忠実度NVIDIAアイザックシミュレーションと実世界展開の両方において,認識,音声インターフェース,低レベルUAV制御モジュールを視覚言語モデルに統合した包括的なワークフローを通じて,このアプローチの有効性を実証する。
実験結果から,本手法は複雑な検索・救助作業の成功率を大幅に向上すると同時に,クエリベースラインの網羅性よりも人的インタラクションの頻度を著しく低減することがわかった。
関連論文リスト
- Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models [7.802379200026965]
認識状態の複雑さに基づいてVLA実行を動的にルーティングする適応型フレームワークを提案する。
我々のアプローチは、VLAの視覚言語バックボーンを、パラメトリックおよび非パラメトリック推定器のアンサンブルに潜伏埋め込みを投影することにより、アクティブな検出ツールに変換する。
論文 参考訳(メタデータ) (2026-03-05T13:14:41Z) - IMAGINE: Intelligent Multi-Agent Godot-based Indoor Networked Exploration [0.0]
本稿では,2次元屋内環境における課題に対処するために,MARL(Multi-Agent Reinforcement Learning)を実装した。
政策訓練は、不確実性の下で創発的な協調行動と意思決定を達成することを目的としている。
論文 参考訳(メタデータ) (2026-02-02T22:08:41Z) - SelfAI: Building a Self-Training AI System with LLM Agents [79.10991818561907]
SelfAIは、高レベルの研究目的を標準化された実験構成に変換するためのUser Agentを組み合わせた、一般的なマルチエージェントプラットフォームである。
実験マネージャは、連続的なフィードバックのための構造化知識ベースを維持しながら、異種ハードウェアをまたいだ並列かつフォールトトレラントなトレーニングを編成する。
回帰、コンピュータビジョン、科学計算、医用画像、薬物発見ベンチマークなどを通じて、SelfAIは一貫して高いパフォーマンスを達成し、冗長な試行を減らしている。
論文 参考訳(メタデータ) (2025-11-29T09:18:39Z) - AerialMind: Towards Referring Multi-Object Tracking in UAV Scenarios [64.51320327698231]
UAVシナリオにおける最初の大規模RMOTベンチマークであるAerialMindを紹介する。
我々は、革新的な半自動協調型エージェントベースラベリングアシスタントフレームワークを開発した。
また,視覚言語表現学習を協調的に強化する新しい手法であるHawkEyeTrackを提案する。
論文 参考訳(メタデータ) (2025-11-26T04:44:27Z) - An LLM-based Framework for Human-Swarm Teaming Cognition in Disaster Search and Rescue [11.300720465575608]
大規模災害探索・救助(SAR)の運用は複雑な地形と通信を妨害する。
Unmanned Aerial Vehicle(UAV)は、広域検索やサプライデリバリーといったタスクに対して、有望なソリューションを提供するが、その効果的な調整は、人間のオペレーターに重大な認知的負担を与える。
本研究では,Large Language Models (LLMs) を応用し,人間とスワームの協調認知をモデル化・拡張する新しいLLM-CRFシステムを提案する。
論文 参考訳(メタデータ) (2025-11-06T04:27:20Z) - Dialogue as Discovery: Navigating Human Intent Through Principled Inquiry [38.72208780072353]
人間とAIのコラボレーションにおける基本的なボトルネックは「意図的表現ギャップ」である
本稿では,ユーザの意図に関する不確実性を解決するために,積極的に情報を探究するエージェントを提案する。
我々は、この調査政策の熟達のために訓練された、提案されたエージェント Nous を命名する。
論文 参考訳(メタデータ) (2025-10-31T12:00:21Z) - Efficient Onboard Vision-Language Inference in UAV-Enabled Low-Altitude Economy Networks via LLM-Enhanced Optimization [61.55616421408666]
低高度経済ネットワーク(LAENets)は、航空監視、環境検知、セマンティックデータ収集など、様々な応用を可能にしている。
オンボードビジョン(VLM)は、リアルタイムな推論を提供するが、オンボードの動的ネットワーク条件は限られている。
動的LEENet条件下での通信効率を向上させるUAV対応LEENetシステムを提案する。
論文 参考訳(メタデータ) (2025-10-11T05:11:21Z) - Understanding the Information Propagation Effects of Communication Topologies in LLM-based Multi-Agent Systems [58.95962217043371]
提案手法は, エージェントの出力の正確さ, 誤動作の有無を, 異なる範囲の位相の下で伝達する因果関係を解析するための枠組みである。
実験により,有益な情報拡散を保ちながらエラーの伝播を効果的に抑制する,適度に疎らなトポロジが,通常最適なタスク性能を達成できることが判明した。
本稿では,高密度グラフとスパースグラフの両方から接続パターンを融合させることにより,エラー抑制と有益な情報伝達のバランスをとる新しいトポロジ設計手法 EIB-leanrner を提案する。
論文 参考訳(メタデータ) (2025-05-29T11:21:48Z) - Large Models in Dialogue for Active Perception and Anomaly Detection [35.16837804526144]
本稿では,新たなシーンにおける情報収集と異常検出を行うフレームワークを提案する。
2つのディープラーニングモデルが対話を行い、ドローンを積極的に制御し、認識と異常検出の精度を高める。
情報収集に加えて,本手法を異常検出に利用し,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-01-27T18:38:36Z) - Collaborative Instance Object Navigation: Leveraging Uncertainty-Awareness to Minimize Human-Agent Dialogues [54.81155589931697]
協調インスタンスオブジェクトナビゲーション(CoIN)は、エージェントがターゲットインスタンスに関する不確実性を積極的に解決する新しいタスク設定である。
未認識者に対するエージェント・ユーザインタラクション(AIUTA)の新たな学習自由化手法を提案する。
まず、オブジェクト検出時に、セルフクエチオナーモデルがエージェント内で自己対話を開始し、完全かつ正確な観察記述を得る。
インタラクショントリガーモジュールは、人間に質問するか、継続するか、ナビゲーションを停止するかを決定する。
論文 参考訳(メタデータ) (2024-12-02T08:16:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。