論文の概要: CORAL: COntextual Reasoning And Local Planning in A Hierarchical VLM Framework for Underwater Monitoring
- arxiv url: http://arxiv.org/abs/2603.14786v1
- Date: Mon, 16 Mar 2026 03:35:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.841864
- Title: CORAL: COntextual Reasoning And Local Planning in A Hierarchical VLM Framework for Underwater Monitoring
- Title(参考訳): 地下モニタリングのための階層型VLMフレームワークにおけるコナール推論とローカルプランニング
- Authors: Zhenqi Wu, Yuanjie Lu, Xuesu Xiao, Xiaomin Lin,
- Abstract要約: オイスターサンゴ礁は生物多様性を維持し、水を濾過し、海岸線を保護する重要な生態系種である。
礁の健康を評価するための通常の水中モニタリングは、人間のダイバーが行う場合、費用がかかり、危険であり、制限される。
既存の自律型水中車両(AUV)は、シーンセマンティクスを解釈できない幾何学に基づくナビゲーションに依存している。
近年の視覚言語モデル(VLM)は知的探索のセマンティック推論を可能にするが、既存のVLM駆動システムはエンドツーエンドのパラダイムを採用している。
低レベルのリアクティブ制御から高レベルのセマンティック推論を分離するフレームワークであるCORALを提案する。
- 参考スコア(独自算出の注目度): 10.250809787836607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Oyster reefs are critical ecosystem species that sustain biodiversity, filter water, and protect coastlines, yet they continue to decline globally. Restoring these ecosystems requires regular underwater monitoring to assess reef health, a task that remains costly, hazardous, and limited when performed by human divers. Autonomous underwater vehicles (AUVs) offer a promising alternative, but existing AUVs rely on geometry-based navigation that cannot interpret scene semantics. Recent vision-language models (VLMs) enable semantic reasoning for intelligent exploration, but existing VLM-driven systems adopt an end-to-end paradigm, introducing three key limitations. First, these systems require the VLM to generate every navigation decision, forcing frequent waits for inference. Second, VLMs cannot model robot dynamics, causing collisions in cluttered environments. Third, limited self-correction allows small deviations to accumulate into large path errors. To address these limitations, we propose CORAL, a framework that decouples high-level semantic reasoning from low-level reactive control. The VLM provides high-level exploration guidance by selecting waypoints, while a dynamics-based planner handles low-level collision-free execution. A geometric verification module validates waypoints and triggers replanning when needed. Compared with the previous state-of-the-art, CORAL improves coverage by 14.28% percentage points, or 17.85% relatively, reduces collisions by 100%, and requires 57% fewer VLM calls.
- Abstract(参考訳): オイスターサンゴ礁は生物多様性を維持し、水を濾過し、海岸線を保護する重要な生態系種である。
これらの生態系の回復には、人間のダイバーが行う場合、費用がかかり、危険で制限された作業であるサンゴ礁の健康状態を評価するための定期的な水中監視が必要である。
自律型水中車両(AUV)は有望な代替手段を提供するが、既存のAUVはシーンセマンティクスを解釈できない幾何学に基づくナビゲーションに依存している。
最近の視覚言語モデル(VLM)は知的な探索のための意味論的推論を可能にするが、既存のVLM駆動システムはエンドツーエンドのパラダイムを採用し、3つの重要な制限を課している。
第一に、これらのシステムはVLMに全てのナビゲーション決定を発生させ、頻繁に推論を待つことを要求する。
第二に、VLMはロボット力学をモデル化できず、乱雑な環境で衝突を引き起こす。
第三に、制限された自己補正は、小さな偏差を大きな経路誤差に蓄積することを可能にする。
これらの制限に対処するため、我々は低レベルのリアクティブ制御から高レベルのセマンティック推論を分離するフレームワークであるCORALを提案する。
VLMはウェイポイントの選択による高レベルの探索ガイダンスを提供し、ダイナミックスベースのプランナは低レベルの衝突のない実行を処理する。
幾何学的検証モジュールは、ウェイポイントを検証し、必要に応じてリプランングをトリガーする。
これまでの最先端と比較して、CORALは14.28%、または17.85%の比率でカバー範囲を改善し、衝突を100%減らし、VLMコールを57%減らした。
関連論文リスト
- RENEW: Risk- and Energy-Aware Navigation in Dynamic Waterways [10.620311022921205]
本稿では、外乱を伴う動的環境における自律表面車両(ASV)のグローバルパスプランナーであるRENEWについて述べる。
我々は,非航行可能な地域を動的に識別することで安全を確保する,リスクとエネルギーを意識した統合戦略を導入する。
海上の緊急計画にインスパイアされ、悪条件下での制御を維持するために最善策を採用している。
論文 参考訳(メタデータ) (2026-01-23T03:33:52Z) - Hybrid DQN-TD3 Reinforcement Learning for Autonomous Navigation in Dynamic Environments [1.241204035960416]
本稿では、離散的なサブゴール選択のための高レベルなディープQネットワーク(DQN)と、連続的な動作のための低レベルなツイン遅延Deep Deterministic Policy Gradient(TD3)コントローラを組み合わせた階層的パス計画制御フレームワークを提案する。
我々は、安全でない動きを防止できるLiDARベースの安全ゲートとともに、実用的な報酬形成スキーム(方向、距離、障害物回避、動作の平滑性、衝突罰、時間罰、進行)を設計する。
論文 参考訳(メタデータ) (2025-10-30T16:12:01Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - DORAEMON: Decentralized Ontology-aware Reliable Agent with Enhanced Memory Oriented Navigation [55.888688171010365]
DORAEMONは、人間のナビゲーション機能を模倣したVentralとDorsal Streamsで構成される、認知にインスパイアされたフレームワークである。
我々は,DORAEMONをHM3D,MP3D,GOATのデータセット上で評価し,成功率(SR)と成功度(SPL)の測定値の両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-05-28T04:46:13Z) - Depth-Constrained ASV Navigation with Deep RL and Limited Sensing [43.785833390490446]
本研究では,深度制約下でのASVナビゲーションのための強化学習フレームワークを提案する。
環境意識を高めるため,GPレグレッションをRLフレームワークに統合する。
我々は,実世界の水環境に対して,訓練された政策が適切に一般化されることを保証する効果的なシミュレート・トゥ・リアル・トランスファーを実証する。
論文 参考訳(メタデータ) (2025-04-25T10:56:56Z) - Image-Based Relocalization and Alignment for Long-Term Monitoring of Dynamic Underwater Environments [57.59857784298534]
本稿では,視覚的位置認識(VPR),特徴マッチング,画像分割を組み合わせた統合パイプラインを提案する。
本手法は, 再検討領域のロバスト同定, 剛性変換の推定, 生態系変化の下流解析を可能にする。
論文 参考訳(メタデータ) (2025-03-06T05:13:19Z) - Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.66677293607114]
オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文 参考訳(メタデータ) (2024-12-05T18:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。