論文の概要: DUViN: Diffusion-Based Underwater Visual Navigation via Knowledge-Transferred Depth Features
- arxiv url: http://arxiv.org/abs/2509.02983v1
- Date: Wed, 03 Sep 2025 03:43:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.405803
- Title: DUViN: Diffusion-Based Underwater Visual Navigation via Knowledge-Transferred Depth Features
- Title(参考訳): DUViN:知識伝達深度特徴を用いた拡散型水中視覚ナビゲーション
- Authors: Jinghe Yang, Minh-Quan Le, Mingming Gong, Ye Pu,
- Abstract要約: 本研究では,知識伝達深度特性を用いた拡散型水中ビジュアルナビゲーションポリシーDUViNを提案する。
DuViNは、事前に構築された地図に頼ることなく、障害物を回避し、地形に対して安全かつ認識の高い高度を維持するよう車両を誘導する。
シミュレーションおよび実世界の水中環境における実験は、我々のアプローチの有効性と一般化を実証している。
- 参考スコア(独自算出の注目度): 47.88998580611257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous underwater navigation remains a challenging problem due to limited sensing capabilities and the difficulty of constructing accurate maps in underwater environments. In this paper, we propose a Diffusion-based Underwater Visual Navigation policy via knowledge-transferred depth features, named DUViN, which enables vision-based end-to-end 4-DoF motion control for underwater vehicles in unknown environments. DUViN guides the vehicle to avoid obstacles and maintain a safe and perception awareness altitude relative to the terrain without relying on pre-built maps. To address the difficulty of collecting large-scale underwater navigation datasets, we propose a method that ensures robust generalization under domain shifts from in-air to underwater environments by leveraging depth features and introducing a novel model transfer strategy. Specifically, our training framework consists of two phases: we first train the diffusion-based visual navigation policy on in-air datasets using a pre-trained depth feature extractor. Secondly, we retrain the extractor on an underwater depth estimation task and integrate the adapted extractor into the trained navigation policy from the first step. Experiments in both simulated and real-world underwater environments demonstrate the effectiveness and generalization of our approach. The experimental videos are available at https://www.youtube.com/playlist?list=PLqt2s-RyCf1gfXJgFzKjmwIqYhrP4I-7Y.
- Abstract(参考訳): 自律的な水中航行は、限られた感知能力と、水中環境で正確な地図を構築するのが難しいため、依然として困難な問題である。
本稿では,未知の環境下での水中車両に対する視覚に基づくエンドツーエンドの4-DoFモーション制御を可能にする,知識伝達深度機能であるDUViNを用いた拡散型水中視覚ナビゲーションポリシーを提案する。
DUViNは、事前に構築された地図に頼ることなく、障害物を回避し、地形に対して安全かつ認識の高い高度を維持するよう車両を誘導する。
大規模水中航法データセットの収集の難しさに対処するため,深度特性を活用し,新しいモデル伝達戦略を導入することにより,水中から水中へのドメインシフト下でのロバストな一般化を実現する手法を提案する。
具体的には、トレーニングフレームワークは、2つのフェーズから構成される: まず、事前訓練された深度特徴抽出器を使用して、空気中のデータセット上で拡散に基づく視覚ナビゲーションポリシーをトレーニングする。
第2に,水中深度推定タスクで抽出器を再訓練し,適応された抽出器を第1段階から訓練されたナビゲーションポリシーに統合する。
シミュレーションおよび実世界の水中環境における実験は、我々のアプローチの有効性と一般化を実証している。
実験ビデオはhttps://www.youtube.com/playlist?
list=PLqt2s-RyCf1gXJgFzKjmwIqYhrP4I-7Y
関連論文リスト
- On-board Sonar Data Classification for Path Following in Underwater Vehicles using Fast Interval Type-2 Fuzzy Extreme Learning Machine [0.29767565026354176]
我々は、BlueROV2と呼ばれる水中車両を用いて、船上ソナーデータ分類のためのファジィ推論システムを訓練する。
提案手法は,2つ以上のタスクの同時実行によってリアルタイムナビゲーション計画が実行される一方で,BlueROVに周辺環境に関するより完全な感覚図を提供する。
論文 参考訳(メタデータ) (2025-06-15T08:01:36Z) - Depth-Constrained ASV Navigation with Deep RL and Limited Sensing [45.77464360746532]
本研究では,深度制約下でのASVナビゲーションのための強化学習フレームワークを提案する。
環境意識を高めるため,GPレグレッションをRLフレームワークに統合する。
我々は,実世界の水環境に対して,訓練された政策が適切に一般化されることを保証する効果的なシミュレート・トゥ・リアル・トランスファーを実証する。
論文 参考訳(メタデータ) (2025-04-25T10:56:56Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - Augmented reality navigation system for visual prosthesis [67.09251544230744]
反応ナビゲーションと経路計画のソフトウェアを組み込んだ視覚補綴用拡張現実ナビゲーションシステムを提案する。
対象を地図上に配置し、対象の軌道を計画し、対象に示し、障害なく再計画する。
その結果,目標を達成するための時間と距離を減らし,障害物衝突の回数を大幅に減らし,航法性能の向上を図っている。
論文 参考訳(メタデータ) (2021-09-30T09:41:40Z) - Active Visual Information Gathering for Vision-Language Navigation [115.40768457718325]
視覚言語ナビゲーション(VLN)は、エージェントがフォトリアリスティックな環境の中でナビゲーションの指示を行うためのタスクである。
VLNの重要な課題の1つは、曖昧な指示による不確実性を緩和し、環境の観察を不十分にすることで、堅牢なナビゲーションを行う方法である。
この研究は、人間のナビゲーション行動からインスピレーションを得て、よりインテリジェントなVLNポリシーのためのアクティブな情報収集能力を持つエージェントを提供する。
論文 参考訳(メタデータ) (2020-07-15T23:54:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。