論文の概要: Tree-Mamba: A Tree-Aware Mamba for Underwater Monocular Depth Estimation
- arxiv url: http://arxiv.org/abs/2507.07687v1
- Date: Thu, 10 Jul 2025 12:10:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-11 16:40:15.388558
- Title: Tree-Mamba: A Tree-Aware Mamba for Underwater Monocular Depth Estimation
- Title(参考訳): 木マンバ:水中単分子深度推定のための木を意識したマンバ
- Authors: Peixian Zhuang, Yijian Wang, Zhenqi Fu, Hongliang Zhang, Sam Kwong, Chongyi Li,
- Abstract要約: 水中単眼深度推定(UMDE)は水中劣化画像から高精度深度マップを推定することを目的とした重要な課題である。
我々は,水中の劣化画像から正確な単分子深度マップを推定するための,木を意識した新しいマンバ手法であるTree-Mambaを開発した。
海底深度推定ベンチマーク (BlueDepth) を構築し, 深度ラベルが信頼できる海底画像ペア38,162枚を構築した。
- 参考スコア(独自算出の注目度): 85.17735565146106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater Monocular Depth Estimation (UMDE) is a critical task that aims to estimate high-precision depth maps from underwater degraded images caused by light absorption and scattering effects in marine environments. Recently, Mamba-based methods have achieved promising performance across various vision tasks; however, they struggle with the UMDE task because their inflexible state scanning strategies fail to model the structural features of underwater images effectively. Meanwhile, existing UMDE datasets usually contain unreliable depth labels, leading to incorrect object-depth relationships between underwater images and their corresponding depth maps. To overcome these limitations, we develop a novel tree-aware Mamba method, dubbed Tree-Mamba, for estimating accurate monocular depth maps from underwater degraded images. Specifically, we propose a tree-aware scanning strategy that adaptively constructs a minimum spanning tree based on feature similarity. The spatial topological features among the tree nodes are then flexibly aggregated through bottom-up and top-down traversals, enabling stronger multi-scale feature representation capabilities. Moreover, we construct an underwater depth estimation benchmark (called BlueDepth), which consists of 38,162 underwater image pairs with reliable depth labels. This benchmark serves as a foundational dataset for training existing deep learning-based UMDE methods to learn accurate object-depth relationships. Extensive experiments demonstrate the superiority of the proposed Tree-Mamba over several leading methods in both qualitative results and quantitative evaluations with competitive computational efficiency. Code and dataset will be available at https://wyjgr.github.io/Tree-Mamba.html.
- Abstract(参考訳): 水中単眼深度推定(UMDE)は,海洋環境における光吸収と散乱による水中劣化画像から高精度深度マップを推定することを目的とした重要な課題である。
近年,マンバをベースとした手法は様々な視覚課題において有望な性能を達成しているが,その非フレキシブルな状態スキャン戦略が水中画像の構造的特徴を効果的にモデル化できないため,UMDE課題に苦慮している。
一方、既存のUMDEデータセットは通常、信頼できない深度ラベルを含んでおり、水中画像とそれに対応する深度マップとの間の不正確な深度関係をもたらす。
これらの制約を克服するために,水中の劣化画像から正確な単分子深度マップを推定する,Tree-Mambaと呼ばれる新しい木を意識したMamba法を開発した。
具体的には,特徴の類似性に基づいて最小スパンニング木を適応的に構築する木認識走査手法を提案する。
木ノード間の空間的トポロジ的特徴は、ボトムアップとトップダウンのトラバーサルを通じて柔軟に集約され、より強力なマルチスケールの特徴表現機能を実現する。
さらに,海底深度推定ベンチマーク(BlueDepth)を構築した。
このベンチマークは、既存のディープラーニングベースのUMDEメソッドをトレーニングし、正確なオブジェクト-深度関係を学習するための基礎的なデータセットとして機能する。
大規模実験は、定性的な結果と競合計算効率の定量的評価の両方において、提案したツリー・マンバのいくつかの主要な手法よりも優れていることを示す。
コードとデータセットはhttps://wyjgr.github.io/Tree-Mamba.htmlで入手できる。
関連論文リスト
- A Novel Solution for Drone Photogrammetry with Low-overlap Aerial Images using Monocular Depth Estimation [6.689484367905018]
低オーバラップの空中画像は、従来のフォトグラム法に重大な課題を生んでいる。
本稿では,従来の手法の限界に対処するため,単眼深度推定に基づく新しいワークフローを提案する。
論文 参考訳(メタデータ) (2025-03-06T14:59:38Z) - Marigold-DC: Zero-Shot Monocular Depth Completion with Guided Diffusion [51.69876947593144]
奥行き完了のための既存の手法は、厳密に制約された設定で動作する。
単眼深度推定の進歩に触発されて,画像条件の深度マップ生成として深度補完を再構成した。
Marigold-DCは、単分子深度推定のための事前訓練された潜伏拡散モデルを構築し、試験時間ガイダンスとして深度観測を注入する。
論文 参考訳(メタデータ) (2024-12-18T00:06:41Z) - DepthSplat: Connecting Gaussian Splatting and Depth [90.06180236292866]
ガウススプラッティングと深さ推定を結合するDepthSplatを提案する。
ガウススプラッティングは、強力な深度モデルを学ぶための教師なし事前学習の目的として機能することを示す。
我々のDepthSplatは、ScanNet、RealEstate10K、DL3DVデータセットの最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-17T17:59:58Z) - UMono: Physical Model Informed Hybrid CNN-Transformer Framework for Underwater Monocular Depth Estimation [5.596432047035205]
水中の単分子深度推定は、水中のシーンの3次元再構成などの作業の基礎となる。
既存の手法では、水中環境の特徴を考慮できない。
本稿では,UMonoと呼ばれる水中単分子深度推定のためのエンドツーエンド学習フレームワークについて述べる。
論文 参考訳(メタデータ) (2024-07-25T07:52:11Z) - ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation [62.600382533322325]
本研究では,新しい単分子深度推定法であるScaleDepthを提案する。
提案手法は,距離深度をシーンスケールと相対深度に分解し,セマンティック・アウェア・スケール予測モジュールを用いて予測する。
本手法は,室内と屋外の両方のシーンを統一した枠組みで距離推定する。
論文 参考訳(メタデータ) (2024-07-11T05:11:56Z) - WaterMono: Teacher-Guided Anomaly Masking and Enhancement Boosting for Robust Underwater Self-Supervised Monocular Depth Estimation [4.909989222186828]
深度推定と画像強調のための新しいフレームワークであるWaterMonoを提案する。
1)教師が指導する異常マスクを用いて画像内の動的領域を識別し,(2)水中画像形成モデルと組み合わせた深度情報を用いて深度推定タスクに寄与する拡張画像を生成し,(3)回転蒸留手法を用いてモデルの回転ロバスト性を高める。
論文 参考訳(メタデータ) (2024-06-19T08:49:45Z) - Self-Supervised Learning based Depth Estimation from Monocular Images [0.0]
単色深度推定の目標は、入力として2次元単色RGB画像が与えられた深度マップを予測することである。
我々は、トレーニング中に固有のカメラパラメータを実行し、我々のモデルをさらに一般化するために天気増悪を適用することを計画している。
論文 参考訳(メタデータ) (2023-04-14T07:14:08Z) - Monocular Visual-Inertial Depth Estimation [66.71452943981558]
単眼深度推定と視覚慣性計測を統合した視覚慣性深度推定パイプラインを提案する。
提案手法は, 疎度度に対する大域的スケールとシフトアライメントを行い, 続いて学習に基づく高密度アライメントを行う。
本研究では,TartanAir と VOID のデータセットを用いて,密集したスケールアライメントによるRMSE の最大30%の削減を観測した。
論文 参考訳(メタデータ) (2023-03-21T18:47:34Z) - SAFENet: Self-Supervised Monocular Depth Estimation with Semantic-Aware
Feature Extraction [27.750031877854717]
本稿では,セマンティック情報を活用して光度損失の限界を克服するSAFENetを提案する。
私たちのキーとなるアイデアは、意味的知識と幾何学的知識を統合するセマンティック・アウェア・ディープ機能を活用することです。
KITTIデータセットの実験では、我々の手法が最先端の手法と競合するか、さらに優れています。
論文 参考訳(メタデータ) (2020-10-06T17:22:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。