Fugu-MT 論文翻訳(概要): Adaptive Discrete Disparity Volume for Self-supervised Monocular Depth Estimation

論文の概要: Adaptive Discrete Disparity Volume for Self-supervised Monocular Depth Estimation

arxiv url: http://arxiv.org/abs/2404.03190v2
Date: Thu, 28 Nov 2024 00:30:21 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-02 20:28:07.148881
Title: Adaptive Discrete Disparity Volume for Self-supervised Monocular Depth Estimation
Title（参考訳）: 自己教師型単眼深度推定のための適応離散分散量
Authors: Jianwei Ren,
Abstract要約: 本稿では,学習可能なモジュールAdaptive Discrete Disparity Volume (ADDV)を提案する。 ADDVは異なるRGB画像の深さ分布を動的に感知し、適応的なビンを生成することができる。また、自己監督型条件下での正規化を実現するために、新しいトレーニング戦略(統一化と強化)も導入する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In self-supervised monocular depth estimation tasks, discrete disparity prediction has been proven to attain higher quality depth maps than common continuous methods. However, current discretization strategies often divide depth ranges of scenes into bins in a handcrafted and rigid manner, limiting model performance. In this paper, we propose a learnable module, Adaptive Discrete Disparity Volume (ADDV), which is capable of dynamically sensing depth distributions in different RGB images and generating adaptive bins for them. Without any extra supervision, this module can be integrated into existing CNN architectures, allowing networks to produce representative values for bins and a probability volume over them. Furthermore, we introduce novel training strategies - uniformizing and sharpening - through a loss term and temperature parameter, respectively, to provide regularizations under self-supervised conditions, preventing model degradation or collapse. Empirical results demonstrate that ADDV effectively processes global information, generating appropriate bins for various scenes and producing higher quality depth maps compared to handcrafted methods.
Abstract（参考訳）: 自己教師付き単分子深度推定タスクでは、離散差分予測は一般的な連続法よりも高品質の深度マップが得られることが証明されている。しかしながら、現在の離散化戦略は、しばしばシーンの深さ範囲を手作りで厳密な方法でビンに分割し、モデルの性能を制限している。本稿では,RGB画像の深度分布を動的に検出し,適応的なビンを生成することができる学習可能なモジュールAdaptive Discrete Disparity Volume (ADDV)を提案する。余分な監督がなければ、このモジュールは既存のCNNアーキテクチャに統合することができ、ネットワークはビンの代表的な値とそれらの上の確率ボリュームを生成できる。さらに, 損失項と温度パラメータを用いて, モデル劣化や崩壊を防止し, 自己監督条件下での正規化を実現する新たなトレーニング戦略を導入する。実験の結果,ATDVはグローバルな情報を効果的に処理し,様々なシーンに適切なビンを生成し,手作りの手法に比べて高品質な深度マップを生成することがわかった。

関連論文リスト

Understanding Degradation with Vision Language Model [56.09241449206817]
視覚的劣化を理解することは、コンピュータビジョンにおいて重要な問題であるが、難しい問題である。本稿では,教師付き微調整と強化学習を併用したマルチモーダル・チェーン・オブ・ソート・モデルであるDU-VLMを紹介する。また,110,000個のクリーン劣化ペアと接地された物理アノテーションからなる大規模データセットである textbfDU-110k も導入した。
論文参考訳（メタデータ） (2026-02-04T13:51:15Z)
Enhancing Generalization of Depth Estimation Foundation Model via Weakly-Supervised Adaptation with Regularization [21.788680301776207]
WeSTAR(Weakly supervised Self-Training Adaptation with Regularization)を提案する。まず、構造的自己超越の主源として、密集した自己学習目標を採用する。さらにロバスト性を改善するために,意味論的に認識された階層的正規化を導入する。
論文参考訳（メタデータ） (2025-11-18T08:16:16Z)
Always Clear Depth: Robust Monocular Depth Estimation under Adverse Weather [48.65180004211851]
高品質なトレーニングデータ生成とドメイン適応の観点から,textbfACDepth と呼ばれる頑健な単眼深度推定手法を提案する。具体的には、悪天候条件をシミュレートするサンプルを生成するための1段階拡散モデルを導入し、トレーニング中に多段階劣化データセットを構築した。本稿では,教師モデルと事前学習深度V2からの知識を学生ネットワークに吸収させる多粒度知識蒸留戦略(MKD)について詳述する。
論文参考訳（メタデータ） (2025-05-18T02:30:47Z)
VistaDepth: Frequency Modulation With Bias Reweighting For Enhanced Long-Range Depth Estimation [8.66253032039513]
VistaDepthは適応周波数領域の機能拡張と適応重み付け機構を統合する新しいフレームワークである。 VistaDepth は拡散型 MDE 技術における最先端性能を実現し,特に遠隔地での正確な再構築に優れる。
論文参考訳（メタデータ） (2025-04-21T13:30:51Z)
Multi-Modality Driven LoRA for Adverse Condition Depth Estimation [61.525312117638116]
逆条件深さ推定のためのMulti-Modality Driven LoRA(MMD-LoRA)を提案する。 Prompt Driven Domain Alignment (PDDA) と Visual-Text Consistent Contrastive Learning (VTCCL) の2つのコアコンポーネントで構成されている。 nuScenesとOxford RobotCarデータセットの最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2024-12-28T14:23:58Z)
Amodal Depth Anything: Amodal Depth Estimation in the Wild [39.27552294431748]
アモーダル深度推定は、シーン内の物体の閉塞された(見えない)部分の深さを予測することを目的としている。本研究では,様々な自然画像におけるモデル一般化を改善するために,相対的深度予測に焦点をあてて,野生におけるアモーダル深度推定の新しい定式化を提案する。本稿では,Depth Anything V2に基づく決定論的モデルであるAmodal-DAV2と,条件付きフローマッチングの原理を統合する生成モデルであるAmodal-DepthFMの2つの補完的フレームワークを提案する。
論文参考訳（メタデータ） (2024-12-03T09:56:38Z)
TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6168844664788855]
本研究は,推定時間における相対的推定値から計量深度値を求めるための,実践的なオンラインスケール回復手法であるTanDepthを提案する。本手法は無人航空機(UAV)の用途に応用され,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。推定深度マップから接地点を選択して、投影された基準点と相関するクラスシミュレーションフィルタへの適応を示す。
論文参考訳（メタデータ） (2024-09-08T15:54:43Z)
Unsupervised Monocular Depth Estimation Based on Hierarchical Feature-Guided Diffusion [21.939618694037108]
教師なし単分子深度推定は、地上の真実を示さずに訓練できるため、広く注目を集めている。我々は、教師なし単眼深度推定のために、生成ネットワーク間でよく収束する拡散モデルを用いる。このモデルは深度分布の学習と解釈の能力を大幅に向上させる。
論文参考訳（メタデータ） (2024-06-14T07:31:20Z)
Digging into contrastive learning for robust depth estimation with diffusion models [55.62276027922499]
そこで我々はD4RDと呼ばれる新しい頑健な深度推定法を提案する。複雑な環境での性能劣化を軽減するために、拡散モデルに適した独自のコントラスト学習モードを備えている。実験では、D4RDは合成汚職データセットや現実世界の気象条件に関する最先端のソリューションを超越している。
論文参考訳（メタデータ） (2024-04-15T14:29:47Z)
Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文参考訳（メタデータ） (2023-03-31T16:01:03Z)
SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for Dynamic Scenes [58.89295356901823]
自己監督型単眼深度推定は静的な場面で顕著な結果を示した。トレーニングネットワークのマルチビュー整合性の仮定に依存するが、動的オブジェクト領域に違反する。単一画像の深度を事前に生成するための,外部トレーニング付き単眼深度推定モデルを提案する。我々のモデルは、高度にダイナミックなシーンのモノクロビデオからトレーニングしても、シャープで正確な深度マップを予測できる。
論文参考訳（メタデータ） (2022-11-07T16:17:47Z)
RA-Depth: Resolution Adaptive Self-Supervised Monocular Depth Estimation [27.679479140943503]
本研究では,シーン深さのスケール不変性を学習し,自己教師付き単眼深度推定法(RA-Depth)を提案する。 RA-Depthは最先端の性能を達成し、解像度適応の優れた能力を示す。
論文参考訳（メタデータ） (2022-07-25T08:49:59Z)
BinsFormer: Revisiting Adaptive Bins for Monocular Depth Estimation [46.678016537618845]
本稿では,分類回帰に基づく深度推定に適したBinsFormerという新しいフレームワークを提案する。 1)適応的なビンの適切な生成、2)確率分布とビン予測の間の十分な相互作用である。 KITTI、NYU、SUN RGB-Dデータセットの実験は、BinsFormerが最先端のモノクル深度推定法をはるかに上回っていることを示している。
論文参考訳（メタデータ） (2022-04-03T04:38:02Z)
DepthFormer: Exploiting Long-Range Correlation and Local Information for Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文参考訳（メタデータ） (2022-03-27T05:03:56Z)
An Adaptive Framework for Learning Unsupervised Depth Completion [59.17364202590475]
カラー画像から高密度深度マップとそれに伴うスパース深度測定を推定する手法を提案する。正規化とコビジュアライゼーションは、モデルの適合度とデータによって関連付けられており、単一のフレームワークに統合可能であることを示す。
論文参考訳（メタデータ） (2021-06-06T02:27:55Z)
Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文参考訳（メタデータ） (2020-03-10T03:10:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。