論文の概要: DEPTHOR++: Robust Depth Enhancement from a Real-World Lightweight dToF and RGB Guidance
- arxiv url: http://arxiv.org/abs/2509.26498v1
- Date: Tue, 30 Sep 2025 16:41:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:45:00.210463
- Title: DEPTHOR++: Robust Depth Enhancement from a Real-World Lightweight dToF and RGB Guidance
- Title(参考訳): DEPTHOR++: 実世界の軽量dToFとRGBガイダンスによるロバスト深さ向上
- Authors: Jijun Xiang, Longliang Liu, Xuan Zhu, Xianqi Wang, Min Lin, Xin Yang,
- Abstract要約: DEPTHOR++は実用的で斬新な深度補完フレームワークである。
3つの重要な側面からのdToF入力に頑健さを増す。
ZJU-L5データセットと実世界のサンプルに基づいて、トレーニング戦略は既存の深度補完モデルを大幅に強化する。
- 参考スコア(独自算出の注目度): 14.818201604060144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depth enhancement, which converts raw dToF signals into dense depth maps using RGB guidance, is crucial for improving depth perception in high-precision tasks such as 3D reconstruction and SLAM. However, existing methods often assume ideal dToF inputs and perfect dToF-RGB alignment, overlooking calibration errors and anomalies, thus limiting real-world applicability. This work systematically analyzes the noise characteristics of real-world lightweight dToF sensors and proposes a practical and novel depth completion framework, DEPTHOR++, which enhances robustness to noisy dToF inputs from three key aspects. First, we introduce a simulation method based on synthetic datasets to generate realistic training samples for robust model training. Second, we propose a learnable-parameter-free anomaly detection mechanism to identify and remove erroneous dToF measurements, preventing misleading propagation during completion. Third, we design a depth completion network tailored to noisy dToF inputs, which integrates RGB images and pre-trained monocular depth estimation priors to improve depth recovery in challenging regions. On the ZJU-L5 dataset and real-world samples, our training strategy significantly boosts existing depth completion models, with our model achieving state-of-the-art performance, improving RMSE and Rel by 22% and 11% on average. On the Mirror3D-NYU dataset, by incorporating the anomaly detection method, our model improves upon the previous SOTA by 37% in mirror regions. On the Hammer dataset, using simulated low-cost dToF data from RealSense L515, our method surpasses the L515 measurements with an average gain of 22%, demonstrating its potential to enable low-cost sensors to outperform higher-end devices. Qualitative results across diverse real-world datasets further validate the effectiveness and generalizability of our approach.
- Abstract(参考訳): RGB誘導を用いて生のdToF信号を深度マップに変換する深度向上は、3次元再構成やSLAMなどの高精度タスクにおける深度知覚を向上させるために重要である。
しかし、既存の手法はしばしば理想的なdToF入力と完全なdToF-RGBアライメントを仮定し、キャリブレーションエラーや異常を見落とし、現実の応用性を制限する。
本研究は,実世界の軽量dToFセンサの雑音特性を体系的に解析し,三つの重要な側面からのdToF入力に対するロバスト性を高める,実用的で斬新な深度補完フレームワークDEPTHOR++を提案する。
まず,頑健なモデルトレーニングのための現実的なトレーニングサンプルを生成するために,合成データセットに基づくシミュレーション手法を提案する。
第2に,不正確なdToF測定を識別・除去する学習可能なパラメータフリーな異常検出機構を提案する。
第三に,RGB画像と事前学習した単眼深度推定を組み込んだノイズの多いdToF入力に適したディープコンプリートネットワークを設計し,課題領域のディープリカバリを改善する。
ZJU-L5データセットと実世界のサンプルに基づいて、我々のトレーニング戦略は既存の深度補完モデルを大幅に向上させ、我々のモデルは最先端のパフォーマンスを達成し、RMSEとRelを平均22%と11%改善する。
ミラー3D-NYUデータセットでは、異常検出手法を組み込むことで、ミラー領域のSOTAを37%改善する。
Hammerのデータセットでは、RealSense L515の低コストdToFデータをシミュレーションし、L515の測定を平均22%のアップで上回り、低コストセンサーがハイエンドデバイスを上回る性能を発揮する可能性を実証した。
様々な実世界のデータセットに対する定性的な結果は、我々のアプローチの有効性と一般化性をさらに検証する。
関連論文リスト
- Pseudo Depth Meets Gaussian: A Feed-forward RGB SLAM Baseline [64.42938561167402]
本稿では,3次元ガウス型SLAMとフィードフォワードリカレント予測モジュールを組み合わせたオンライン3次元再構成手法を提案する。
このアプローチは、遅いテスト時間の最適化を高速なネットワーク推論に置き換え、トラッキング速度を大幅に改善する。
提案手法は,最先端のSplaTAMと同等の性能を示しながら,追跡時間を90%以上削減する。
論文 参考訳(メタデータ) (2025-08-06T16:16:58Z) - DEPTHOR: Depth Enhancement from a Practical Light-Weight dToF Sensor and RGB Image [8.588871458005114]
本稿では,コンピュータビジョンにおける深度向上のための新しい補完方式DEPTHORを提案する。
まず、合成データセットの正確な基底真理から実世界のdToFデータをシミュレートし、ノイズロバストトレーニングを可能にする。
第2に,グローバルな深度関係と文脈情報を利用して,単眼深度推定(MDE)を組み込んだ新しいネットワークを設計し,課題領域の予測を改善する。
論文 参考訳(メタデータ) (2025-04-02T11:02:21Z) - Uncertainty-guided Optimal Transport in Depth Supervised Sparse-View 3D Gaussian [49.21866794516328]
3次元ガウシアンスプラッティングは、リアルタイムな新規ビュー合成において顕著な性能を示した。
これまでのアプローチでは、3Dガウスの訓練に奥行き監視を取り入れ、オーバーフィッティングを軽減してきた。
本研究では,3次元ガウスの深度分布を可視化する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-30T03:18:30Z) - Robust Depth Enhancement via Polarization Prompt Fusion Tuning [112.88371907047396]
様々な深度センサによる不正確な深度測定を改善するために偏光イメージングを利用するフレームワークを提案する。
まず、偏光データとセンサ深度マップから高密度で完全な深度マップを推定するために、ニューラルネットワークを訓練した学習ベースの戦略を採用する。
大規模データセット上で事前学習したRGBモデルを有効に活用するためのPPFT(Polarization Prompt Fusion Tuning)戦略を提案する。
論文 参考訳(メタデータ) (2024-04-05T17:55:33Z) - Confidence-Aware RGB-D Face Recognition via Virtual Depth Synthesis [48.59382455101753]
2D顔認証は、照明、閉塞、ポーズの変化により、制約のない環境において課題に遭遇する。
近年の研究では、深度情報を組み込んだRGB-D顔認証に焦点が当てられている。
本研究では,まず,深度モデル事前学習のための3次元Morphable Modelsによって生成された多様な深度データセットを構築する。
そこで本研究では,手軽に利用できるRGBと深度モデルを利用したドメイン非依存の事前学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:12:24Z) - Cheating Depth: Enhancing 3D Surface Anomaly Detection via Depth
Simulation [12.843938169660404]
RGBによる表面異常検出法は大幅に進歩している。
特定の表面異常は、RGBだけでは事実上見えず、3D情報の取り込みが必要である。
産業深度データセット上のRGBバックボーンの再トレーニングは、十分な大規模なデータセットの可用性の制限によって妨げられる。
本稿では,既存のMVTec3D異常検出ベンチマークよりも優れた3DSRによる表面異常検出手法を提案する。
論文 参考訳(メタデータ) (2023-11-02T09:44:21Z) - Joint Learning of Salient Object Detection, Depth Estimation and Contour
Extraction [91.43066633305662]
RGB-D Salient Object Detection (SOD) のための新しいマルチタスク・マルチモーダルフィルタトランス (MMFT) ネットワークを提案する。
具体的には、深度推定、健全な物体検出、輪郭推定の3つの相補的なタスクを統合する。マルチタスク機構は、タスク認識の特徴を補助タスクから学習するためのモデルを促進する。
実験の結果、複数のデータセット上での深度に基づくRGB-D SOD法をはるかに上回るだけでなく、高品質の深度マップと塩分濃度を同時に正確に予測できることがわかった。
論文 参考訳(メタデータ) (2022-03-09T17:20:18Z) - Towards 3D Scene Reconstruction from Locally Scale-Aligned Monocular
Video Depth [90.33296913575818]
映像深度推定や映像からの3次元シーン再構成のようなビデオベースのシナリオでは、フレームごとの予測における未知のスケールとシフトが深度の不整合を引き起こす可能性がある。
局所重み付き線形回帰法を提案する。
提案手法は,複数のゼロショットベンチマークにおいて,既存の最先端手法の性能を50%向上させることができる。
論文 参考訳(メタデータ) (2022-02-03T08:52:54Z) - Sparse Depth Completion with Semantic Mesh Deformation Optimization [4.03103540543081]
本稿では、RGB画像とスパース深度サンプルを入力とし、完全な深度マップを予測し、最適化後のニューラルネットワークを提案する。
評価結果は,屋内および屋外両方のデータセットにおいて,既存の成果を一貫して上回る結果となった。
論文 参考訳(メタデータ) (2021-12-10T13:01:06Z) - Project to Adapt: Domain Adaptation for Depth Completion from Noisy and
Sparse Sensor Data [26.050220048154596]
実領域や追加センサにアノテーションを付加することなく,合成データから学習した疎深度補完のためのドメイン適応手法を提案する。
提案手法は,RGB+LiDARセットアップにおける実センサノイズをシミュレートし,合成ドメイン内の実LiDAR入力を投影によりシミュレーションし,実雑音LiDARをフィルタリングし,CycleGANアプローチを用いて合成RGB画像に適応する3つのモジュールからなる。
論文 参考訳(メタデータ) (2020-08-03T17:21:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。