論文の概要: MonoTher-Depth: Enhancing Thermal Depth Estimation via Confidence-Aware Distillation
- arxiv url: http://arxiv.org/abs/2504.16127v1
- Date: Mon, 21 Apr 2025 05:13:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:52.849805
- Title: MonoTher-Depth: Enhancing Thermal Depth Estimation via Confidence-Aware Distillation
- Title(参考訳): MonoTher-Depth:信頼度認識蒸留による熱深度推定の強化
- Authors: Xingxing Zuo, Nikhil Ranganathan, Connor Lee, Georgia Gkioxari, Soon-Jo Chung,
- Abstract要約: 本稿では,多用途RGB MDEモデルからの知識蒸留による熱的MDE向上のためのパイプラインを提案する。
提案手法は,RGB MDEの予測された信頼性を利用して熱MDEモデルを選択的に強化する信頼性を考慮した蒸留法である。
ラベル付き深度を含まない新シナリオ実験において, 提案手法により, 加熱MDEの絶対相対誤差を, 蒸留を含まないベースラインと比較して22.88%低減する。
- 参考スコア(独自算出の注目度): 15.946646351787118
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Monocular depth estimation (MDE) from thermal images is a crucial technology for robotic systems operating in challenging conditions such as fog, smoke, and low light. The limited availability of labeled thermal data constrains the generalization capabilities of thermal MDE models compared to foundational RGB MDE models, which benefit from datasets of millions of images across diverse scenarios. To address this challenge, we introduce a novel pipeline that enhances thermal MDE through knowledge distillation from a versatile RGB MDE model. Our approach features a confidence-aware distillation method that utilizes the predicted confidence of the RGB MDE to selectively strengthen the thermal MDE model, capitalizing on the strengths of the RGB model while mitigating its weaknesses. Our method significantly improves the accuracy of the thermal MDE, independent of the availability of labeled depth supervision, and greatly expands its applicability to new scenarios. In our experiments on new scenarios without labeled depth, the proposed confidence-aware distillation method reduces the absolute relative error of thermal MDE by 22.88\% compared to the baseline without distillation.
- Abstract(参考訳): 熱画像からの単眼深度推定(MDE)は、霧、煙、低光といった困難な条件下で動くロボットシステムにとって重要な技術である。
ラベル付き熱データの限られた可用性は、基礎的なRGB MDEモデルと比較して熱MDEモデルの一般化能力を制限している。
この課題に対処するために,多機能なRGB MDEモデルからの知識蒸留による熱的MDE向上のためのパイプラインを提案する。
提案手法は,RGBモデルの弱さを軽減しつつ,RGBモデルの強みを生かして,RGB MDEモデルの予測された信頼性を利用して熱MDEモデルを選択的に強化する信頼性を考慮した蒸留法である。
本手法は,ラベル付き深度監視の可用性によらず,サーマルMDEの精度を大幅に向上させ,新たなシナリオへの適用性を大きく向上させる。
ラベル付き深度を含まない新シナリオ実験において, 提案手法により, 加熱MDEの絶対相対誤差を, 蒸留を含まないベースラインと比較して22.88倍に低減する。
関連論文リスト
- Thermoxels: a voxel-based method to generate simulation-ready 3D thermal models [5.66229031510643]
Thermoxelsは、スパース画像からFAA互換モデルを生成できる新しいボクセルベースの手法である。
本稿では,3次元シーンのRGB+サーマルメッシュを生成するサーモクセルの能力について述べる。
論文 参考訳(メタデータ) (2025-04-06T11:37:16Z) - RTFusion: A depth estimation network based on multimodal fusion in challenging scenarios [0.0]
本稿では,深度推定精度とロバスト性を向上させるマルチモーダル深度推定モデルRTFusionを提案する。
このモデルは、相互補完的アライメント(MCA)モジュールからなる独自の融合機構であるEGFusionを組み込んでいる。
MS2およびViViD++データセットの実験では、提案モデルが高品質な深度マップを一貫して生成していることが示されている。
論文 参考訳(メタデータ) (2025-03-05T01:35:14Z) - BetterDepth: Plug-and-Play Diffusion Refiner for Zero-Shot Monocular Depth Estimation [25.047835960649167]
BetterDepthは、事前訓練されたMDEモデルからの予測を深度条件として取り込む条件拡散ベースの精錬機である。
BetterDepthは、さまざまな公開データセットと、その中のシーンで、最先端のゼロショットMDEパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-07-25T11:16:37Z) - Efficient Terrain Stochastic Differential Efficient Terrain Stochastic Differential Equations for Multipurpose Digital Elevation Model Restoration [0.5735035463793009]
効率的な測地微分方程式(ET-SDE)は、SDE進行によるDEM劣化をモデル化し、シミュレーションされた反転過程を通じて復元する。
実験により, ET-SDEは高精細度, 空隙充填, 遮音, およびそれらの組み合わせにおいて, 最先端の作業と比較して高い競争力を発揮することが示された。
論文 参考訳(メタデータ) (2024-07-02T03:13:34Z) - EM Distillation for One-step Diffusion Models [65.57766773137068]
最小品質の損失を最小限に抑えた1ステップ生成モデルに拡散モデルを蒸留する最大可能性に基づく手法を提案する。
本研究では, 蒸留プロセスの安定化を図るため, 再パラメータ化サンプリング手法とノイズキャンセリング手法を開発した。
論文 参考訳(メタデータ) (2024-05-27T05:55:22Z) - Distilling Diffusion Models into Conditional GANs [90.76040478677609]
複雑な多段階拡散モデルを1段階条件付きGAN学生モデルに蒸留する。
E-LatentLPIPSは,拡散モデルの潜在空間で直接動作する知覚的損失である。
我々は, 最先端の1ステップ拡散蒸留モデルよりも優れた1ステップ発生器を実証した。
論文 参考訳(メタデータ) (2024-05-09T17:59:40Z) - ThermoHands: A Benchmark for 3D Hand Pose Estimation from Egocentric Thermal Images [12.887546538760436]
熱画像に基づくエゴセントリックな3Dハンドポーズ推定に焦点をあてた最初のベンチマークであるThermoHandsを紹介する。
熱画像におけるエゴセントリックな3Dハンドポーズ推定に2つのトランスフォーマーモジュールを利用する新しいベースライン手法であるTherFormerを導入する。
論文 参考訳(メタデータ) (2024-03-14T21:01:06Z) - Differentially Private Gradient Flow based on the Sliced Wasserstein Distance [59.1056830438845]
本稿では,確率測度空間の勾配流に基づく新しい微分プライベートな生成モデリング手法を提案する。
実験により,提案モデルが低プライバシー予算で高忠実度データを生成可能であることが示された。
論文 参考訳(メタデータ) (2023-12-13T15:47:30Z) - Measuring and Modeling Uncertainty Degree for Monocular Depth Estimation [50.920911532133154]
単分子深度推定モデル(MDE)の本質的な不適切さと順序感性は、不確かさの程度を推定する上で大きな課題となる。
本稿では,MDEモデルの不確かさを固有確率分布の観点からモデル化する。
新たなトレーニング正規化用語を導入することで、驚くほど単純な構成で、余分なモジュールや複数の推論を必要とせずに、最先端の信頼性で不確実性を推定できる。
論文 参考訳(メタデータ) (2023-07-19T12:11:15Z) - Does Thermal Really Always Matter for RGB-T Salient Object Detection? [153.17156598262656]
本稿では,RGB-T有意物体検出(SOD)タスクを解決するために,TNetというネットワークを提案する。
本稿では,画像のグローバル照度を推定するためのグローバル照度推定モジュールを提案する。
一方, 2段階の局所化と相補化モジュールを導入し, 熱的特徴の物体位置化キューと内部整合キューをRGBモダリティに転送する。
論文 参考訳(メタデータ) (2022-10-09T13:50:12Z) - Maximizing Self-supervision from Thermal Image for Effective
Self-supervised Learning of Depth and Ego-motion [78.19156040783061]
熱画像からの深度とエゴモーションの自己教師付き学習は、困難なシナリオ下で強い堅牢性と信頼性を示す。
弱いコントラスト、ぼやけたエッジ、ノイズなどの固有の熱画像特性は、熱画像から効果的な自己スーパービジョンを生成するために障害となる。
本研究では,時間的一貫性を維持しつつ,全体構造,コントラスト,詳細などの画像情報を大幅に向上させる有効熱画像マッピング手法を提案する。
論文 参考訳(メタデータ) (2022-01-12T09:49:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。