論文の概要: A Comparative Study on Multi-task Uncertainty Quantification in Semantic Segmentation and Monocular Depth Estimation
- arxiv url: http://arxiv.org/abs/2405.17097v2
- Date: Thu, 16 Jan 2025 16:27:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-17 15:08:29.629840
- Title: A Comparative Study on Multi-task Uncertainty Quantification in Semantic Segmentation and Monocular Depth Estimation
- Title(参考訳): セマンティックセグメンテーションにおけるマルチタスク不確実性定量化と単眼深度推定の比較検討
- Authors: Steven Landgraf, Markus Hillemann, Theodor Kapler, Markus Ulrich,
- Abstract要約: 我々はモンテカルロ・ドロップアウト,ディープ・サブ・アンサンブル,ディープ・アンサンブルを共同セグメンテーションと単眼深度推定のために評価した。
ディープアンサンブル(Deep Ensembles)は、特にドメイン外のシナリオにおいて、好まれる選択肢として際立っている。
我々は、画素を確実または不確実と分類するために、異なる不確実性しきい値を採用することの影響を強調した。
- 参考スコア(独自算出の注目度): 9.52671061354338
- License:
- Abstract: Deep neural networks excel in perception tasks such as semantic segmentation and monocular depth estimation, making them indispensable in safety-critical applications like autonomous driving and industrial inspection. However, they often suffer from overconfidence and poor explainability, especially for out-of-domain data. While uncertainty quantification has emerged as a promising solution to these challenges, multi-task settings have yet to be explored. In an effort to shed light on this, we evaluate Monte Carlo Dropout, Deep Sub-Ensembles, and Deep Ensembles for joint semantic segmentation and monocular depth estimation. Thereby, we reveal that Deep Ensembles stand out as the preferred choice, particularly in out-of-domain scenarios, and show the potential benefit of multi-task learning with regard to the uncertainty quality in comparison to solving both tasks separately. Additionally, we highlight the impact of employing different uncertainty thresholds to classify pixels as certain or uncertain, with the median uncertainty emerging as a robust default.
- Abstract(参考訳): ディープニューラルネットワークは、セマンティックセグメンテーションや単眼深度推定などの知覚タスクに優れており、自律運転や産業検査のような安全クリティカルなアプリケーションでは不可欠である。
しかし、特にドメイン外のデータでは、自信過剰と説明可能性の低下に悩まされることが多い。
これらの課題に対する有望な解決策として不確実性定量化が登場したが、マルチタスク設定はまだ検討されていない。
そこで我々はモンテカルロ・ドロップアウト, ディープ・サブ・アンサンブル, ディープ・アンサンブルを評価し, 共同セマンティックセグメンテーションと単分子深度推定を行った。
これにより、ディープ・アンサンブルが特にドメイン外のシナリオにおいて好まれる選択として際立っており、両タスクを個別に解くことと比較して、不確実性の品質に関してマルチタスク学習の潜在的利益を示す。
さらに、画素を確実または不確実と分類するために異なる不確実性しきい値を用いることによる影響を強調し、中央値の不確実性はロバストなデフォルトとして現れる。
関連論文リスト
- A Critical Synthesis of Uncertainty Quantification and Foundation Models in Monocular Depth Estimation [13.062551984263031]
絶対距離の予測を伴う計量深度推定は、特定の課題を提起する。
我々は、現在最先端のDepthAnythingV2基盤モデルを用いて、5つの異なる不確実性定量化手法を融合する。
ガウス陰性対数損失(GNLL)による微調整は特に有望なアプローチである。
論文 参考訳(メタデータ) (2025-01-14T15:13:00Z) - Post-hoc Probabilistic Vision-Language Models [51.12284891724463]
視覚言語モデル(VLM)は、分類、検索、生成タスクにおいて顕著な成功を収めている。
追加トレーニングを必要としないVLMにおけるポストホック不確実性評価を提案する。
この結果から,大規模モデルの安全性クリティカルな応用が期待できることがわかった。
論文 参考訳(メタデータ) (2024-12-08T18:16:13Z) - Efficient Multi-task Uncertainties for Joint Semantic Segmentation and
Monocular Depth Estimation [10.220692937750295]
多くの実世界のアプリケーションは本質的にマルチモーダルであり、そのためマルチタスク学習の恩恵を受ける。
例えば、自律運転では、セマンティックセグメンテーションと単分子深度推定のジョイントソリューションが有用であることが証明されている。
共同セマンティックセグメンテーションと単眼深度推定のための新しい学生-教師蒸留手法であるEMUFormerを紹介する。
論文 参考訳(メタデータ) (2024-02-16T11:09:16Z) - DUDES: Deep Uncertainty Distillation using Ensembles for Semantic
Segmentation [11.099838952805325]
予測の不確実性の定量化は、そのようなアプリケーションにディープニューラルネットワークを使用するための、有望な取り組みである。
本稿では,アンサンブルを用いた深部不確実性蒸留(DuDES)と呼ばれる,効率的かつ確実な不確実性評価手法を提案する。
DUDESはディープ・アンサンブル(Deep Ensemble)による学生-教師の蒸留を適用し、予測の不確かさを1つの前方パスで正確に推定する。
論文 参考訳(メタデータ) (2023-03-17T08:56:27Z) - Uncertainty Estimation by Fisher Information-based Evidential Deep
Learning [61.94125052118442]
不確実性推定は、ディープラーニングを実用アプリケーションで信頼できるものにする鍵となる要素である。
漁業情報に基づくエビデンシャルディープラーニング(mathcalI$-EDL)を提案する。
特に,各サンプルが有する証拠の情報量を測定するためにFisher Information Matrix (FIM)を導入し,目的的損失項を動的に重み付けし,不確実なクラスの表現学習に集中させる。
論文 参考訳(メタデータ) (2023-03-03T16:12:59Z) - Latent Discriminant deterministic Uncertainty [11.257956169255193]
高精度なセマンティックセグメンテーションのためのスケーラブルで効果的な決定論的不確実性手法(DUM)を提案する。
提案手法は,不確実性予測のための最先端技術であるDeep Ensemblesに対して,画像分類,深度セグメンテーション,単分子推定タスクにおいて競合する結果を得る。
論文 参考訳(メタデータ) (2022-07-20T18:18:40Z) - Exploring Robustness of Unsupervised Domain Adaptation in Semantic
Segmentation [74.05906222376608]
クリーンな画像とそれらの逆の例との一致を、出力空間における対照的な損失によって最大化する、逆向きの自己スーパービジョンUDA(ASSUDA)を提案する。
i) セマンティックセグメンテーションにおけるUDA手法のロバスト性は未解明のままであり, (ii) 一般的に自己スーパービジョン(回転やジグソーなど) は分類や認識などのイメージタスクに有効であるが, セグメンテーションタスクの識別的表現を学習する重要な監視信号の提供には失敗している。
論文 参考訳(メタデータ) (2021-05-23T01:50:44Z) - Dive into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty
Estimation for Facial Expression Recognition [59.52434325897716]
DMUE(DMUE)という,アノテーションのあいまいさを2つの視点から解決するソリューションを提案する。
前者に対しては,ラベル空間における潜伏分布をよりよく記述するために,補助的マルチブランチ学習フレームワークを導入する。
後者の場合、インスタンス間の意味的特徴のペアワイズ関係を完全に活用して、インスタンス空間のあいまいさの程度を推定する。
論文 参考訳(メタデータ) (2021-04-01T03:21:57Z) - On the uncertainty of self-supervised monocular depth estimation [52.13311094743952]
単眼深度推定のための自己監督的パラダイムは、基礎的な真理アノテーションを全く必要としないため、非常に魅力的である。
我々は,このタスクの不確かさを推定する方法と,これが深さ精度にどのように影響するかを初めて検討する。
自己教師型アプローチに特化して設計された,斬新な手法を提案する。
論文 参考訳(メタデータ) (2020-05-13T09:00:55Z) - Pitfalls of In-Domain Uncertainty Estimation and Ensembling in Deep
Learning [70.72363097550483]
本研究では,画像分類における領域内不確実性に着目した。
そこで本研究では,ディープアンサンブル等価スコア(DEE)を導入する。
論文 参考訳(メタデータ) (2020-02-15T23:28:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。