論文の概要: EvidMTL: Evidential Multi-Task Learning for Uncertainty-Aware Semantic Surface Mapping from Monocular RGB Images
- arxiv url: http://arxiv.org/abs/2503.04441v1
- Date: Thu, 06 Mar 2025 13:56:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 15:58:31.433545
- Title: EvidMTL: Evidential Multi-Task Learning for Uncertainty-Aware Semantic Surface Mapping from Monocular RGB Images
- Title(参考訳): EvidMTL:単眼RGB画像からの不確かさを意識した意味的表面マッピングのためのエビデンシャルマルチタスク学習
- Authors: Rohit Menon, Nils Dengler, Sicong Pan, Gokul Krishna Chenchani, Maren Bennewitz,
- Abstract要約: EvidMTLは、深度推定とセマンティックセグメンテーションのために明らかなヘッドを使用するマルチタスク学習フレームワークである。
EvidKimeraは不確実性を認識したセマンティックサーフェスマッピングフレームワークで、3次元メートル法とセマンティックの整合性を改善するために明らかな深さとセマンティックス予測を使用する。
ScanNetV2のゼロショットマッピングテストでは、EvidKimeraはセマンティックサーフェスマッピングの精度と一貫性でKimeraを上回っている。
- 参考スコア(独自算出の注目度): 8.222817204505699
- License:
- Abstract: For scene understanding in unstructured environments, an accurate and uncertainty-aware metric-semantic mapping is required to enable informed action selection by autonomous systems.Existing mapping methods often suffer from overconfident semantic predictions, and sparse and noisy depth sensing, leading to inconsistent map representations. In this paper, we therefore introduce EvidMTL, a multi-task learning framework that uses evidential heads for depth estimation and semantic segmentation, enabling uncertainty-aware inference from monocular RGB images. To enable uncertainty-calibrated evidential multi-task learning, we propose a novel evidential depth loss function that jointly optimizes the belief strength of the depth prediction in conjunction with evidential segmentation loss. Building on this, we present EvidKimera, an uncertainty-aware semantic surface mapping framework, which uses evidential depth and semantics prediction for improved 3D metric-semantic consistency. We train and evaluate EvidMTL on the NYUDepthV2 and assess its zero-shot performance on ScanNetV2, demonstrating superior uncertainty estimation compared to conventional approaches while maintaining comparable depth estimation and semantic segmentation. In zero-shot mapping tests on ScanNetV2, EvidKimera outperforms Kimera in semantic surface mapping accuracy and consistency, highlighting the benefits of uncertainty-aware mapping and underscoring its potential for real-world robotic applications.
- Abstract(参考訳): 非構造環境におけるシーン理解のためには、自律システムによる情報的行動選択を可能にするために、正確かつ不確実性を考慮したメートル法-セマンティックマッピングが必要である。
そこで本稿では, 深度推定とセマンティックセグメンテーションに明らかな頭部を用いたマルチタスク学習フレームワークであるEvidMTLを導入し, 単眼RGB画像からの不確実性を考慮した推論を可能にする。
本研究では,不確実性の校正された顕在的多タスク学習を実現するために,顕在的セグメンテーション損失と合わせて深度予測の信念強度を協調的に最適化する新しい顕在的深度損失関数を提案する。
そこで我々は,不確実性を考慮したセマンティックサーフェスマッピングフレームワークであるEvidKimeraを提案する。
我々は、NYUDepthV2上でEvidMTLを訓練し、ScanNetV2上でのゼロショット性能を評価し、同等の深さ推定とセマンティックセグメンテーションを維持しながら、従来の手法よりも優れた不確実性推定を示す。
ScanNetV2のゼロショットマッピングテストでは、EvidKimeraは、セマンティックサーフェスマッピングの正確性と一貫性において、Kimeraよりも優れており、不確実性を認識したマッピングの利点を強調し、現実世界のロボットアプリケーションに対するその可能性を強調している。
関連論文リスト
- Post-hoc Probabilistic Vision-Language Models [51.12284891724463]
視覚言語モデル(VLM)は、分類、検索、生成タスクにおいて顕著な成功を収めている。
追加トレーニングを必要としないVLMにおけるポストホック不確実性評価を提案する。
この結果から,大規模モデルの安全性クリティカルな応用が期待できることがわかった。
論文 参考訳(メタデータ) (2024-12-08T18:16:13Z) - Uncertainty-aware Semantic Mapping in Off-road Environments with Dempster-Shafer Theory of Evidence [4.83420384410068]
本稿では,DST(Dempster-Shafer Theory of Evidence)の明確な推論をマッピングパイプライン全体に組み込む,明確な意味マッピングフレームワークを提案する。
この枠組みは不確実性マップの信頼性を高め、知覚的不確実性の高いシーンにおいて既存の手法を一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2024-05-10T06:32:01Z) - Evidential Semantic Mapping in Off-road Environments with Uncertainty-aware Bayesian Kernel Inference [5.120567378386614]
本稿では,オフロード環境における信頼性を高めることを目的とした,明白なセマンティックマッピングフレームワークを提案する。
セマンティックな不確かさを適応的に処理することにより、提案フレームワークは、これまで見えなかった環境においても、周囲の堅牢な表現を構築する。
論文 参考訳(メタデータ) (2024-03-21T05:13:34Z) - Introspective Deep Metric Learning [91.47907685364036]
本稿では,不確実性を考慮した画像比較のためのイントロスペクティブな深度学習フレームワークを提案する。
提案するIDMLフレームワークは,不確実性モデリングによるディープメトリック学習の性能を向上させる。
論文 参考訳(メタデータ) (2023-09-11T16:21:13Z) - Convolutional Bayesian Kernel Inference for 3D Semantic Mapping [1.7615233156139762]
本稿では,ベイズ的推論を明示的に行うことを学ぶ畳み込みベイズ的カーネル推論層を紹介する。
We learn semantic-geometric probability distributions for LiDAR sensor information and incorporated semantic predictions into a global map。
我々は、KITTIデータセット上での最先端セマンティックマッピングアルゴリズムに対するネットワークの評価を行い、同等のセマンティックラベル推論結果によるレイテンシの向上を実証した。
論文 参考訳(メタデータ) (2022-09-21T21:15:12Z) - Robust Depth Completion with Uncertainty-Driven Loss Functions [60.9237639890582]
本研究では,不確実性による損失関数を導入し,深度補修の堅牢性を改善し,深度補修の不確実性に対処する。
提案手法は,KITTI深度評価ベンチマークでテストされ,MAE, IMAE, IRMSEの計測値を用いて最先端のロバスト性性能を達成した。
論文 参考訳(メタデータ) (2021-12-15T05:22:34Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - Learning Uncertainty For Safety-Oriented Semantic Segmentation In
Autonomous Driving [77.39239190539871]
自律運転における安全クリティカル画像セグメンテーションを実現するために、不確実性推定をどのように活用できるかを示す。
相似性関数によって測定された不一致予測に基づく新しい不確実性尺度を導入する。
本研究では,提案手法が競合手法よりも推論時間において計算集約性が低いことを示す。
論文 参考訳(メタデータ) (2021-05-28T09:23:05Z) - SAFENet: Self-Supervised Monocular Depth Estimation with Semantic-Aware
Feature Extraction [27.750031877854717]
本稿では,セマンティック情報を活用して光度損失の限界を克服するSAFENetを提案する。
私たちのキーとなるアイデアは、意味的知識と幾何学的知識を統合するセマンティック・アウェア・ディープ機能を活用することです。
KITTIデータセットの実験では、我々の手法が最先端の手法と競合するか、さらに優れています。
論文 参考訳(メタデータ) (2020-10-06T17:22:25Z) - Adaptive confidence thresholding for monocular depth estimation [83.06265443599521]
本稿では,自己教師付ステレオマッチング法から生成されたステレオ画像の擬似地上真実深度マップを利用する新しい手法を提案する。
擬似地底深度マップの信頼度マップを推定し、不正確な擬似地底深度マップによる性能劣化を緩和する。
実験結果から, 最先端の単分子深度推定法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-09-27T13:26:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。