論文の概要: On the Overconfidence Problem in Semantic 3D Mapping
- arxiv url: http://arxiv.org/abs/2311.10018v1
- Date: Thu, 16 Nov 2023 17:02:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 13:27:26.952264
- Title: On the Overconfidence Problem in Semantic 3D Mapping
- Title(参考訳): セマンティック3次元マッピングにおける過信問題について
- Authors: Joao Marcos Correia Marques, Albert Zhai, Shenlong Wang and Kris
Hauser
- Abstract要約: 本稿では, 従来のマッピング手法がマップ全体の信頼性を高い信頼度に割り当てる融合過信問題に注目し, 誤判定された出力を導出する。
核融合パイプラインの異なる段階における不確実性校正を改善するためのいくつかの手法をScanNetデータセットで提示し比較した。
我々は,最も広く利用されているベイズ核融合戦略が最悪のキャリブレーションであることを示すとともに,リアルタイム能力を維持しながら高精度かつ3次元マップキャリブレーションを同時に達成する,核融合とキャリブレーションを組み合わせた学習パイプラインであるGLFSを提案する。
- 参考スコア(独自算出の注目度): 34.24365616892011
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic 3D mapping, the process of fusing depth and image segmentation
information between multiple views to build 3D maps annotated with object
classes in real-time, is a recent topic of interest. This paper highlights the
fusion overconfidence problem, in which conventional mapping methods assign
high confidence to the entire map even when they are incorrect, leading to
miscalibrated outputs. Several methods to improve uncertainty calibration at
different stages in the fusion pipeline are presented and compared on the
ScanNet dataset. We show that the most widely used Bayesian fusion strategy is
among the worst calibrated, and propose a learned pipeline that combines fusion
and calibration, GLFS, which achieves simultaneously higher accuracy and 3D map
calibration while retaining real-time capability. We further illustrate the
importance of map calibration on a downstream task by showing that
incorporating proper semantic fusion on a modular ObjectNav agent improves its
success rates. Our code will be provided on Github for reproducibility upon
acceptance.
- Abstract(参考訳): 複数のビュー間で深度と画像のセグメンテーション情報を融合してオブジェクトクラスをリアルタイムで注釈付けした3Dマップを構築するセマンティック3Dマッピングは、最近の話題である。
本稿では, 従来のマッピング手法が地図全体の信頼性を高い信頼度に割り当てる融合過信問題に注目し, 誤判定された出力を導出する。
核融合パイプラインの異なる段階における不確実性校正を改善するいくつかの方法を提示し、scannetデータセットと比較した。
我々は,最も広く利用されているベイズ核融合戦略が最悪のキャリブレーションであることを示すとともに,リアルタイム能力を維持しながら高い精度と3次元マップキャリブレーションを同時に達成する,融合とキャリブレーションを組み合わせた学習パイプラインであるGLFSを提案する。
さらに、モジュール化されたObjectNavエージェントに適切な意味融合を組み込むことで、下流タスクにおけるマップキャリブレーションの重要性が向上することを示す。
私たちのコードは、受け入れ時に再現性のためにgithubで提供されます。
関連論文リスト
- TranSplat: Generalizable 3D Gaussian Splatting from Sparse Multi-View Images with Transformers [14.708092244093665]
我々は,正確な局所特徴マッチングを導くために,予測深度信頼マップを利用する戦略を開発する。
本稿では,RealEstate10KベンチマークとACIDベンチマークの両方で最高の性能を示すTranSplatという新しいG-3DGS手法を提案する。
論文 参考訳(メタデータ) (2024-08-25T08:37:57Z) - Splat-SLAM: Globally Optimized RGB-only SLAM with 3D Gaussians [87.48403838439391]
3D Splattingは、RGBのみの高密度SLAMの幾何学と外観の強力な表現として登場した。
本稿では,高密度な3次元ガウス写像表現を持つRGBのみのSLAMシステムを提案する。
Replica、TUM-RGBD、ScanNetのデータセットに対する実験は、グローバルに最適化された3Dガウスの有効性を示している。
論文 参考訳(メタデータ) (2024-05-26T12:26:54Z) - Volumetric Semantically Consistent 3D Panoptic Mapping [77.13446499924977]
非構造環境における自律エージェントに適したセマンティック3Dマップを生成することを目的としたオンライン2次元から3次元のセマンティック・インスタンスマッピングアルゴリズムを提案する。
マッピング中にセマンティック予測の信頼性を統合し、セマンティックおよびインスタンス一貫性のある3D領域を生成する新しい方法を導入する。
提案手法は,パブリックな大規模データセット上での最先端の精度を実現し,多くの広く使用されているメトリクスを改善した。
論文 参考訳(メタデータ) (2023-09-26T08:03:10Z) - Unsupervised Landmark Discovery Using Consistency Guided Bottleneck [63.624186864522315]
画像再構成に基づくパイプラインに一貫性のあるボトルネックを導入する。
本稿では,画像間のランドマーク対応を形成することによって,擬似スーパービジョンを得る手法を提案する。
この一貫性は、アダプティブ・ヒートマップの生成において発見されたランドマークの不確かさを変調する。
論文 参考訳(メタデータ) (2023-09-19T10:57:53Z) - V-FUSE: Volumetric Depth Map Fusion with Long-Range Constraints [6.7197802356130465]
本稿では,Multi-View Stereo(MVS)アルゴリズムによって生成された深度マップと信頼マップのセットを入力として受け入れ,改良する学習ベースの深度マップ融合フレームワークを提案する。
また、各線に沿った深度仮説探索空間を減らすために、より大きな融合サブネットワークと共に訓練された深度探索ウィンドウ推定サブネットワークを導入する。
本手法は,データから直接,深度コンセンサスと可視性制約の違反をモデル化することを学ぶ。
論文 参考訳(メタデータ) (2023-08-17T00:39:56Z) - Multi-Sem Fusion: Multimodal Semantic Fusion for 3D Object Detection [11.575945934519442]
LiDARとカメラ融合技術は、自律運転において3次元物体検出を実現することを約束している。
多くのマルチモーダルな3Dオブジェクト検出フレームワークは、2D画像からのセマンティック知識を3D LiDARポイントクラウドに統合する。
本稿では2次元画像と3次元ポイントシーン解析結果の両方から意味情報を融合する汎用多モード融合フレームワークであるMulti-Sem Fusion(MSF)を提案する。
論文 参考訳(メタデータ) (2022-12-10T10:54:41Z) - FD-SLAM: 3-D Reconstruction Using Features and Dense Matching [18.577229381683434]
本稿では,高密度フレーム・モデル・オードメトリーを用いたRGB-D SLAMシステムを提案する。
マップ構築をさらに安定化させる3次元特徴に基づく学習ベースのループクロージャコンポーネントを組み込んだ。
このアプローチは、他のシステムがしばしば失敗する大きなシーンにも拡張できる。
論文 参考訳(メタデータ) (2022-03-25T18:58:46Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Similarity-Aware Fusion Network for 3D Semantic Segmentation [87.51314162700315]
本研究では,3次元セマンティックセグメンテーションのための2次元画像と3次元点雲を適応的に融合する類似性認識融合ネットワーク(SAFNet)を提案する。
我々は、入力とバックプロジェクションされた(2Dピクセルから)点雲の間の幾何学的および文脈的類似性を初めて学習する、後期融合戦略を採用している。
SAFNetは、様々なデータ完全性にまたがって、既存の最先端の核融合ベースのアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2021-07-04T09:28:18Z) - RoutedFusion: Learning Real-time Depth Map Fusion [73.0378509030908]
深度マップ融合のための新しいリアルタイム能動機械学習手法を提案する。
本稿では,通常の核融合エラーを考慮に入れた非線形更新を予測できるニューラルネットワークを提案する。
本ネットワークは2次元深度ルーティングネットワークと3次元深度融合ネットワークから構成されており,センサ固有のノイズや外れ値の処理を効率的に行う。
論文 参考訳(メタデータ) (2020-01-13T16:46:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。