論文の概要: False Negative Reduction in Semantic Segmentation under Domain Shift
using Depth Estimation
- arxiv url: http://arxiv.org/abs/2207.03513v1
- Date: Thu, 7 Jul 2022 18:02:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-11 13:41:45.289094
- Title: False Negative Reduction in Semantic Segmentation under Domain Shift
using Depth Estimation
- Title(参考訳): 深さ推定を用いた領域シフトによる意味セグメンテーションの偽陰性化
- Authors: Kira Maag and Matthias Rottmann
- Abstract要約: 最先端のディープニューラルネットワークはセマンティックセグメンテーションにおいて優れた性能を示す。
オープンワールドのシナリオは、自動化運転のような安全関連のアプリケーションでは危険である不正確な予測を引き起こします。
単眼深度推定を用いた意味的セグメンテーション予測を強化し,非検出対象の発生を減らすことでセグメンテーションを改善する。
- 参考スコア(独自算出の注目度): 5.837881923712394
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art deep neural networks demonstrate outstanding performance in
semantic segmentation. However, their performance is tied to the domain
represented by the training data. Open world scenarios cause inaccurate
predictions which is hazardous in safety relevant applications like automated
driving. In this work, we enhance semantic segmentation predictions using
monocular depth estimation to improve segmentation by reducing the occurrence
of non-detected objects in presence of domain shift. To this end, we infer a
depth heatmap via a modified segmentation network which generates
foreground-background masks, operating in parallel to a given semantic
segmentation network. Both segmentation masks are aggregated with a focus on
foreground classes (here road users) to reduce false negatives. To also reduce
the occurrence of false positives, we apply a pruning based on uncertainty
estimates. Our approach is modular in a sense that it post-processes the output
of any semantic segmentation network. In our experiments, we observe less
non-detected objects of most important classes and an enhanced generalization
to other domains compared to the basic semantic segmentation prediction.
- Abstract(参考訳): 最先端のディープニューラルネットワークはセマンティックセグメンテーションにおいて優れた性能を示す。
しかし、それらのパフォーマンスはトレーニングデータで表されるドメインに結びついている。
オープンワールドシナリオは、自動化運転のような安全関連のアプリケーションで危険である不正確な予測を引き起こす。
本研究では,単眼深度推定を用いた意味セグメンテーション予測を拡張し,領域シフトの存在下での非検出物体の発生を減らすことによりセグメンテーションを改善する。
この目的のために,与えられた意味セグメンテーションネットワークと並行して動作し,前景バックグラウンドマスクを生成する修正セグメンテーションネットワークを介して奥行きヒートマップを推定する。
両方のセグメンテーションマスクは、偽陰性を減らすために前景クラス(道路利用者)に焦点を当てて集約される。
また、偽陽性の発生を低減するため、不確実性推定に基づくプルーニングを適用する。
我々のアプローチは、セマンティックセグメンテーションネットワークの出力を後処理するという意味でモジュラーである。
実験では,重要クラスの非検出対象が減少し,基本的なセマンティックセグメンテーション予測と比較して,他の領域への一般化が進んだ。
関連論文リスト
- Pixel-wise Gradient Uncertainty for Convolutional Neural Networks
applied to Out-of-Distribution Segmentation [0.43512163406552007]
本稿では,推定時に効率よく計算できる画素単位の損失勾配から不確実点を求める手法を提案する。
本実験は,提案手法が誤った画素分類を識別し,無視可能な計算オーバーヘッドで予測品質を推定する能力を示す。
論文 参考訳(メタデータ) (2023-03-13T08:37:59Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Domain Adaptive Semantic Segmentation with Self-Supervised Depth
Estimation [84.34227665232281]
セマンティックセグメンテーションのためのドメイン適応は、ソースとターゲットドメイン間の分散シフトの存在下でモデルのパフォーマンスを向上させることを目的とする。
ドメイン間のギャップを埋めるために、両ドメインで利用可能な自己教師付き深さ推定からのガイダンスを活用します。
提案手法のベンチマークタスクSYNTHIA-to-CityscapesとGTA-to-Cityscapesの有効性を実証する。
論文 参考訳(メタデータ) (2021-04-28T07:47:36Z) - Non-Salient Region Object Mining for Weakly Supervised Semantic
Segmentation [64.2719590819468]
弱教師付きセマンティックセグメンテーションのための非塩分領域オブジェクトマイニング手法を提案する。
擬似ラベルの偽陰性率を低減するために、潜在的なオブジェクトマイニングモジュールを提案する。
非サリエント領域マスキングモジュールは、非サリエント領域内のオブジェクトをさらに発見するのに役立ちます。
論文 参考訳(メタデータ) (2021-03-26T16:44:03Z) - Learning a Domain-Agnostic Visual Representation for Autonomous Driving
via Contrastive Loss [25.798361683744684]
ドメイン認識コントラスト学習(Domain-Agnostic Contrastive Learning、DACL)は、2段階の非監視ドメイン適応フレームワークである。
提案手法は,従来の最新手法に比べ,単眼深度推定作業における性能向上を実現した。
論文 参考訳(メタデータ) (2021-03-10T07:06:03Z) - Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals [78.12377360145078]
画素埋め込みを学習するために、コントラスト最適化の目的として、予め決められた事前を取り入れた新しい2段階フレームワークを導入する。
これは、プロキシタスクやエンドツーエンドのクラスタリングに依存する既存の作業から大きく逸脱している。
特に、PASCALでラベル付き例の1%だけを用いて学習した表現を微調整すると、7.1% mIoUで教師付き ImageNet の事前トレーニングを上回ります。
論文 参考訳(メタデータ) (2021-02-11T18:54:47Z) - Find it if You Can: End-to-End Adversarial Erasing for Weakly-Supervised
Semantic Segmentation [6.326017213490535]
本稿では,注目マップの逆消去の新たな定式化を提案する。
提案手法はサリエンシマスクを必要とせず, 注意マップの識別対象領域への拡散を防止するために, 正規化損失を用いる。
パスカルVOCデータセットを用いた実験により, 従来と比べ2.1mIoU, 1.0mIoUのセグメンテーション性能が向上することが示された。
論文 参考訳(メタデータ) (2020-11-09T18:35:35Z) - BANet: Bidirectional Aggregation Network with Occlusion Handling for
Panoptic Segmentation [30.008473359758632]
Panoptic segmentationは、フォアグラウンドインスタンスのインスタンスセグメンテーションと、バックグラウンドオブジェクトのセマンティックセグメンテーションを同時に行うことを目的としている。
本稿では,双方向学習パイプラインに基づく新しい深部汎視的セグメンテーション手法を提案する。
COCOパン光学ベンチマーク実験の結果,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2020-03-31T08:57:14Z) - Spatial Attention Pyramid Network for Unsupervised Domain Adaptation [66.75008386980869]
教師なし領域適応は様々なコンピュータビジョンタスクにおいて重要である。
教師なし領域適応のための新しい空間注意ピラミッドネットワークを設計する。
我々の手法は最先端の手法に対して大きなマージンで好適に機能する。
論文 参考訳(メタデータ) (2020-03-29T09:03:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。