論文の概要: SegDA: Maximum Separable Segment Mask with Pseudo Labels for Domain
Adaptive Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2308.05851v1
- Date: Thu, 10 Aug 2023 20:35:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 15:44:45.318844
- Title: SegDA: Maximum Separable Segment Mask with Pseudo Labels for Domain
Adaptive Semantic Segmentation
- Title(参考訳): segda: ドメイン適応意味セグメンテーションのための擬似ラベル付き最大分離セグメンテーションマスク
- Authors: Anant Khandelwal
- Abstract要約: Unsupervised Domain Adaptation (UDA) は、ラベルリッチソースドメインから知識を転送することで、ターゲットドメインのラベル不足の問題を解決することを目的としている。
分割可能な最大セグメント表現を学習することで,UDA手法の転送性能を向上させるSegDAモジュールを提案する。
4つのUDAベンチマークを用いて、実時間から実時間、夜間、クリア・ツー・リバース気象シナリオをシミュレートした。
- 参考スコア(独自算出の注目度): 27.661609140918916
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised Domain Adaptation (UDA) aims to solve the problem of label
scarcity of the target domain by transferring the knowledge from the label rich
source domain. Usually, the source domain consists of synthetic images for
which the annotation is easily obtained using the well known computer graphics
techniques. However, obtaining annotation for real world images (target domain)
require lot of manual annotation effort and is very time consuming because it
requires per pixel annotation. To address this problem we propose SegDA module
to enhance transfer performance of UDA methods by learning the maximum
separable segment representation. This resolves the problem of identifying
visually similar classes like pedestrian/rider, sidewalk/road etc. We leveraged
Equiangular Tight Frame (ETF) classifier inspired from Neural Collapse for
maximal separation between segment classes. This causes the source domain pixel
representation to collapse to a single vector forming a simplex vertices which
are aligned to the maximal separable ETF classifier. We use this phenomenon to
propose the novel architecture for domain adaptation of segment representation
for target domain. Additionally, we proposed to estimate the noise in labelling
the target domain images and update the decoder for noise correction which
encourages the discovery of pixels for classes not identified in pseudo labels.
We have used four UDA benchmarks simulating synthetic-to-real,
daytime-to-nighttime, clear-to-adverse weather scenarios. Our proposed approach
outperforms +2.2 mIoU on GTA -> Cityscapes, +2.0 mIoU on Synthia -> Cityscapes,
+5.9 mIoU on Cityscapes -> DarkZurich, +2.6 mIoU on Cityscapes -> ACDC.
- Abstract(参考訳): Unsupervised Domain Adaptation (UDA) は、ラベルリッチソースドメインから知識を転送することで、ターゲットドメインのラベル不足の問題を解決することを目的としている。
通常、ソースドメインは、よく知られたコンピュータグラフィックス技術を用いてアノテーションが容易に得られる合成画像で構成されている。
しかし、実世界の画像(ターゲット領域)のアノテーションを得るには、多くの手作業が必要であり、ピクセル単位のアノテーションを必要とするため、非常に時間がかかる。
この問題に対処するために,最大分離可能なセグメント表現を学習することにより,UDA手法の転送性能を向上させるSegDAモジュールを提案する。
これは、歩行者/ライダー、歩道/道路など、視覚的に類似したクラスを特定するという問題を解決する。
セグメントクラス間の最大分離のために,神経崩壊に触発された等角的タイトフレーム(etf)分類器を用いた。
これにより、ソース領域のピクセル表現は、最大分離可能なETF分類器に整列した単純頂点を形成する単一のベクトルに崩壊する。
この現象を用いて,対象領域に対するセグメント表現のドメイン適応のための新しいアーキテクチャを提案する。
さらに,対象領域画像のラベリングにおけるノイズを推定し,疑似ラベルで識別されないクラスに対して画素の発見を促すノイズ補正のためのデコーダを更新することを提案した。
4つのUDAベンチマークを用いて、実時間から実時間、夜間、明白から逆の気象シナリオをシミュレートした。
提案手法は,GTAでは+2.2 mIoU,Synthiaでは+2.0 mIoU,Cityscapesでは+5.9 mIoU,Cityscapesでは+5.9 mIoU,Cityscapesでは+2.6 mIoU,ACDCより優れている。
関連論文リスト
- MICDrop: Masking Image and Depth Features via Complementary Dropout for Domain-Adaptive Semantic Segmentation [155.0797148367653]
Unsupervised Domain Adaptation (UDA)は、ラベル付きソースドメインとラベルなしターゲットドメインの間のドメインギャップを埋めるタスクである。
深度不連続性はしばしばセグメンテーション境界と一致するため、幾何学的情報、すなわち深度予測を活用することを提案する。
提案手法は, 様々な UDA 手法にプラグインし, 標準 UDA ベンチマークで連続的に結果を改善することができることを示す。
論文 参考訳(メタデータ) (2024-08-29T12:15:10Z) - Look at the Neighbor: Distortion-aware Unsupervised Domain Adaptation
for Panoramic Semantic Segmentation [5.352137021024213]
この目的は、等方射影(ERP)の均一分布画素のスタイル不均一性と歪み問題に起因する領域ギャップに対処することである。
パノラマ的セマンティックセグメンテーションの歪み問題に効果的に対処できる新しいUDAフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-10T10:47:12Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - I2F: A Unified Image-to-Feature Approach for Domain Adaptive Semantic
Segmentation [55.633859439375044]
意味的セグメンテーションのための教師なしドメイン適応(UDA)は、重いアノテーション作業から人々を解放する有望なタスクである。
この問題に対処する主要なアイデアは、画像レベルと特徴レベルの両方を共同で実行することである。
本稿では,画像レベルと特徴レベルを統一したセマンティックセグメンテーションのための新しいUDAパイプラインを提案する。
論文 参考訳(メタデータ) (2023-01-03T15:19:48Z) - Continual Unsupervised Domain Adaptation for Semantic Segmentation using
a Class-Specific Transfer [9.46677024179954]
セグメンテーションモデルは 目に見えない領域に一般化しません
2つのクラス条件のAdaIN層を組み込んだ軽量なスタイル転送フレームワークを提案する。
合成シーケンスに対する我々のアプローチを広く検証し、さらに実領域からなる挑戦的なシーケンスを提案する。
論文 参考訳(メタデータ) (2022-08-12T21:30:49Z) - Target and Task specific Source-Free Domain Adaptive Image Segmentation [73.78898054277538]
ソースフリー領域適応画像分割のための2段階のアプローチを提案する。
我々は,高エントロピー領域を抑えつつ,ターゲット固有の擬似ラベルを生成することに注力する。
第2段階では、タスク固有の表現にネットワークを適用することに重点を置いている。
論文 参考訳(メタデータ) (2022-03-29T17:50:22Z) - Edge-preserving Domain Adaptation for semantic segmentation of Medical
Images [0.0]
ドメイン適応は、目に見えない環境で大量のラベル付きデータの不足に対処する技術である。
本稿では,元の画像のエッジの詳細を維持しつつ,サイクル一貫性損失を用いてドメイン間を適応するモデルを提案する。
2つの眼底血管セグメンテーションデータセットの他のアプローチと比較することにより,本アルゴリズムの有効性を実証する。
論文 参考訳(メタデータ) (2021-11-18T18:14:33Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - Pixel-Level Cycle Association: A New Perspective for Domain Adaptive
Semantic Segmentation [169.82760468633236]
本稿では,ソースとターゲットの画素ペア間の画素レベルサイクルの関連性を構築することを提案する。
我々の手法は1段階のエンドツーエンドで訓練でき、追加のパラメータは導入しない。
論文 参考訳(メタデータ) (2020-10-31T00:11:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。