論文の概要: Pixel-by-Pixel Cross-Domain Alignment for Few-Shot Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2110.11650v1
- Date: Fri, 22 Oct 2021 08:27:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-25 23:19:54.006573
- Title: Pixel-by-Pixel Cross-Domain Alignment for Few-Shot Semantic Segmentation
- Title(参考訳): ピクセル単位のクロスドメインアライメントによる少数ショットセマンティクスセグメンテーション
- Authors: Antonio Tavera, Fabio Cermelli, Carlo Masone, Barbara Caputo
- Abstract要約: 自律運転アプリケーションにおけるセマンティックセグメンテーションの課題について考察する。
この文脈では、ピクセル単位のクラス不均衡により、ドメインの整列がより困難になる。
我々は Pixel-By-Pixel Cross-Domain Alignment (PixDA) と呼ばれる新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 16.950853152484203
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we consider the task of semantic segmentation in autonomous
driving applications. Specifically, we consider the cross-domain few-shot
setting where training can use only few real-world annotated images and many
annotated synthetic images. In this context, aligning the domains is made more
challenging by the pixel-wise class imbalance that is intrinsic in the
segmentation and that leads to ignoring the underrepresented classes and
overfitting the well represented ones. We address this problem with a novel
framework called Pixel-By-Pixel Cross-Domain Alignment (PixDA). We propose a
novel pixel-by-pixel domain adversarial loss following three criteria: (i)
align the source and the target domain for each pixel, (ii) avoid negative
transfer on the correctly represented pixels, and (iii) regularize the training
of infrequent classes to avoid overfitting. The pixel-wise adversarial training
is assisted by a novel sample selection procedure, that handles the imbalance
between source and target data, and a knowledge distillation strategy, that
avoids overfitting towards the few target images. We demonstrate on standard
synthetic-to-real benchmarks that PixDA outperforms previous state-of-the-art
methods in (1-5)-shot settings.
- Abstract(参考訳): 本稿では,自律運転アプリケーションにおけるセマンティックセグメンテーションの課題について考察する。
具体的には,実世界のアノテート画像と多数のアノテート合成画像のみをトレーニングで使用できるクロスドメイン・マイトショット設定を検討する。
この文脈では、領域の整列は、セグメンテーションに固有のピクセル単位のクラス不均衡によってより困難にされ、不明確なクラスを無視し、よく表現されたクラスを過度に適合させる。
我々はPixel-By-Pixel Cross-Domain Alignment (PixDA)と呼ばれる新しいフレームワークでこの問題に対処する。
我々は3つの基準を満たした新しいピクセル・バイ・ピクセル領域逆損失を提案する。
(i)各画素に対してソースとターゲットドメインをアライメントする。
(ii)正しく表現された画素の負の転送を回避し、
(iii)過失を避けるために不適切なクラスの訓練を規則化する。
画素単位の対角トレーニングは、ソースとターゲットデータの不均衡を処理する新しいサンプル選択手順と、少数のターゲット画像に対する過度な適合を回避する知識蒸留戦略によって支援される。
pixda が (1-5) ショット設定で以前の最先端メソッドを上回っている標準的な合成から実へのベンチマークを実演する。
関連論文リスト
- Look at the Neighbor: Distortion-aware Unsupervised Domain Adaptation
for Panoramic Semantic Segmentation [5.352137021024213]
この目的は、等方射影(ERP)の均一分布画素のスタイル不均一性と歪み問題に起因する領域ギャップに対処することである。
パノラマ的セマンティックセグメンテーションの歪み問題に効果的に対処できる新しいUDAフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-10T10:47:12Z) - Optimal transport meets noisy label robust loss and MixUp regularization
for domain adaptation [13.080485957000462]
ソーストレーニングセットでトレーニングされたディープニューラルネットワークは、トレーニングドメインに属さないターゲットイメージに対して不十分に動作します。
これらの性能を改善するための1つの戦略は、最適なトランスポート(OT)を使用して、埋め込み空間におけるソースとターゲットの画像分布を調整することである。
我々は、MixUp正規化のcitepzhang 2018mixupを、ドメイン適応性能を改善するために、ノイズの多いラベルに対して堅牢な損失と組み合わせることを提案する。
論文 参考訳(メタデータ) (2022-06-22T15:40:52Z) - SePiCo: Semantic-Guided Pixel Contrast for Domain Adaptive Semantic
Segmentation [52.62441404064957]
ドメイン適応セマンティックセグメンテーションは、ラベル付きソースドメインでトレーニングされたモデルを利用することで、ラベル付きターゲットドメイン上で満足のいく密度の予測を試みる。
多くの手法は、ノイズの多い擬似ラベルを緩和する傾向があるが、類似のセマンティックな概念を持つクロスドメインピクセル間の固有の接続を無視する。
本稿では,個々の画素のセマンティックな概念を強調する一段階適応フレームワークSePiCoを提案する。
論文 参考訳(メタデータ) (2022-04-19T11:16:29Z) - Unsupervised Domain Adaptation with Contrastive Learning for OCT
Segmentation [49.59567529191423]
本稿では,新しい未ラベル領域からのボリューム画像のセグメンテーションのための,新しい半教師付き学習フレームワークを提案する。
教師付き学習とコントラスト学習を併用し、3次元の近傍スライス間の類似性を利用したコントラストペア方式を導入する。
論文 参考訳(メタデータ) (2022-03-07T19:02:26Z) - SPCL: A New Framework for Domain Adaptive Semantic Segmentation via
Semantic Prototype-based Contrastive Learning [6.705297811617307]
ドメイン適応は、ラベル付けされたソースドメインからラベル付けされていないターゲットドメインに知識を転送するのに役立ちます。
本稿では,クラスアライメントを微粒化するための新しい意味的プロトタイプに基づくコントラスト学習フレームワークを提案する。
我々の手法は実装が容易であり、最先端の手法と比較して優れた結果が得られる。
論文 参考訳(メタデータ) (2021-11-24T09:26:07Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。
本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文 参考訳(メタデータ) (2021-01-26T10:40:13Z) - Pixel-Level Cycle Association: A New Perspective for Domain Adaptive
Semantic Segmentation [169.82760468633236]
本稿では,ソースとターゲットの画素ペア間の画素レベルサイクルの関連性を構築することを提案する。
我々の手法は1段階のエンドツーエンドで訓練でき、追加のパラメータは導入しない。
論文 参考訳(メタデータ) (2020-10-31T00:11:36Z) - CrDoCo: Pixel-level Domain Transfer with Cross-Domain Consistency [119.45667331836583]
教師なしのドメイン適応アルゴリズムは、あるドメインから学んだ知識を別のドメインに転送することを目的としている。
本稿では,新しい画素単位の対向領域適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-09T19:00:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。