論文の概要: Learning to Augment: Hallucinating Data for Domain Generalized
Segmentation
- arxiv url: http://arxiv.org/abs/2307.01703v2
- Date: Tue, 12 Sep 2023 11:59:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 17:01:51.747167
- Title: Learning to Augment: Hallucinating Data for Domain Generalized
Segmentation
- Title(参考訳): 拡張への学習: ドメイン一般化セグメンテーションのための幻覚的データ
- Authors: Qiyu Sun, Pavlo Melnyk, Michael Felsberg, Yang Tang
- Abstract要約: ドメイン一般化セマンティックセグメンテーション(DGSS)は必須だが非常に難しい課題である。
既存のDGSSメソッドは主に機能の分散を標準化するか、拡張のために追加のドメインデータを利用する。
本稿では,GANをベースとした機能拡張(GBFA)を提案する。
- 参考スコア(独自算出の注目度): 26.90659378410481
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Domain generalized semantic segmentation (DGSS) is an essential but highly
challenging task, in which the model is trained only on source data and any
target data is not available. Existing DGSS methods primarily standardize the
feature distribution or utilize extra domain data for augmentation. However,
the former sacrifices valuable information and the latter introduces domain
biases. Therefore, generating diverse-style source data without auxiliary data
emerges as an attractive strategy. In light of this, we propose GAN-based
feature augmentation (GBFA) that hallucinates stylized feature maps while
preserving their semantic contents with a feature generator. The impressive
generative capability of GANs enables GBFA to perform inter-channel and
trainable feature synthesis in an end-to-end framework. To enable learning
GBFA, we introduce random image color augmentation (RICA), which adds a diverse
range of variations to source images during training. These augmented images
are then passed through a feature extractor to obtain features tailored for
GBFA training. Both GBFA and RICA operate exclusively within the source domain,
eliminating the need for auxiliary datasets. We conduct extensive experiments,
and the generalization results from the synthetic GTAV and SYNTHIA to the real
Cityscapes, BDDS, and Mapillary datasets show that our method achieves
state-of-the-art performance in DGSS.
- Abstract(参考訳): ドメイン一般化セマンティックセグメンテーション(dgss)は必須だが、非常に難しいタスクであり、モデルがソースデータのみに基づいてトレーニングされ、ターゲットデータも利用できない。
既存のDGSSメソッドは主に機能の分散を標準化するか、拡張のために追加のドメインデータを利用する。
しかし、前者は貴重な情報を犠牲にし、後者はドメインバイアスを導入する。
したがって、補助データなしで多彩なソースデータを生成することは魅力的な戦略である。
これを踏まえて,特徴生成器で意味的内容を保存しつつ,特徴マップのスタイライゼーションを行うgan-based feature augmentation (gbfa)を提案する。
GANの印象的な生成能力により、GBFAはエンドツーエンドフレームワークでチャネル間およびトレーニング可能な機能合成を実行することができる。
gbfaの学習を可能にするために、トレーニング中にソースイメージにさまざまなバリエーションを追加するランダム画像色拡張(rica)を導入する。
これらの拡張画像は、GBFAトレーニングに適した特徴を得るために、特徴抽出器に渡される。
GBFAとRICAはいずれもソースドメイン内でのみ動作するため、補助的なデータセットは不要である。
我々は広範な実験を行い,合成gtavとシンセサイアから実際の都市景観,bdd,mapillaryデータセットへの一般化結果から,dgssにおける最先端性能を実現することを示す。
関連論文リスト
- GIFD: A Generative Gradient Inversion Method with Feature Domain
Optimization [52.55628139825667]
Federated Learning(FL)は、クライアントのプライバシを保護するための有望な分散機械学習フレームワークとして登場した。
近年の研究では、事前学習された生成逆ネットワーク(GAN)を事前知識として活用することにより、攻撃者が共有勾配を逆転し、FLシステムに対する機密データを回復できることが示されている。
textbfGradient textbfInversion over textbfFeature textbfDomains (GIFD)を提案する。
論文 参考訳(メタデータ) (2023-08-09T04:34:21Z) - Frequency-mixed Single-source Domain Generalization for Medical Image
Segmentation [29.566769388674473]
医用画像セグメンテーションの欠如は、ディープラーニングモデルのための十分なトレーニングデータを集める上での課題となっている。
周波数混合単一ソース領域一般化法(FreeSDG)という新しい手法を提案する。
3つのモードの5つのデータセットに対する実験結果から,提案アルゴリズムの有効性が示された。
論文 参考訳(メタデータ) (2023-07-18T06:44:45Z) - Intra- & Extra-Source Exemplar-Based Style Synthesis for Improved Domain
Generalization [21.591831983223997]
セマンティックセグメンテーションにおけるドメインの一般化を改善するために,先進的なスタイル合成パイプラインを提案する。
提案手法は,StyleGAN2インバージョンのためのマスク付きノイズエンコーダに基づく。
データシフトの種類によって、ドライブシーンセマンティックセマンティックセグメンテーションの最大12.4%のmIoU改善を実現しています。
論文 参考訳(メタデータ) (2023-07-02T19:56:43Z) - Learning to Augment via Implicit Differentiation for Domain
Generalization [107.9666735637355]
ドメイン一般化(DG)は、複数のソースドメインを活用してドメイン一般化可能なモデルを学ぶことで、この問題を克服することを目的としている。
本稿では,AugLearnと呼ばれる新しい拡張型DG手法を提案する。
AugLearnは、PACS、Office-Home、Digits-DGの3つの標準DGベンチマークで効果を示す。
論文 参考訳(メタデータ) (2022-10-25T18:51:51Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - AADG: Automatic Augmentation for Domain Generalization on Retinal Image
Segmentation [1.0452185327816181]
AADG(Automated Augmentation for Domain Generalization)と呼ばれるデータ操作に基づくドメイン一般化手法を提案する。
我々のAADGフレームワークは、新しいドメインを生成するデータ拡張ポリシーを効果的にサンプリングすることができる。
提案するAADGは,最先端の一般化性能を示し,既存手法より優れている。
論文 参考訳(メタデータ) (2022-07-27T02:26:01Z) - Federated and Generalized Person Re-identification through Domain and
Feature Hallucinating [88.77196261300699]
人物再識別(re-ID)におけるフェデレーションドメイン一般化(FedDG)の問題について検討する。
一般化された局所的・グローバルなモデルを学ぶための多様な特徴を創出する手法として,DFH (Domain and Feature Hallucinating) を提案する。
提案手法は4つの大規模re-IDベンチマークにおいてFedDGの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-05T09:15:13Z) - Boosting Few-shot Semantic Segmentation with Transformers [81.43459055197435]
TRansformer-based Few-shot Semantic segmentation Method (TRFS)
我々のモデルは,グローバル・エンハンスメント・モジュール(GEM)とローカル・エンハンスメント・モジュール(LEM)の2つのモジュールから構成される。
論文 参考訳(メタデータ) (2021-08-04T20:09:21Z) - Domain Adaptation for Learning Generator from Paired Few-Shot Data [72.04430033118426]
十分なソースデータと少数のターゲットデータを持つジェネレータを学習するためのペアドフェーショットGAN(PFS-GAN)モデルを提案する。
提案手法は,複数のベースラインと比較して,より多様性の高い生成対象ドメインデータに対して,定量的,定性的な結果が得られる。
論文 参考訳(メタデータ) (2021-02-25T10:11:44Z) - Multi-Spectral Image Synthesis for Crop/Weed Segmentation in Precision
Farming [3.4788711710826083]
本稿では, 精密農業における作物・雑草の分枝化問題に適用し, 共通データ増分法に関する代替手法を提案する。
我々は、最も関連性の高いオブジェクトクラス(作物や雑草)を合成されたクラスに置き換えることで、半人工的なサンプルを作成する。
RGBデータに加えて、近赤外(NIR)情報も考慮し、4つのチャネルマルチスペクトル合成画像を生成する。
論文 参考訳(メタデータ) (2020-09-12T08:49:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。