論文の概要: Decompose, Adjust, Compose: Effective Normalization by Playing with
Frequency for Domain Generalization
- arxiv url: http://arxiv.org/abs/2303.02328v1
- Date: Sat, 4 Mar 2023 05:23:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-07 20:25:24.671634
- Title: Decompose, Adjust, Compose: Effective Normalization by Playing with
Frequency for Domain Generalization
- Title(参考訳): decompose, adjust, compose: ドメイン一般化のための周波数による効果的な正規化
- Authors: Sangrok Lee, Jongseong Bae, Ha Young Kim
- Abstract要約: ドメイン一般化は、コンピュータビジョンモデルの堅牢性を評価するための主要なタスクである。
正規化においては、統計と正規化された特徴はそれぞれスタイルと内容と見なされる。
本研究では、周波数領域の観点から、振幅と位相をそれぞれスタイルと内容とみなす。
- 参考スコア(独自算出の注目度): 13.09961814999193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Domain generalization (DG) is a principal task to evaluate the robustness of
computer vision models. Many previous studies have used normalization for DG.
In normalization, statistics and normalized features are regarded as style and
content, respectively. However, it has a content variation problem when
removing style because the boundary between content and style is unclear. This
study addresses this problem from the frequency domain perspective, where
amplitude and phase are considered as style and content, respectively. First,
we verify the quantitative phase variation of normalization through the
mathematical derivation of the Fourier transform formula. Then, based on this,
we propose a novel normalization method, PCNorm, which eliminates style only as
the preserving content through spectral decomposition. Furthermore, we propose
advanced PCNorm variants, CCNorm and SCNorm, which adjust the degrees of
variations in content and style, respectively. Thus, they can learn
domain-agnostic representations for DG. With the normalization methods, we
propose ResNet-variant models, DAC-P and DAC-SC, which are robust to the domain
gap. The proposed models outperform other recent DG methods. The DAC-SC
achieves an average state-of-the-art performance of 65.6% on five datasets:
PACS, VLCS, Office-Home, DomainNet, and TerraIncognita.
- Abstract(参考訳): ドメイン一般化(DG)はコンピュータビジョンモデルの堅牢性を評価する主要な課題である。
これまでの多くの研究で、DGの正規化が使われてきた。
正規化では、統計と正規化特徴はそれぞれスタイルとコンテンツと見なされる。
しかし、内容とスタイルの境界が不明確であるため、スタイルの削除時にコンテンツの変化が問題となる。
本研究は、振幅と位相をそれぞれスタイルとコンテンツと見なす周波数領域の観点からこの問題に対処する。
まず,フーリエ変換公式の数学的導出を通じて正規化の定量的位相変化を検証する。
そこで本研究では,スペクトル分解による保存コンテンツとしてのみスタイルを除去した新しい正規化法pcnormを提案する。
さらに,コンテンツの変動度とスタイルをそれぞれ調整した,ccnormとscnormを改良したpcnorm変種を提案する。
したがって、彼らはDGのドメインに依存しない表現を学ぶことができる。
正規化手法を用いて,ドメインギャップに頑健なResNet-variantモデルであるDAC-PとDAC-SCを提案する。
提案手法は他のDG法よりも優れている。
DAC-SCはPACS、VLCS、Office-Home、DomainNet、TerraIncognitaの5つのデータセットで65.6%の最先端パフォーマンスを達成した。
関連論文リスト
- FAN-Net: Fourier-Based Adaptive Normalization For Cross-Domain Stroke
Lesion Segmentation [17.150527504559594]
フーリエ適応正規化(FAN)を組み込んだU-NetベースのセグメンテーションネットワークであるFAN-Netを提案する。
9地点のMR画像からなるATLASデータセットの実験結果は,ベースライン法と比較して提案したFAN-Netの優れた性能を示している。
論文 参考訳(メタデータ) (2023-04-23T06:58:21Z) - Context Normalization Layer with Applications [0.1499944454332829]
本研究では,画像データに対する文脈正規化と呼ばれる新しい正規化手法を提案する。
各サンプルの特性に基づいて特徴のスケーリングを調整し、モデルの収束速度と性能を改善する。
文脈正規化の有効性は様々なデータセットで示され、その性能は他の標準正規化手法と比較される。
論文 参考訳(メタデータ) (2023-03-14T06:38:17Z) - Contrastive Model Adaptation for Cross-Condition Robustness in Semantic
Segmentation [58.17907376475596]
意味的セグメンテーションのための正規-逆条件モデル適応について検討する。
提案手法は, コントラスト学習を通じて条件不変の特徴を学習するために, このような画像ペアを利用する。
いくつかの正規-逆適応ベンチマークにおけるモデル適応のための最先端セマンティックセマンティックセマンティクス性能を実現する。
論文 参考訳(メタデータ) (2023-03-09T11:48:29Z) - Domain Generalisation via Domain Adaptation: An Adversarial Fourier
Amplitude Approach [13.642506915023871]
最悪の対象ドメインを逆向きに合成し、その最悪の対象ドメインにモデルを適用する。
DomainBedNetデータセットでは、提案手法により、ドメインの一般化性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-23T14:19:07Z) - Intra-Source Style Augmentation for Improved Domain Generalization [21.591831983223997]
セマンティックセグメンテーションにおける領域一般化を改善するために,イントラソーススタイル拡張(ISSA)手法を提案する。
ISSAはモデルに依存しず、CNNやTransformerで簡単に適用できる。
また、Cityscapes から Dark Z"urich の最近の最先端ソリューション RobustNet を $3%$ mIoU で改善するなど、他の領域の一般化手法を補完する。
論文 参考訳(メタデータ) (2022-10-18T21:33:25Z) - Compound Domain Generalization via Meta-Knowledge Encoding [55.22920476224671]
マルチモーダル分布を再正規化するために,スタイル駆動型ドメイン固有正規化(SDNorm)を導入する。
組込み空間における関係モデリングを行うために,プロトタイプ表現,クラスセントロイドを利用する。
4つの標準ドメイン一般化ベンチマークの実験により、COMENはドメインの監督なしに最先端のパフォーマンスを上回ることが判明した。
論文 参考訳(メタデータ) (2022-03-24T11:54:59Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - Towards Principled Disentanglement for Domain Generalization [90.9891372499545]
機械学習モデルの根本的な課題は、アウト・オブ・ディストリビューション(OOD)データへの一般化である。
私たちはまず、DEC(Disentanglement-Constrained Domain Generalization)と呼ばれる制約付き最適化としてOOD一般化問題を定式化する。
この変換に基づいて、結合表現の不絡合と領域一般化のための原始双対アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-11-27T07:36:32Z) - Adversarially Adaptive Normalization for Single Domain Generalization [71.80587939738672]
一般化正規化アプローチ,適応標準化と再スケーリング正規化(ASR-Norm)を提案する。
ASR-Normは、ニューラルネットワークを介して標準化と再スケーリングの統計学を学ぶ。
ASR-Normは最先端のADAアプローチに一貫した改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-06-01T23:58:23Z) - Model-Based Domain Generalization [96.84818110323518]
本稿では,モデルベースドメイン一般化問題に対する新しいアプローチを提案する。
我々のアルゴリズムは、最新のwildsベンチマークの最先端手法を最大20ポイント上回った。
論文 参考訳(メタデータ) (2021-02-23T00:59:02Z) - Modeling the Distribution of Normal Data in Pre-Trained Deep Features
for Anomaly Detection [2.9864637081333085]
画像中の異常検出(AD)は、標準からかなり逸脱した画像や画像のサブ構造を特定することを指す。
本研究では,大きな自然画像データセット上での識別モデルにより学習された深い特徴表現が,正規性を記述するのに適していることを示す。
論文 参考訳(メタデータ) (2020-05-28T16:43:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。