論文の概要: Improving Out-of-Domain Robustness with Targeted Augmentation in Frequency and Pixel Spaces
- arxiv url: http://arxiv.org/abs/2505.12317v1
- Date: Sun, 18 May 2025 09:15:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.160696
- Title: Improving Out-of-Domain Robustness with Targeted Augmentation in Frequency and Pixel Spaces
- Title(参考訳): 周波数および画素空間におけるターゲット拡大による内部ロバスト性の改善
- Authors: Ruoqi Wang, Haitao Wang, Shaojie Guo, Qiong Luo,
- Abstract要約: 実世界のシナリオでは、汎用的な拡張で訓練されたモデルは、分布下での一般化がラベルなしのターゲットドメインにシフトする際にのみ、余分な改善が可能である。
本稿では、周波数空間と画素空間の両方にターゲット拡張を導入することにより、OODロバスト性を高めるドメイン適応フレームワークである Frequency-Pixel Connect を提案する。
我々は、周波数-Pixel Connectがクロスドメイン接続を大幅に改善し、ビジョン、医療、オーディオ、天文学の領域にわたる4つの異なる実世界のベンチマークにおいて、従来の一般的な手法よりも優れていることを実証した。
- 参考スコア(独自算出の注目度): 3.0931146230148174
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Out-of-domain (OOD) robustness under domain adaptation settings, where labeled source data and unlabeled target data come from different distributions, is a key challenge in real-world applications. A common approach to improving OOD robustness is through data augmentations. However, in real-world scenarios, models trained with generic augmentations can only improve marginally when generalized under distribution shifts toward unlabeled target domains. While dataset-specific targeted augmentations can address this issue, they typically require expert knowledge and extensive prior data analysis to identify the nature of the datasets and domain shift. To address these challenges, we propose Frequency-Pixel Connect, a domain-adaptation framework that enhances OOD robustness by introducing a targeted augmentation in both the frequency space and pixel space. Specifically, we mix the amplitude spectrum and pixel content of a source image and a target image to generate augmented samples that introduce domain diversity while preserving the semantic structure of the source image. Unlike previous targeted augmentation methods that are both dataset-specific and limited to the pixel space, Frequency-Pixel Connect is dataset-agnostic, enabling broader and more flexible applicability beyond natural image datasets. We further analyze the effectiveness of Frequency-Pixel Connect by evaluating the performance of our method connecting same-class cross-domain samples while separating different-class examples. We demonstrate that Frequency-Pixel Connect significantly improves cross-domain connectivity and outperforms previous generic methods on four diverse real-world benchmarks across vision, medical, audio, and astronomical domains, and it also outperforms other dataset-specific targeted augmentation methods.
- Abstract(参考訳): ドメイン適応設定下でのアウト・オブ・ドメイン(OOD)の堅牢性 - ラベル付きソースデータとラベルなしターゲットデータが異なるディストリビューションから来ることは、現実世界のアプリケーションにおいて重要な課題である。
OODの堅牢性を改善するための一般的なアプローチは、データ拡張である。
しかし、現実のシナリオでは、汎用的な拡張で訓練されたモデルは、分布がラベルなしのターゲットドメインにシフトする際にのみ、余分な改善が可能である。
データセット固有のターゲット拡張はこの問題に対処できるが、データセットの性質とドメインシフトを特定するためには、専門家の知識と広範な事前データ分析が必要になるのが一般的である。
これらの課題に対処するために、周波数空間と画素空間の両方にターゲット拡張を導入することにより、OODロバスト性を高めるドメイン適応フレームワークである Frequency-Pixel Connect を提案する。
具体的には、ソース画像とターゲット画像の振幅スペクトルと画素含有量を混合し、ソース画像のセマンティックな構造を保ちながら、ドメインの多様性を導入する拡張サンプルを生成する。
Frequency-Pixel Connectは、データセット固有のだけでなく、ピクセル空間に制限のある従来のターゲット拡張メソッドとは異なり、データセットに依存しないため、自然なイメージデータセットを超えて、より広く柔軟な適用が可能になる。
さらに,同級クロスドメインのサンプルを分離しながら,同級クロスドメインを接続する手法の性能を評価することで,周波数-Pixel接続の有効性を解析する。
我々は、周波数-Pixel Connectが、クロスドメイン接続を大幅に改善し、ビジョン、医療、オーディオ、天文学の領域にわたる4つの異なる実世界のベンチマークにおいて、従来の一般的な手法よりも優れており、また、他のデータセット固有のターゲット拡張手法よりも優れていることを実証した。
関連論文リスト
- Object Style Diffusion for Generalized Object Detection in Urban Scene [69.04189353993907]
本稿では,GoDiffという新しい単一ドメインオブジェクト検出一般化手法を提案する。
擬似ターゲットドメインデータとソースドメインデータを統合することで、トレーニングデータセットを多様化する。
実験により,本手法は既存の検出器の一般化能力を高めるだけでなく,他の単一領域一般化手法のプラグ・アンド・プレイ拡張として機能することが示された。
論文 参考訳(メタデータ) (2024-12-18T13:03:00Z) - GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing [37.489576508876056]
本稿では、一般化可能なプロンプト誘導型生成データ拡張手法であるGenMixを紹介する。
本手法は、画像編集を利用して、カスタム条件付きプロンプトに基づく拡張画像を生成する。
提案手法は、非現実的な画像とラベルの曖昧さを緩和し、結果のモデルの性能と対角的堅牢性を向上する。
論文 参考訳(メタデータ) (2024-12-03T10:45:34Z) - Domain Expansion and Boundary Growth for Open-Set Single-Source Domain Generalization [70.02187124865627]
オープンソースの単一ソースドメインの一般化は、単一のソースドメインを使用して、未知のターゲットドメインに一般化可能な堅牢なモデルを学ぶことを目的としている。
本稿では,領域拡大と境界成長に基づく新しい学習手法を提案する。
提案手法は,いくつかの領域横断画像分類データセットにおいて,大幅な改善と最先端性能を実現することができる。
論文 参考訳(メタデータ) (2024-11-05T09:08:46Z) - A Novel Cross-Perturbation for Single Domain Generalization [54.612933105967606]
単一ドメインの一般化は、モデルが単一のソースドメインでトレーニングされたときに未知のドメインに一般化する能力を高めることを目的としている。
トレーニングデータの限られた多様性は、ドメイン不変の特徴の学習を妨げ、結果として一般化性能を損なう。
トレーニングデータの多様性を高めるために,CPerbを提案する。
論文 参考訳(メタデータ) (2023-08-02T03:16:12Z) - Local Magnification for Data and Feature Augmentation [53.04028225837681]
LOMA(Local Magnification)と呼ばれる,実装が容易かつモデルフリーなデータ拡張手法を提案する。
LOMAは、画像の局所領域をランダムに拡大することにより、追加のトレーニングデータを生成する。
実験の結果,提案するLOMAと標準データ拡張を組み合わせることで,画像分類や物体検出の性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-11-15T02:51:59Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - DoFE: Domain-oriented Feature Embedding for Generalizable Fundus Image
Segmentation on Unseen Datasets [96.92018649136217]
対象ドメインに対するCNNの一般化能力を向上させるために,新しいドメイン指向特徴埋め込み(DoFE)フレームワークを提案する。
私たちのDoFEフレームワークは、マルチソースドメインから学んだ追加のドメイン事前知識で、画像機能を動的に強化します。
本フレームワークは、未確認データセットのセグメンテーション結果を満足して生成し、他の領域の一般化やネットワークの正規化手法を超越する。
論文 参考訳(メタデータ) (2020-10-13T07:28:39Z) - Data Augmentation via Mixed Class Interpolation using Cycle-Consistent
Generative Adversarial Networks Applied to Cross-Domain Imagery [16.870604081967866]
機械学習による物体検出と非可視画像内の分類は多くの分野において重要な役割を担っている。
しかし、このような応用は、限られた量の非可視領域画像のためにしばしば苦しむ。
本稿では,可視光帯域画像を利用した新しいデータ拡張手法の提案と評価を行う。
論文 参考訳(メタデータ) (2020-05-05T18:53:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。