論文の概要: D-GAP: Improving Out-of-Domain Robustness via Dataset-Agnostic and Gradient-Guided Augmentation in Amplitude and Pixel Spaces
- arxiv url: http://arxiv.org/abs/2511.11286v1
- Date: Fri, 14 Nov 2025 13:22:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.619725
- Title: D-GAP: Improving Out-of-Domain Robustness via Dataset-Agnostic and Gradient-Guided Augmentation in Amplitude and Pixel Spaces
- Title(参考訳): D-GAP: 振幅と画素空間におけるデータセット非依存およびグラディエントガイドによる外部ロバスト性の向上
- Authors: Ruoqi Wang, Haitao Wang, Shaojie Guo, Qiong Luo,
- Abstract要約: D-GAP (Dataset-Agnostic and Gradient-Guided Augmentation in Amplitude and Pixel space) を提案する。
D-GAPはタスク勾配から周波数空間の感度マップを計算する。
4つの実世界のデータセットと3つのドメイン適応ベンチマークの実験は、D-GAPがジェネリックとデータセット固有の拡張の両方を一貫して上回っていることを示している。
- 参考スコア(独自算出の注目度): 5.0464991600543305
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Out-of-domain (OOD) robustness is challenging to achieve in real-world computer vision applications, where shifts in image background, style, and acquisition instruments always degrade model performance. Generic augmentations show inconsistent gains under such shifts, whereas dataset-specific augmentations require expert knowledge and prior analysis. Moreover, prior studies show that neural networks adapt poorly to domain shifts because they exhibit a learning bias to domain-specific frequency components. Perturbing frequency values can mitigate such bias but overlooks pixel-level details, leading to suboptimal performance. To address these problems, we propose D-GAP (Dataset-agnostic and Gradient-guided augmentation in Amplitude and Pixel spaces), improving OOD robustness by introducing targeted augmentation in both the amplitude space (frequency space) and pixel space. Unlike conventional handcrafted augmentations, D-GAP computes sensitivity maps in the frequency space from task gradients, which reflect how strongly the model responds to different frequency components, and uses the maps to adaptively interpolate amplitudes between source and target samples. This way, D-GAP reduces the learning bias in frequency space, while a complementary pixel-space blending procedure restores fine spatial details. Extensive experiments on four real-world datasets and three domain-adaptation benchmarks show that D-GAP consistently outperforms both generic and dataset-specific augmentations, improving average OOD performance by +5.3% on real-world datasets and +1.8% on benchmark datasets.
- Abstract(参考訳): ドメイン外ロバスト性(OOD)は、画像背景、スタイル、取得機器のシフトがモデル性能を劣化させる現実世界のコンピュータビジョンアプリケーションにおいて達成することが困難である。
ジェネリック増強はそのようなシフトの下で矛盾した利得を示すが、データセット固有の拡張は専門家の知識と事前分析を必要とする。
さらに、以前の研究では、ニューラルネットワークはドメイン固有の周波数成分に対する学習バイアスを示すため、ドメインシフトに不適応であることが示されている。
摂動周波数の値はそのようなバイアスを軽減することができるが、ピクセルレベルの詳細を見落とし、最適以下の性能をもたらす。
これらの問題に対処するため,D-GAP (Dataset-Agnostic and Gradient-Guided Augmentation in Amplitude and Pixel space)を提案する。
従来の手作業による拡張とは異なり、D-GAPはタスク勾配から周波数空間の感度マップを計算し、モデルが異なる周波数成分にどれだけ強く反応するかを反映し、このマップを使用してソースとターゲットのサンプル間の振幅を適応的に補間する。
このようにして、D-GAPは周波数空間の学習バイアスを低減し、補完的な画素空間ブレンディング手順は細かな空間詳細を復元する。
4つの実世界のデータセットと3つのドメイン適応ベンチマークに対する大規模な実験により、D-GAPはジェネリックとデータセット固有の拡張の両方を一貫して上回り、現実世界のデータセットでは平均OOD性能を+5.3%改善し、ベンチマークデータセットでは+1.8%向上した。
関連論文リスト
- Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文 参考訳(メタデータ) (2025-08-07T11:14:16Z) - AugmentGest: Can Random Data Cropping Augmentation Boost Gesture Recognition Performance? [49.64902130083662]
本稿では、幾何変換、ランダム変動、回転、ズーム、強度に基づく変換を統合する包括的データ拡張フレームワークを提案する。
提案手法は,マルチストリームe2eET,FPPRポイントクラウドベースハンドジェスチャ認識(HGR),DD-Networkの3つのモデルで評価される。
論文 参考訳(メタデータ) (2025-06-08T16:43:05Z) - Exploring Generalized Gait Recognition: Reducing Redundancy and Noise within Indoor and Outdoor Datasets [24.242460774158463]
一般化歩行認識は、多様な領域にわたる堅牢なパフォーマンスを実現することを目的としている。
混合データセットトレーニングは一般化を高めるために広く利用されている。
クロスドメイン歩行認識を体系的に改善する統合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-21T06:46:09Z) - Improving Out-of-Domain Robustness with Targeted Augmentation in Frequency and Pixel Spaces [3.0931146230148174]
実世界のシナリオでは、汎用的な拡張で訓練されたモデルは、分布下での一般化がラベルなしのターゲットドメインにシフトする際にのみ、余分な改善が可能である。
本稿では、周波数空間と画素空間の両方にターゲット拡張を導入することにより、OODロバスト性を高めるドメイン適応フレームワークである Frequency-Pixel Connect を提案する。
我々は、周波数-Pixel Connectがクロスドメイン接続を大幅に改善し、ビジョン、医療、オーディオ、天文学の領域にわたる4つの異なる実世界のベンチマークにおいて、従来の一般的な手法よりも優れていることを実証した。
論文 参考訳(メタデータ) (2025-05-18T09:15:40Z) - 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - How Important are Data Augmentations to Close the Domain Gap for Object Detection in Orbit? [15.550663626482903]
宇宙空間におけるコンピュータビジョンの領域ギャップを埋めるためのデータ拡張の有効性について検討する。
本稿では,軌道画像に観察される視覚効果をエミュレートするために開発された2つの新しいデータ拡張法を提案する。
論文 参考訳(メタデータ) (2024-10-21T08:24:46Z) - CVT-xRF: Contrastive In-Voxel Transformer for 3D Consistent Radiance Fields from Sparse Inputs [65.80187860906115]
スパース入力によるNeRFの性能向上のための新しい手法を提案する。
まず, サンプル線が, 3次元空間内の特定のボクセルと交差することを保証するために, ボクセルを用いた放射線サンプリング戦略を採用する。
次に、ボクセル内の追加点をランダムにサンプリングし、トランスフォーマーを適用して各線上の他の点の特性を推測し、ボリュームレンダリングに組み込む。
論文 参考訳(メタデータ) (2024-03-25T15:56:17Z) - Data Augmentation for Traffic Classification [54.92823760790628]
Data Augmentation (DA) はコンピュータビジョン(CV)と自然言語処理(NLP)に広く採用されている技術である。
DAはネットワークのコンテキスト、特にトラフィック分類(TC)タスクにおいて、牽引力を得るのに苦労しています。
論文 参考訳(メタデータ) (2024-01-19T15:25:09Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。