論文の概要: PhysAug: A Physical-guided and Frequency-based Data Augmentation for Single-Domain Generalized Object Detection
- arxiv url: http://arxiv.org/abs/2412.11807v2
- Date: Fri, 21 Feb 2025 03:06:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-24 17:07:51.298854
- Title: PhysAug: A Physical-guided and Frequency-based Data Augmentation for Single-Domain Generalized Object Detection
- Title(参考訳): PhysAug:単一領域一般化物体検出のための物理誘導および周波数に基づくデータ拡張
- Authors: Xiaoran Xu, Jiangang Yang, Wenhui Shi, Siyuan Ding, Luqing Luo, Jian Liu,
- Abstract要約: Single-Domain Generalized Object Detection (S-DGOD) は、オブジェクト検出器を利用することで、さまざまな未確認対象領域にわたる堅牢なパフォーマンスのために、単一のソースドメイン上でトレーニングすることを目的としている。
既存のS-DGODアプローチは、検出器の一般化能力を高めるために、視覚変換の合成を含むデータ拡張戦略に依存することが多い。
本稿では,S-DGODタスクの適応性を高めるために,新しい物理モデルに基づく非理想的撮像条件データ拡張法であるPhysAugを提案する。
- 参考スコア(独自算出の注目度): 4.592579302639643
- License:
- Abstract: Single-Domain Generalized Object Detection~(S-DGOD) aims to train on a single source domain for robust performance across a variety of unseen target domains by taking advantage of an object detector. Existing S-DGOD approaches often rely on data augmentation strategies, including a composition of visual transformations, to enhance the detector's generalization ability. However, the absence of real-world prior knowledge hinders data augmentation from contributing to the diversity of training data distributions. To address this issue, we propose PhysAug, a novel physical model-based non-ideal imaging condition data augmentation method, to enhance the adaptability of the S-DGOD tasks. Drawing upon the principles of atmospheric optics, we develop a universal perturbation model that serves as the foundation for our proposed PhysAug. Given that visual perturbations typically arise from the interaction of light with atmospheric particles, the image frequency spectrum is harnessed to simulate real-world variations during training. This approach fosters the detector to learn domain-invariant representations, thereby enhancing its ability to generalize across various settings. Without altering the network architecture or loss function, our approach significantly outperforms the state-of-the-art across various S-DGOD datasets. In particular, it achieves a substantial improvement of $7.3\%$ and $7.2\%$ over the baseline on DWD and Cityscape-C, highlighting its enhanced generalizability in real-world settings.
- Abstract(参考訳): Single-Domain Generalized Object Detection~(S-DGOD)は、オブジェクト検出器を利用して、さまざまな未確認のターゲットドメインにわたる堅牢なパフォーマンスのために、単一のソースドメインでトレーニングすることを目的としている。
既存のS-DGODアプローチは、検出器の一般化能力を高めるために、視覚変換の合成を含むデータ拡張戦略に依存することが多い。
しかし、実世界の事前知識がないことは、トレーニングデータ分布の多様性に寄与するデータの増大を妨げる。
本稿では,S-DGODタスクの適応性を高めるために,新しい物理モデルに基づく非理想的画像条件データ拡張法であるPhysAugを提案する。
大気光学の原理に基づいて,提案したPhysAugの基礎となる普遍摂動モデルを構築した。
光と大気粒子の相互作用から発生する視覚的摂動を考えると、画像周波数スペクトルは訓練中の現実世界の変動をシミュレートするために用いられる。
このアプローチにより、検出器はドメイン不変表現を学習し、様々な設定をまたいで一般化する能力を高めることができる。
ネットワークアーキテクチャや損失関数を変更することなく、我々のアプローチは様々なS-DGODデータセットで最先端を著しく上回る。
特に、DWDとCityscape-Cのベースラインに対する7.3\%と7.2\%の大幅な改善を実現し、現実世界の設定における一般化性の向上を強調している。
関連論文リスト
- Object Style Diffusion for Generalized Object Detection in Urban Scene [69.04189353993907]
本稿では,GoDiffという新しい単一ドメインオブジェクト検出一般化手法を提案する。
擬似ターゲットドメインデータとソースドメインデータを統合することで、トレーニングデータセットを多様化する。
実験により,本手法は既存の検出器の一般化能力を高めるだけでなく,他の単一領域一般化手法のプラグ・アンド・プレイ拡張として機能することが示された。
論文 参考訳(メタデータ) (2024-12-18T13:03:00Z) - How Important are Data Augmentations to Close the Domain Gap for Object Detection in Orbit? [15.550663626482903]
宇宙空間におけるコンピュータビジョンの領域ギャップを埋めるためのデータ拡張の有効性について検討する。
本稿では,軌道画像に観察される視覚効果をエミュレートするために開発された2つの新しいデータ拡張法を提案する。
論文 参考訳(メタデータ) (2024-10-21T08:24:46Z) - Towards Data-Centric Face Anti-Spoofing: Improving Cross-domain Generalization via Physics-based Data Synthesis [64.46312434121455]
Face Anti-Spoofing (FAS) 研究は、トレーニングデータとテストデータの間にドメインギャップがあるクロスドメイン問題によって難題となっている。
本研究では,タスク固有のFASデータ拡張(FAS-Aug)を提案する。
また,特定の種類のアーティファクトをモデルが依存しないようにし,一般化性能を向上させるために,SARE(Spowing Attack Risk Equalization)を提案する。
論文 参考訳(メタデータ) (2024-09-04T01:45:18Z) - Prompt-Driven Dynamic Object-Centric Learning for Single Domain
Generalization [61.64304227831361]
単一ドメインの一般化は、単一のソースドメインデータからモデルを学び、他の見えないターゲットドメイン上での一般的なパフォーマンスを達成することを目的としている。
本稿では,画像の複雑さの変化に対応することを目的とした,素早い学習に基づく動的物体中心知覚ネットワークを提案する。
論文 参考訳(メタデータ) (2024-02-28T16:16:51Z) - G-NAS: Generalizable Neural Architecture Search for Single Domain
Generalization Object Detection [55.86838901572496]
微分可能なニューラルネットワークサーチ(NAS)は、複雑なデータフィッティングの能力が高いことで知られている。
一般化可能な損失(G-loss)は、OoDを意識した目的であり、NASが過度に適合することを防ぐ。
S-DGOD都市景観データセットの実験結果から,提案したG-NASはベースライン法と比較してSOTA性能が向上することが示された。
論文 参考訳(メタデータ) (2024-02-07T08:57:59Z) - Data Augmentation Techniques for Cross-Domain WiFi CSI-based Human
Activity Recognition [1.7404865362620803]
WiFi Channel State Information (CSI) は、屋内環境におけるコンタクトレスおよび視覚的プライバシー保護センシングを可能にする。
環境条件やセンサーハードウェアの多様さにより、低モデル一般化はこの分野でよく知られた問題である。
画像ベース学習で一般的に使用されるデータ拡張技術は、Wi-Fi CSIに適用され、モデル一般化性能への影響を調べる。
論文 参考訳(メタデータ) (2024-01-01T22:27:59Z) - Domain Generalization with Adversarial Intensity Attack for Medical
Image Segmentation [27.49427483473792]
実世界のシナリオでは、トレーニング中に露出していない新しいドメインや異なるドメインのデータに遭遇することが一般的である。
ドメイン一般化(Domain Generalization, DG)は、モデルがこれまで見つからなかったドメインからのデータを扱うことを可能にする、有望な方向である。
本稿では,敵対的トレーニングを活用して無限のスタイルでトレーニングデータを生成する,AdverIN(Adversarial Intensity Attack)と呼ばれる新しいDG手法を提案する。
論文 参考訳(メタデータ) (2023-04-05T19:40:51Z) - When Neural Networks Fail to Generalize? A Model Sensitivity Perspective [82.36758565781153]
ドメイン一般化 (Domain Generalization, DG) は、異なる分布の下で見えないドメインでうまく機能するようにモデルを訓練することを目的としている。
本稿では,より現実的で,より困難なシナリオである単一領域一般化(Single-DG)について考察する。
我々は「モデル感度」と命名する一般化と強く相関するモデルの性質を経験的に確認する。
本稿では、高感度の周波数をターゲットとした拡張画像を生成するために、スペクトル逆データ拡張(SADA)の新たな戦略を提案する。
論文 参考訳(メタデータ) (2022-12-01T20:15:15Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。