論文の概要: OSSA: Unsupervised One-Shot Style Adaptation
- arxiv url: http://arxiv.org/abs/2410.00900v1
- Date: Tue, 1 Oct 2024 17:43:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-05 00:19:53.328626
- Title: OSSA: Unsupervised One-Shot Style Adaptation
- Title(参考訳): OSSA: 教師なしワンショットスタイルの適応
- Authors: Robin Gerster, Holger Caesar, Matthias Rapp, Alexander Wolpert, Michael Teutsch,
- Abstract要約: オブジェクト検出のための新しい教師なし領域適応手法であるOne-Shot Style Adaptation (OSSA)を導入する。
OSSAは、単一のターゲット画像から派生したスタイル統計を摂動することで、多様なターゲットスタイルを生成する。
我々は,OSSAがワンショット領域適応法において,新たな最先端技術を確立していることを示す。
- 参考スコア(独自算出の注目度): 41.71187047855695
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite their success in various vision tasks, deep neural network architectures often underperform in out-of-distribution scenarios due to the difference between training and target domain style. To address this limitation, we introduce One-Shot Style Adaptation (OSSA), a novel unsupervised domain adaptation method for object detection that utilizes a single, unlabeled target image to approximate the target domain style. Specifically, OSSA generates diverse target styles by perturbing the style statistics derived from a single target image and then applies these styles to a labeled source dataset at the feature level using Adaptive Instance Normalization (AdaIN). Extensive experiments show that OSSA establishes a new state-of-the-art among one-shot domain adaptation methods by a significant margin, and in some cases, even outperforms strong baselines that use thousands of unlabeled target images. By applying OSSA in various scenarios, including weather, simulated-to-real (sim2real), and visual-to-thermal adaptations, our study explores the overarching significance of the style gap in these contexts. OSSA's simplicity and efficiency allow easy integration into existing frameworks, providing a potentially viable solution for practical applications with limited data availability. Code is available at https://github.com/RobinGerster7/OSSA
- Abstract(参考訳): さまざまなビジョンタスクの成功にもかかわらず、深層ニューラルネットワークアーキテクチャは、トレーニングとターゲットドメインスタイルの違いにより、アウト・オブ・ディストリビューションシナリオでパフォーマンスが低下することが多い。
この制限に対処するために,1枚のラベルのないターゲット画像を用いて対象ドメインスタイルを近似する,オブジェクト検出のための新しい教師なしドメイン適応手法であるOne-Shot Style Adaptation (OSSA)を導入する。
具体的には、OSSAは、単一のターゲット画像から派生したスタイル統計を摂動させ、アダプティブインスタンス正規化(AdaIN)を使用して、特徴レベルのラベル付きソースデータセットにこれらのスタイルを適用することで、多様なターゲットスタイルを生成する。
大規模な実験により、OSSAは1ショットのドメイン適応手法で新しい最先端の手法を確立し、場合によっては数千の未ラベルのターゲット画像を使用する強力なベースラインを上回ります。
気象,シミュレート・トゥ・リアル(シミュレート・トゥ・リアル),ビジュアル・トゥ・サーマル適応といった様々なシナリオにOSSAを適用し,これらの文脈におけるスタイルギャップの全体的意義について検討した。
OSSAのシンプルさと効率性により、既存のフレームワークへの統合が容易になり、データ可用性が制限された実用的なアプリケーションに対して、潜在的に実行可能なソリューションを提供する。
コードはhttps://github.com/RobinGerster7/OSSAで入手できる。
関連論文リスト
- Bridging the Gap: Heterogeneous Face Recognition with Conditional
Adaptive Instance Modulation [7.665392786787577]
本研究では,事前学習した顔認識ネットワークに統合可能な,新しい条件適応型インスタンス変調(CAIM)モジュールを提案する。
CAIMブロックは中間特徴写像を変調し、対象モダリティのスタイルに適応して領域ギャップを効果的にブリッジする。
提案手法は,最小限のペアサンプルでエンドツーエンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2023-07-13T19:17:04Z) - Condition-Invariant Semantic Segmentation [77.10045325743644]
我々は現在最先端のドメイン適応アーキテクチャ上で条件不変セマンティック(CISS)を実装している。
本手法は,通常の都市景観$to$ACDCベンチマークにおいて,2番目に高い性能を実現する。
CISSはBDD100K-nightやACDC-nightのようなトレーニング中に見えない領域によく一般化している。
論文 参考訳(メタデータ) (2023-05-27T03:05:07Z) - Target-Aware Generative Augmentations for Single-Shot Adaptation [21.840653627684855]
我々は、ソースドメインからターゲットドメインへのモデル適応のための新しいアプローチを提案する。
SiSTAは、単一ショットターゲットを用いてソースドメインから生成モデルを微調整し、その後、合成ターゲットデータをキュレートするための新しいサンプリング戦略を用いる。
顔検出や多クラス物体認識において,SiSTAは既存のベースラインよりも大幅に向上していることがわかった。
論文 参考訳(メタデータ) (2023-05-22T17:46:26Z) - Self-Paced Learning for Open-Set Domain Adaptation [50.620824701934]
従来のドメイン適応手法は、ソースとターゲットドメインのクラスが同一であると仮定する。
オープンセットドメイン適応(OSDA)は、この制限に対処する。
そこで,本研究では,共通クラスと未知クラスを識別するための自己評価学習に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-10T14:11:09Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - Unsupervised and self-adaptative techniques for cross-domain person
re-identification [82.54691433502335]
非重複カメラにおける人物再識別(ReID)は難しい課題である。
Unsupervised Domain Adaptation(UDA)は、ソースで訓練されたモデルから、IDラベルアノテーションなしでターゲットドメインへの機能学習適応を実行するため、有望な代替手段です。
本稿では,新しいオフライン戦略によって生成されたサンプルのトリプレットを利用する,UDAベースのReID手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T23:58:39Z) - Adversarial Style Mining for One-Shot Unsupervised Domain Adaptation [43.351728923472464]
One-Shot Unsupervised Domain Adaptationは、適応を学ぶ際に、ラベルなしのターゲットサンプルをひとつだけ利用できると仮定する。
従来の適応手法は、ラベル付けされていないターゲットデータの不足により失敗する傾向にある。
そこで我々は,スタイル転送モジュールとタスク固有モジュールを組み合わせた新しいアドリラルスタイルマイニング手法を提案する。
論文 参考訳(メタデータ) (2020-04-13T16:18:46Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。