論文の概要: Test-Time Modification: Inverse Domain Transformation for Robust Perception
- arxiv url: http://arxiv.org/abs/2512.13454v1
- Date: Mon, 15 Dec 2025 15:51:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.733867
- Title: Test-Time Modification: Inverse Domain Transformation for Robust Perception
- Title(参考訳): テスト時間修正:ロバスト知覚のための逆ドメイン変換
- Authors: Arpit Jadon, Joshua Niemeijer, Yuki M. Asano,
- Abstract要約: 生成基礎モデルには幅広い視覚的知識が含まれており、多様な画像のバリエーションを生成できる。
実験時に拡散モデルを用いて、下流モデルがトレーニングされたソース分布にターゲットイメージをマッピングする。
このアプローチは、ソースドメイン記述のみを必要とし、タスクモデルを保持し、大規模な合成データ生成を排除します。
- 参考スコア(独自算出の注目度): 29.29601766599788
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative foundation models contain broad visual knowledge and can produce diverse image variations, making them particularly promising for advancing domain generalization tasks. While they can be used for training data augmentation, synthesizing comprehensive target-domain variations remains slow, expensive, and incomplete. We propose an alternative: using diffusion models at test time to map target images back to the source distribution where the downstream model was trained. This approach requires only a source domain description, preserves the task model, and eliminates large-scale synthetic data generation. We demonstrate consistent improvements across segmentation, detection, and classification tasks under challenging environmental shifts in real-to-real domain generalization scenarios with unknown target distributions. Our analysis spans multiple generative and downstream models, including an ensemble variant for enhanced robustness. The method achieves substantial relative gains: 137% on BDD100K-Night, 68% on ImageNet-R, and 62% on DarkZurich.
- Abstract(参考訳): 生成基礎モデルには幅広い視覚的知識が含まれており、様々な画像のバリエーションを生成できるため、特に領域の一般化タスクを進める上で有望である。
データ拡張のトレーニングに使用することができるが、包括的なターゲットドメインのバリエーションの合成は遅く、高価で、不完全なままである。
実験時に拡散モデルを用いて、下流モデルがトレーニングされたソース分布にターゲットイメージをマッピングする。
このアプローチは、ソースドメイン記述のみを必要とし、タスクモデルを保持し、大規模な合成データ生成を排除します。
我々は,未知のターゲット分布を持つ実領域一般化シナリオにおいて,環境変化の挑戦によるセグメント化,検出,分類タスクにおける一貫した改善を示す。
我々の分析は、強靭性向上のためのアンサンブル変種を含む、複数の生成モデルと下流モデルにまたがる。
BDD100K-Nightは137%、ImageNet-Rは68%、DarkZurichは62%である。
関連論文リスト
- Prompt-Free Conditional Diffusion for Multi-object Image Augmentation [45.92182911052815]
マルチオブジェクト画像拡張のためのプロンプトフリー条件付き拡散フレームワークを提案する。
具体的には、画像から意味を抽出し、テキストを置換するローカル・グローバル・セマンティック・フュージョン戦略を導入する。
また、モデルトレーニングにおける従来の再建損失を支援するために、報酬モデルに基づく計数損失を設計する。
論文 参考訳(メタデータ) (2025-07-08T16:27:48Z) - Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [81.93945602120453]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - Domain Generalized Recaptured Screen Image Identification Using SWIN Transformer [1.024113475677323]
ケースケードデータ拡張とSWIN変換器領域一般化フレームワーク(DAST-DG)を提案する。
特徴生成装置は、様々な領域の正像を識別不能にするために訓練される。
このプロセスは、再適応された画像に適用され、二重対角学習セットを生成する。
論文 参考訳(メタデータ) (2024-07-24T11:22:02Z) - FDS: Feedback-guided Domain Synthesis with Multi-Source Conditional Diffusion Models for Domain Generalization [19.0284321951354]
ドメイン一般化技術は、トレーニング中に新しいデータ分布をシミュレートすることで、モデルロバスト性を高めることを目的としている。
本稿では、拡散モデルを用いて新しい擬似ドメインを合成するFDS、フィードバック誘導ドメイン合成法を提案する。
本手法は, 領域一般化性能のベンチマークを, 様々な課題のあるデータセットに分けて設定することを示す。
論文 参考訳(メタデータ) (2024-07-04T02:45:29Z) - Reliable Source Approximation: Source-Free Unsupervised Domain Adaptation for Vestibular Schwannoma MRI Segmentation [38.529892690603006]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、最近、医療画像領域適応に焦点をあてている。
本稿では、ソースライクで構造保存された画像を対象領域から生成できるReliable Source Approximation (RSA)を提案する。
RSAは、他の最先端のSFUDAメソッドよりも一貫してドメイン適応性能を改善している。
論文 参考訳(メタデータ) (2024-05-25T07:29:09Z) - Improving Diversity in Zero-Shot GAN Adaptation with Semantic Variations [61.132408427908175]
0ショットのGAN適応は、よく訓練されたジェネレータを再利用して、目に見えないターゲットドメインの画像を合成することを目的としている。
実際の画像の代わりに1つの代表的テキスト機能しか持たないため、合成された画像は徐々に多様性を損なう。
そこで本研究では,CLIP空間における対象テキストの意味的変化を見つけるための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-21T08:12:28Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Few-shot Image Generation with Elastic Weight Consolidation [53.556446614013105]
少ないショット画像生成は、利用可能なトレーニング例がほとんどなく、与えられたドメインのより多くのデータを生成することを目指している。
対象ドメインのいくつかの例に、追加のパラメータを導入することなく、事前訓練されたモデルを適用する。
我々は,異なる対象領域の高品質な結果を生成することにより,アルゴリズムの有効性を実証する。
論文 参考訳(メタデータ) (2020-12-04T18:57:13Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。