論文の概要: Two Simple Principles for Diffusion-Based Test-Time Adaptation
- arxiv url: http://arxiv.org/abs/2312.05274v2
- Date: Wed, 12 Mar 2025 02:19:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-13 15:37:11.117925
- Title: Two Simple Principles for Diffusion-Based Test-Time Adaptation
- Title(参考訳): 拡散型テスト時間適応のための2つの簡単な原理
- Authors: Kaiyu Song, Hanjiang Lai, Yan Pan, Kun Yue, Jian Yin,
- Abstract要約: 拡散に基づくテスト時間適応(TTA)は、未知のテスト領域の画像をトレーニング領域にマッピングするために拡散モデルを活用する、大きな進歩を示している。
本稿では拡散法の設計手法の2つの簡単な原理を解明する。
単純だが効果的な拡散誘導型試験時間適応法(PDDA)を提案する。
- 参考スコア(独自算出の注目度): 13.634043135217254
- License:
- Abstract: Recently, diffusion-based test-time adaptations (TTA) have shown great advances, which leverage a diffusion model to map the images in the unknown test domain to the training domain. The unseen and diverse test domains make diffusion-based TTA an ill-posed problem. In this paper, we unravel two simple principles of the design tricks for diffusion-based methods. Intuitively, \textit{Principle 1} says semantic similarity preserving. We should preserve the semantic similarity between the original and generated test images. \textit{Principle 2} suggests minimal modifications. This principle enables the diffusion to map the test images to the training domain with minimal modifications of the test images. In particular, following the two principles, we propose our simple yet effective principle-guided diffusion-based test-time adaptation method (PDDA). Concretely, following Principle 1, we propose a semantic keeper, the method to preserve feature similarity, where the semantic keeper could filter the corruption introduced from the test domain, thus better preserving the semantics. Following Principle 2, we propose a modification keeper, where we introduce a regularization constraint into the generative process to minimize modifications to the test image. Meanwhile, there is a hidden conflict between the two principles. We further introduce the gradient-based view to unify the direction generated from two principles. Extensive experiments on CIFAR-10C, CIFAR-100C, ImageNet-W, and ImageNet-C with WideResNet-28-10, ResNet-50, Swin-T, and ConvNext-T demonstrate that PDDA significantly performs better than the complex state-of-the-art baselines. Specifically, PDDA achieves 2.4\% average accuracy improvements in ImageNet-C without any training process.
- Abstract(参考訳): 近年,拡散に基づくテスト時間適応 (TTA) は,未知のテスト領域の画像をトレーニング領域にマッピングするために拡散モデルを活用するなど,大きな進歩を見せている。
目に見えない多彩なテスト領域は拡散ベースのTTAを不適切な問題にしている。
本稿では拡散法の設計手法の2つの簡単な原理を解明する。
直感的には、 \textit{Principle 1} は意味的類似性を保存する。
元のテストイメージと生成されたテストイメージのセマンティックな類似性を維持する必要がある。
\textit{Principle 2} は最小限の変更を提案する。
この原理により、拡散により、テストイメージの最小限の変更で、テストイメージをトレーニング領域にマッピングすることができる。
特に,2つの原則に従えば,本手法は単純かつ効果的な拡散誘導型試験時間適応法 (PDDA) を提案する。
具体的には、セマンティック・キーパー(セマンティック・キーパー)を提案し、セマンティック・キーパー(セマンティック・キーパー)は、セマンティック・キーパー(セマンティック・キーパー)がテスト・ドメインから導入された腐敗をフィルタリングし、セマンティック・キーパー(セマンティック・キーパー)をよりよく保存する。
原則2に従って、我々は、テスト画像の変更を最小限に抑えるために、生成プロセスに正規化制約を導入する修正キーパを提案する。
一方、この2つの原則の間には隠れた対立がある。
さらに、勾配に基づく視点を導入し、2つの原則から生じる方向を統一する。
CIFAR-10C, CIFAR-100C, ImageNet-W, ImageNet-C with WideResNet-28-10, ResNet-50, Swin-T, ConvNext-Tの大規模な実験により、PDDAは複雑な最先端ベースラインよりも大幅に性能が向上したことが示された。
具体的には、PDDAはトレーニングプロセスなしで、ImageNet-Cの平均精度を2.4\%向上させる。
関連論文リスト
- Everything to the Synthetic: Diffusion-driven Test-time Adaptation via Synthetic-Domain Alignment [81.78901060731269]
テスト時間適応(TTA)は、これまで見つからなかった、シフトしたターゲットドメイン上でのソースドメイン事前訓練モデルの性能を改善することを目的としている。
従来のTTA手法は、主にターゲットデータストリームに基づいてモデルの重みを適応し、ターゲットデータの量と順序に敏感なモデル性能を実現する。
最近提案された拡散駆動型TTA法は、モデル入力を重みに代えて適応することでこれを緩和し、ソースドメイン上で訓練された無条件拡散モデルにより、ターゲットドメインデータをソースドメインに近似する合成ドメインに変換する。
論文 参考訳(メタデータ) (2024-06-06T17:39:09Z) - Source-Free Domain Adaptation with Diffusion-Guided Source Data Generation [6.087274577167399]
本稿では、ソースフリードメイン適応(DM-SFDA)のための拡散モデルの一般化可能性を活用する新しいアプローチを提案する。
提案するDMSFDA法では,事前学習したテキスト・画像拡散モデルを微調整し,ソース・ドメイン・イメージを生成する。
私たちは、Office-31、Office-Home、VisDAなど、さまざまなデータセットにわたる包括的な実験を通じて、このアプローチを検証する。
論文 参考訳(メタデータ) (2024-02-07T14:56:13Z) - Turn Down the Noise: Leveraging Diffusion Models for Test-time
Adaptation via Pseudo-label Ensembling [2.5437028043490084]
テスト時間適応の目標は、ソースデータに頼ることなく、継続的に変化するターゲットドメインにソース予測モデルを適用することである。
本稿では,事前学習した拡散モデルを用いて,対象領域の画像がソース領域に近づくように投影する手法を提案する。
論文 参考訳(メタデータ) (2023-11-29T20:35:32Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Back to the Source: Diffusion-Driven Test-Time Adaptation [77.4229736436935]
テスト時間適応はテスト入力を利用し、シフトしたターゲットデータ上でテストした場合、ソースデータに基づいてトレーニングされたモデルの精度を向上させる。
代わりに、生成拡散モデルを用いて、すべてのテスト入力をソース領域に向けて投影することで、ターゲットデータを更新する。
論文 参考訳(メタデータ) (2022-07-07T17:14:10Z) - Source-Free Domain Adaptation via Distribution Estimation [106.48277721860036]
ドメイン適応は、ラベル付きソースドメインから学んだ知識を、データ分散が異なるラベル付きターゲットドメインに転送することを目的としています。
近年,ソースフリードメイン適応 (Source-Free Domain Adaptation, SFDA) が注目されている。
本研究では,SFDA-DEと呼ばれる新しいフレームワークを提案し,ソース分布推定によるSFDAタスクに対処する。
論文 参考訳(メタデータ) (2022-04-24T12:22:19Z) - Distill and Fine-tune: Effective Adaptation from a Black-box Source
Model [138.12678159620248]
Unsupervised Domain Adapt (UDA) は、既存のラベル付きデータセット (source) の知識を新しいラベル付きデータセット (target) に転送することを目的としています。
Distill and Fine-tune (Dis-tune) という新しい二段階適応フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-04T05:29:05Z) - Do We Really Need to Access the Source Data? Source Hypothesis Transfer
for Unsupervised Domain Adaptation [102.67010690592011]
Unsupervised adaptUDA (UDA) は、ラベル付きソースデータセットから学んだ知識を活用して、新しいラベル付きドメインで同様のタスクを解決することを目的としている。
従来のUDAメソッドは、モデルに適応するためには、通常、ソースデータにアクセスする必要がある。
この作業は、訓練済みのソースモデルのみが利用できる実践的な環境に取り組み、ソースデータなしでそのようなモデルを効果的に活用してUDA問題を解決する方法に取り組みます。
論文 参考訳(メタデータ) (2020-02-20T03:13:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。