Fugu-MT 論文翻訳(概要): Two Simple Principles for Diffusion-Based Test-Time Adaptation

論文の概要: Two Simple Principles for Diffusion-Based Test-Time Adaptation

arxiv url: http://arxiv.org/abs/2312.05274v2
Date: Wed, 12 Mar 2025 02:19:07 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-13 21:17:52.277924
Title: Two Simple Principles for Diffusion-Based Test-Time Adaptation
Title（参考訳）: 拡散型テスト時間適応のための2つの簡単な原理
Authors: Kaiyu Song, Hanjiang Lai, Yan Pan, Kun Yue, Jian Yin,
Abstract要約: 拡散に基づくテスト時間適応(TTA)は、未知のテスト領域の画像をトレーニング領域にマッピングするために拡散モデルを活用する、大きな進歩を示している。本稿では拡散法の設計手法の2つの簡単な原理を解明する。単純だが効果的な拡散誘導型試験時間適応法(PDDA)を提案する。
参考スコア（独自算出の注目度）: 13.634043135217254
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recently, diffusion-based test-time adaptations (TTA) have shown great advances, which leverage a diffusion model to map the images in the unknown test domain to the training domain. The unseen and diverse test domains make diffusion-based TTA an ill-posed problem. In this paper, we unravel two simple principles of the design tricks for diffusion-based methods. Intuitively, \textit{Principle 1} says semantic similarity preserving. We should preserve the semantic similarity between the original and generated test images. \textit{Principle 2} suggests minimal modifications. This principle enables the diffusion to map the test images to the training domain with minimal modifications of the test images. In particular, following the two principles, we propose our simple yet effective principle-guided diffusion-based test-time adaptation method (PDDA). Concretely, following Principle 1, we propose a semantic keeper, the method to preserve feature similarity, where the semantic keeper could filter the corruption introduced from the test domain, thus better preserving the semantics. Following Principle 2, we propose a modification keeper, where we introduce a regularization constraint into the generative process to minimize modifications to the test image. Meanwhile, there is a hidden conflict between the two principles. We further introduce the gradient-based view to unify the direction generated from two principles. Extensive experiments on CIFAR-10C, CIFAR-100C, ImageNet-W, and ImageNet-C with WideResNet-28-10, ResNet-50, Swin-T, and ConvNext-T demonstrate that PDDA significantly performs better than the complex state-of-the-art baselines. Specifically, PDDA achieves 2.4\% average accuracy improvements in ImageNet-C without any training process.
Abstract（参考訳）: 近年,拡散に基づくテスト時間適応 (TTA) は,未知のテスト領域の画像をトレーニング領域にマッピングするために拡散モデルを活用するなど,大きな進歩を見せている。目に見えない多彩なテスト領域は拡散ベースのTTAを不適切な問題にしている。本稿では拡散法の設計手法の2つの簡単な原理を解明する。直感的には、 \textit{Principle 1} は意味的類似性を保存する。元のテストイメージと生成されたテストイメージのセマンティックな類似性を維持する必要がある。 \textit{Principle 2} は最小限の変更を提案する。この原理により、拡散により、テストイメージの最小限の変更で、テストイメージをトレーニング領域にマッピングすることができる。特に,2つの原則に従えば,本手法は単純かつ効果的な拡散誘導型試験時間適応法 (PDDA) を提案する。具体的には、セマンティック・キーパー(セマンティック・キーパー)を提案し、セマンティック・キーパー(セマンティック・キーパー)は、セマンティック・キーパー(セマンティック・キーパー)がテスト・ドメインから導入された腐敗をフィルタリングし、セマンティック・キーパー(セマンティック・キーパー)をよりよく保存する。原則2に従って、我々は、テスト画像の変更を最小限に抑えるために、生成プロセスに正規化制約を導入する修正キーパを提案する。一方、この2つの原則の間には隠れた対立がある。さらに、勾配に基づく視点を導入し、2つの原則から生じる方向を統一する。 CIFAR-10C, CIFAR-100C, ImageNet-W, ImageNet-C with WideResNet-28-10, ResNet-50, Swin-T, ConvNext-Tの大規模な実験により、PDDAは複雑な最先端ベースラインよりも大幅に性能が向上したことが示された。具体的には、PDDAはトレーニングプロセスなしで、ImageNet-Cの平均精度を2.4\%向上させる。

関連論文リスト

AIComposer: Any Style and Content Image Composition via Feature Integration [3.227277661633987]
クロスドメイン画像の構成は未調査のままである。本手法はテキストプロンプトを必要としないため,自然なスタイル化とシームレスな構成が可能である。本手法は,定性評価と定量的評価の両方において最先端技術より優れている。
論文参考訳（メタデータ） (2025-07-28T11:19:14Z)
F^2TTA: Free-Form Test-Time Adaptation on Cross-Domain Medical Image Classification via Image-Level Disentangled Prompt Tuning [18.58261691911925]
TTA(Test-Time Adaptation)は、未ラベルのテストデータを使用して、未表示の医療現場にソースモデルを適用するための有望なソリューションとして登場した。本稿では,F$2$TTA(Fif-Form Test-Time Adaptation)タスクについて検討する。
論文参考訳（メタデータ） (2025-07-03T08:50:56Z)
Few-Step Diffusion via Score identity Distillation [67.07985339442703]
拡散蒸留は, テキスト・ツー・イメージ(T2I)拡散モデルを促進するための有望な戦略として浮上している。既存の方法は、高分解能T2I拡散モデルを蒸留する際に、実像や教師合成画像に頼っている。教師のCFGを無効にし、偽スコアネットワークでテキストコンディショニングを除去するZero-CFGと、偽スコアネットワークで否定的なCFGを適用するAnti-CFGの2つの新しいガイダンス戦略を提案する。
論文参考訳（メタデータ） (2025-05-19T03:45:16Z)
NOFT: Test-Time Noise Finetune via Information Bottleneck for Highly Correlated Asset Creation [70.96827354717459]
拡散モデルは、テキスト・ツー・イメージ(T2I)と画像・ツー・イメージ(I2I)を生成する強力なツールを提供する。本研究では,高相関・多彩な画像を生成するため,安定拡散を用いたノイズファインチューンNOFTモジュールを提案する。
論文参考訳（メタデータ） (2025-05-18T05:09:47Z)
Generalizable Origin Identification for Text-Guided Image-to-Image Diffusion Models [39.234894330025114]
テキストインプロンプトに基づく画像の翻訳において,テキスト誘導画像から画像への拡散モデルが優れている。これは、テキスト誘導画像-画像拡散モデル(ID$2$)の原点識別タスクの導入を動機付けます。 ID$2$の直接的な解決策は、クエリと参照イメージの両方から機能を抽出し比較するために、特別なディープ埋め込みモデルをトレーニングすることである。
論文参考訳（メタデータ） (2025-01-04T20:34:53Z)
Improving Consistency in Diffusion Models for Image Super-Resolution [28.945663118445037]
拡散法における2種類の矛盾を観測する。セマンティックとトレーニング-推論の組み合わせを扱うために、ConsisSRを導入します。本手法は,既存拡散モデルにおける最先端性能を示す。
論文参考訳（メタデータ） (2024-10-17T17:41:52Z)
Everything to the Synthetic: Diffusion-driven Test-time Adaptation via Synthetic-Domain Alignment [76.44483062571611]
テスト時間適応(TTA)は、未知のシフト対象ドメインでテストする場合、ソースドメイン事前訓練モデルの性能を向上させることを目的としている。従来のTTA手法は、主にターゲットデータストリームに基づいてモデルの重みを適応し、ターゲットデータの量と順序に敏感なモデル性能を実現する。最近の拡散駆動型TTA法は非条件拡散モデルを用いて強い性能を示した。
論文参考訳（メタデータ） (2024-06-06T17:39:09Z)
Source-Free Domain Adaptation with Diffusion-Guided Source Data Generation [6.087274577167399]
本稿では、ソースフリードメイン適応(DM-SFDA)のための拡散モデルの一般化可能性を活用する新しいアプローチを提案する。提案するDMSFDA法では,事前学習したテキスト・画像拡散モデルを微調整し,ソース・ドメイン・イメージを生成する。私たちは、Office-31、Office-Home、VisDAなど、さまざまなデータセットにわたる包括的な実験を通じて、このアプローチを検証する。
論文参考訳（メタデータ） (2024-02-07T14:56:13Z)
Forgery-aware Adaptive Transformer for Generalizable Synthetic Image Detection [106.39544368711427]
本研究では,様々な生成手法から偽画像を検出することを目的とした,一般化可能な合成画像検出の課題について検討する。本稿では,FatFormerという新しいフォージェリー適応トランスフォーマー手法を提案する。提案手法は, 平均98%の精度でGANを観測し, 95%の精度で拡散モデルを解析した。
論文参考訳（メタデータ） (2023-12-27T17:36:32Z)
Exploiting Diffusion Prior for Generalizable Dense Prediction [85.4563592053464]
近年のテキスト・トゥ・イメージ(T2I)拡散モデルでは、既成の高密度予測器では予測できないことがある。我々は,事前学習したT2Iモデルを用いたパイプラインDMPを,高密度予測タスクの先駆けとして導入する。限られたドメインのトレーニングデータにもかかわらず、この手法は任意の画像に対して忠実に推定し、既存の最先端のアルゴリズムを超越する。
論文参考訳（メタデータ） (2023-11-30T18:59:44Z)
Turn Down the Noise: Leveraging Diffusion Models for Test-time Adaptation via Pseudo-label Ensembling [2.5437028043490084]
テスト時間適応の目標は、ソースデータに頼ることなく、継続的に変化するターゲットドメインにソース予測モデルを適用することである。本稿では,事前学習した拡散モデルを用いて,対象領域の画像がソース領域に近づくように投影する手法を提案する。
論文参考訳（メタデータ） (2023-11-29T20:35:32Z)
ADIR: Adaptive Diffusion for Image Reconstruction [46.838084286784195]
本研究では,拡散モデルによる事前学習を利用した条件付きサンプリング手法を提案する。次に、事前学習した拡散分極ネットワークを入力に適応させる新しいアプローチと組み合わせる。画像再構成手法の適応拡散は,超高解像度,デブロアリング,テキストベースの編集タスクにおいて,大幅な改善が達成されていることを示す。
論文参考訳（メタデータ） (2022-12-06T18:39:58Z)
ProSFDA: Prompt Learning based Source-free Domain Adaptation for Medical Image Segmentation [21.079667938055668]
医用画像分割のためのtextbfProSFDA (textbfProSFDA) 法を提案する。以上の結果から,提案したProSFDA法は,他のSFDA法よりも優れており,UDA法と同等であることが明らかとなった。
論文参考訳（メタデータ） (2022-11-21T14:57:04Z)
Divide and Contrast: Source-free Domain Adaptation via Adaptive Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。 DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文参考訳（メタデータ） (2022-11-12T09:21:49Z)
Diffusion Visual Counterfactual Explanations [51.077318228247925]
VCE(Visual Counterfactual Explanations)は、画像の決定を理解するための重要なツールである。 VCEの生成に対する現在のアプローチは、逆向きに堅牢なモデルに制限されており、しばしば非現実的なアーティファクトを含んでいる。本稿では、任意のイメージネット分類器に対して、視覚拡散対実説明(DVCE)を生成することでこれを克服する。
論文参考訳（メタデータ） (2022-10-21T09:35:47Z)
Back to the Source: Diffusion-Driven Test-Time Adaptation [77.4229736436935]
テスト時間適応はテスト入力を利用し、シフトしたターゲットデータ上でテストした場合、ソースデータに基づいてトレーニングされたモデルの精度を向上させる。代わりに、生成拡散モデルを用いて、すべてのテスト入力をソース領域に向けて投影することで、ターゲットデータを更新する。
論文参考訳（メタデータ） (2022-07-07T17:14:10Z)
Source-Free Domain Adaptation via Distribution Estimation [106.48277721860036]
ドメイン適応は、ラベル付きソースドメインから学んだ知識を、データ分散が異なるラベル付きターゲットドメインに転送することを目的としています。近年,ソースフリードメイン適応 (Source-Free Domain Adaptation, SFDA) が注目されている。本研究では,SFDA-DEと呼ばれる新しいフレームワークを提案し,ソース分布推定によるSFDAタスクに対処する。
論文参考訳（メタデータ） (2022-04-24T12:22:19Z)
DSP: Dual Soft-Paste for Unsupervised Domain Adaptive Semantic Segmentation [97.74059510314554]
セグメンテーションのための教師なしドメイン適応(UDA)は、ラベル付きソースドメインで訓練されたセグメンテーションモデルをラベル付きターゲットドメインに適応させることを目的としている。既存の手法では、大きなドメインギャップに悩まされながら、ドメイン不変の特徴を学習しようとする。本稿では,新しいDual Soft-Paste (DSP)法を提案する。
論文参考訳（メタデータ） (2021-07-20T16:22:40Z)
Distill and Fine-tune: Effective Adaptation from a Black-box Source Model [138.12678159620248]
Unsupervised Domain Adapt (UDA) は、既存のラベル付きデータセット (source) の知識を新しいラベル付きデータセット (target) に転送することを目的としています。 Distill and Fine-tune (Dis-tune) という新しい二段階適応フレームワークを提案する。
論文参考訳（メタデータ） (2021-04-04T05:29:05Z)
Manifold Regularized Dynamic Network Pruning [102.24146031250034]
本稿では,全インスタンスの多様体情報をプルーンドネットワークの空間に埋め込むことにより,冗長フィルタを動的に除去する新しいパラダイムを提案する。提案手法の有効性をいくつかのベンチマークで検証し,精度と計算コストの両面で優れた性能を示す。
論文参考訳（メタデータ） (2021-03-10T03:59:03Z)
Un-Mix: Rethinking Image Mixtures for Unsupervised Visual Representation Learning [108.999497144296]
近年の先進的な教師なし学習手法では,同じ画像から2つの「ビュー」を学習表現として比較するために,サイムズ様の枠組みを用いている。この研究は、教師なし学習においてラベル空間上の距離の概念を巻き込み、正対と負対のソフトな類似度をモデルに認識させることを目的としている。その概念的単純さにもかかわらず、この解 -- 教師なし画像混合(Un-Mix)により、変換された入力と対応する新しいラベル空間からより微妙でより堅牢で一般化された表現を学習できることを実証的に示す。
論文参考訳（メタデータ） (2020-03-11T17:59:04Z)
Do We Really Need to Access the Source Data? Source Hypothesis Transfer for Unsupervised Domain Adaptation [102.67010690592011]
Unsupervised adaptUDA (UDA) は、ラベル付きソースデータセットから学んだ知識を活用して、新しいラベル付きドメインで同様のタスクを解決することを目的としている。従来のUDAメソッドは、モデルに適応するためには、通常、ソースデータにアクセスする必要がある。この作業は、訓練済みのソースモデルのみが利用できる実践的な環境に取り組み、ソースデータなしでそのようなモデルを効果的に活用してUDA問題を解決する方法に取り組みます。
論文参考訳（メタデータ） (2020-02-20T03:13:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。