論文の概要: Panda: Test-Time Adaptation with Negative Data Augmentation
- arxiv url: http://arxiv.org/abs/2511.10481v1
- Date: Fri, 14 Nov 2025 01:53:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.888048
- Title: Panda: Test-Time Adaptation with Negative Data Augmentation
- Title(参考訳): Panda: 負のデータ拡張によるテスト時間適応
- Authors: Ruxi Deng, Wenxuan Bao, Tianxin Wei, Jingrui He,
- Abstract要約: 負データ拡張(NDA)に基づく新しいテスト時間適応(TTA)手法であるPandaを提案する。
パンダはPDA法に比べて優れた性能を示し, パンダと統合した場合, 広範囲なTTA法により大幅に性能が向上した。
- 参考スコア(独自算出の注目度): 49.426173544035414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pretrained VLMs exhibit strong zero-shot classification capabilities, but their predictions degrade significantly under common image corruptions. To improve robustness, many test-time adaptation (TTA) methods adopt positive data augmentation (PDA), which generates multiple views of each test sample to reduce prediction variance. However, these methods suffer from two key limitations. First, it introduces considerable computational overhead due to the large number of augmentations required per image. Second, it fails to mitigate prediction bias, where the model tends to predict certain classes disproportionately under corruption, as PDA operates on corrupted inputs and typically does not remove the corruption itself. To address these challenges, we propose Panda, a novel TTA method based on negative data augmentation (NDA). Unlike positive augmentations that preserve object semantics, Panda generates negative augmentations by disrupting semantic content. It divides images into patches and randomly assembles them from a shared patch pool. These negatively augmented images retain corruption-specific features while discarding object-relevant signals. We then subtract the mean feature of these negative samples from the original image feature, effectively suppressing corruption-related components while preserving class-relevant information. This mitigates prediction bias under distribution shifts. Panda allows augmentation to be shared across samples within a batch, resulting in minimal computational overhead. Panda can be seamlessly integrated into existing test-time adaptation frameworks and substantially improve their robustness. Our experiments indicate that Panda delivers superior performance compared to PDA methods, and a wide range of TTA methods exhibit significantly enhanced performance when integrated with Panda. Our code is available at https://github.com/ruxideng/Panda .
- Abstract(参考訳): 事前訓練されたVLMは、強いゼロショット分類能力を示すが、それらの予測は、一般的な画像の破損の下で著しく低下する。
ロバスト性を改善するために、多くのテスト時間適応(TTA)法では、各テストサンプルの複数のビューを生成する正のデータ拡張(PDA)を採用している。
しかし、これらの手法には2つの重要な制限がある。
第一に、画像ごとに必要となる大量の増大のために、かなりの計算オーバーヘッドを導入する。
第二に、予測バイアスの緩和には失敗するが、PDAは腐敗した入力を処理し、一般的には腐敗そのものを除去しないため、モデルがある種のクラスを不均等に予測する傾向がある。
これらの課題に対処するため,陰性データ拡張(NDA)に基づく新しいTTA手法であるPandaを提案する。
オブジェクトのセマンティクスを保存するポジティブな拡張とは異なり、Pandaはセマンティクスを乱すことでネガティブな拡張を生成する。
イメージをパッチに分割し、それらを共有パッチプールからランダムに組み立てる。
これらの負の強調画像は、被写体関連信号を捨てながら、汚職特有の特徴を保持します。
次に、これらの負のサンプルの平均的特徴を原画像特徴から抽出し、クラス関連情報を保存しつつ、汚職関連成分を効果的に抑制する。
これは分布シフトの下で予測バイアスを緩和する。
Pandaでは、バッチ内のサンプル間で拡張を共有できるため、計算オーバーヘッドは最小限に抑えられる。
Pandaは、既存のテスト時間適応フレームワークにシームレスに統合でき、その堅牢性を大幅に改善できる。
実験により,PandaはPDA法に比べて優れた性能を示し,Pandaと統合した場合,広範囲なTTA法が顕著に性能向上を示した。
私たちのコードはhttps://github.com/ruxideng/Pandaで利用可能です。
関連論文リスト
- Mint: A Simple Test-Time Adaptation of Vision-Language Models against Common Corruptions [44.25678062208464]
劣化がCLIPのイメージ埋め込みにどのように影響するかを考察し,拡散崩壊と呼ばれる一貫した現象を明らかにする。
この崩壊は性能劣化と密接に結びついており,クラス間分散は分類精度と強く相関している。
擬似ラベルに基づくクラス間分散を最大化する簡易なテスト時間適応法Mintを提案する。
論文 参考訳(メタデータ) (2025-10-25T02:55:08Z) - Uniformity First: Uniformity-aware Test-time Adaptation of Vision-language Models against Image Corruption [4.792851066169872]
ビジョン言語モデルは、トレーニングモデルと大きなギャップを持つデータセットに直面すると、依然として苦しむことが分かっています。
本稿では,センサ劣化に頑健なモデルを実現するために,情報バランスTTA (UnInfo) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2025-05-19T09:47:46Z) - Decoupled Prototype Learning for Reliable Test-Time Adaptation [50.779896759106784]
テスト時間適応(TTA)は、推論中にトレーニング済みのソースモデルをターゲットドメインに継続的に適応させるタスクである。
1つの一般的なアプローチは、推定擬似ラベルによるクロスエントロピー損失を伴う微調整モデルである。
本研究は, 各試料の分類誤差を最小化することで, クロスエントロピー損失の脆弱性がラベルノイズを引き起こすことを明らかにした。
本稿では,プロトタイプ中心の損失計算を特徴とする新しいDPL法を提案する。
論文 参考訳(メタデータ) (2024-01-15T03:33:39Z) - PandaLM: An Automatic Evaluation Benchmark for LLM Instruction Tuning Optimization [63.55408755562274]
審査用大言語モデル PandaLM は、いくつかの大きな言語モデルが与えられた優れたモデルを区別するために訓練されている。
PandaLMは、相対的簡潔さ、明快さ、指示への固執、包括性、形式性などの重要な主観的要因に対処する。
PandaLMはGPT-3.5の評価能力の93.75%、テストデータセットのF1スコアの88.28%を達成している。
論文 参考訳(メタデータ) (2023-06-08T10:41:56Z) - Covariance-aware Feature Alignment with Pre-computed Source Statistics
for Test-time Adaptation to Multiple Image Corruptions [11.859913430860335]
実世界の画像認識システムは、しばしば破損した入力画像に直面し、それが分散シフトを引き起こし、モデルの性能を低下させる。
テスト時間適応(TTA)は、この問題に対処できる設定の1つです。
本稿では,テスト中の分散ギャップに対処するために,共分散認識特徴アライメント(CAFe)と呼ばれる新しいTTA手法を提案する。
論文 参考訳(メタデータ) (2022-04-28T02:50:43Z) - Benchmarks for Corruption Invariant Person Re-identification [31.919264399996475]
本研究では,マーケット-1501,CUHK03,MSMT17,RegDB,SYSU-MM01など,単品間および多品間データセットにおける汚い不変性学習について検討した。
トランスフォーマーベースのモデルは、CNNベースのモデルと比較して、破損したイメージに対してより堅牢である。
クロスデータセットの一般化は、腐敗の堅牢性を高めることで改善される。
論文 参考訳(メタデータ) (2021-11-01T12:14:28Z) - On Interaction Between Augmentations and Corruptions in Natural
Corruption Robustness [78.6626755563546]
ImageNet-Cのパフォーマンスを大幅に改善するいくつかの新しいデータ拡張が提案されている。
我々は,類似度と性能の間に強い相関があることを示すために,最小サンプル距離(minimal sample distance)と呼ばれる拡張と腐敗の間の新たな尺度を開発した。
テストタイムの破損がImageNet-Cと知覚的に異なる場合, 破損の顕著な劣化を観察する。
以上の結果から,テストエラーは知覚的に類似した拡張をトレーニングすることで改善できる可能性が示唆された。
論文 参考訳(メタデータ) (2021-02-22T18:58:39Z) - RAIN: A Simple Approach for Robust and Accurate Image Classification
Networks [156.09526491791772]
既存の敵防衛手法の大部分は、予測精度を犠牲にして堅牢性を実現することが示されている。
本稿では,ロバストおよび高精度画像分類N(RAIN)と呼ぶ新しい前処理フレームワークを提案する。
RAINは入力に対してランダム化を適用して、モデルフォワード予測パスと後方勾配パスの関係を壊し、モデルロバスト性を改善する。
STL10 と ImageNet のデータセットを用いて、様々な種類の敵攻撃に対する RAIN の有効性を検証する。
論文 参考訳(メタデータ) (2020-04-24T02:03:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。