論文の概要: Reliability-Guided Adaptive Ensembling for Robust Test-Time Adaptation
- arxiv url: http://arxiv.org/abs/2606.22351v1
- Date: Sun, 21 Jun 2026 06:20:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 18:48:45.08021
- Title: Reliability-Guided Adaptive Ensembling for Robust Test-Time Adaptation
- Title(参考訳): ロバストテスト時間適応のための信頼性誘導型適応組立
- Authors: Adam Koziak, Yuhong Guo,
- Abstract要約: テスト時間適応(TTA)は、ソースデータなしでドメインシフトを行うことができるが、逆向きに汚染されたテストストリームの下では、非常に脆弱である。
本研究は, 標準TTAと比較し, 相対的に過小評価されている, 対向ストリーム設定におけるRTTAについて検討する。
RTTAのためのトレーニング不要な信頼性誘導型拡張ラッパーSAFERを提案する。
- 参考スコア(独自算出の注目度): 21.989744597091192
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Test-time adaptation (TTA) can mitigate domain shift without source data, but it is highly brittle under adversarially contaminated test streams, where corrupted inputs also destabilize online updates. We study robust test-time adaptation (RTTA) in the adversarial-stream setting, which remains comparatively underexplored relative to standard TTA, and propose SAFER (Stochastic Augmentation Framework for Enhanced Robustness), a training-free reliability-guided augmentation wrapper for RTTA. SAFER preserves the wrapped TTA objective while replacing brittle single-view predictions with a reliability-guided pooled predictor. For each test sample, SAFER generates stochastic augmentations and aggregates their predictions through correlation-weighted pooling with outlier detection. We further study an adaptive-mixing extension that improves clean-performance retention by adjusting original-versus-augmentation weighting using feature disagreement signals. We evaluate on PACS, VLCS, and OfficeHome under PGD attacks at various attack rates. Across benchmarks, SAFER improves resilience of TTA methods to adversarial attacks while maintaining competitive clean performance.
- Abstract(参考訳): テスト時間適応(TTA)は、ソースデータなしでドメインシフトを軽減することができるが、逆向きに汚染されたテストストリームの下では高度に不安定であり、劣化した入力もオンライン更新を不安定にする。
本研究は, RTTAの信頼性向上のためのSAFER (Stochastic Augmentation Framework for Enhanced Robustness) を提案する。
SAFERは、脆弱な単一ビュー予測を信頼性誘導型プール予測器に置き換えながら、ラップされたTTA目標を保存する。
それぞれのテストサンプルに対して、SAFERは確率的拡張を生成し、相関重み付きプールと外れ値検出によって予測を集約する。
さらに,特徴不一致信号を用いた元の逆拡大重み付けを調整することにより,クリーンな性能保持を改善する適応混合拡張について検討する。
PGD攻撃時のPACS, VLCS, OfficeHomeを各種攻撃速度で評価した。
ベンチマーク全体で、SAFERは競合するクリーンパフォーマンスを維持しながら、敵攻撃に対するTTAメソッドのレジリエンスを改善している。
関連論文リスト
- MoASE++: Mixture of Activation Sparsity Experts with Domain-Adaptive On-policy Distillation for Continual Test Time Adaptation [65.068801413044]
連続的なテスト時間適応は、非定常な未ラベルのターゲットストリームにソース予測モデルを適用する。
ドメインに依存しない構造をドメイン固有のテクスチャから切り離す。
論文 参考訳(メタデータ) (2026-05-18T01:52:12Z) - FACTOR: Counterfactual Training-Free Test-Time Adaptation for Open-Vocabulary Object Detection [63.91351553178842]
FACTORはオープン語彙オブジェクト検出のためのトレーニング不要なテスト時間適応である。
属性依存性の予測を選択的に抑制するために、属性の感度、意味的関連性、予測のバリエーションを定量化する。
PASCAL-C, COCO-C, FoggyCityscapes の実験では、FACTOR が従来の TTA 法より一貫して優れていたことが示されている。
論文 参考訳(メタデータ) (2026-05-05T02:31:18Z) - FIRCE: A Framework for Intrusion Response and Conformal Evaluation [3.3271517946886924]
FIRCEは侵入応答とコンフォーマル評価のためのフレームワークである。
同型評価に基づく不確実性定量化とドリフト検出をサポートする。
我々は、FIRCEが分散シフトを検出し、モデル再トレーニングをトリガーする能力を実証する。
論文 参考訳(メタデータ) (2026-05-03T16:48:03Z) - Less Approximates More: Harmonizing Performance and Confidence Faithfulness via Hybrid Post-Training for High-Stakes Tasks [52.81286869496811]
大規模な言語モデルは、自信を持って不正確な推論が現実世界の害を引き起こすような、ハイテイクなタスクにますますデプロイされている。
内的フィードバックからの教師なし強化学習と推論・トラス誘導型推論蒸留を併用して協調的に最適化することを提案する。
PRG方式のメトリクスを用いてRDとRLIFを適応的に重み付けするハイブリッドポストトレーニングフレームワークであるHyTuningを紹介する。
論文 参考訳(メタデータ) (2026-04-09T16:50:11Z) - ThreatFormer-IDS: Robust Transformer Intrusion Detection with Zero-Day Generalization and Explainable Attribution [0.0]
IoTおよび産業ネットワークの侵入検出には、進化するトラフィックと限定されたラベルの下で信頼性を維持しながら、低い偽陽性率で稀な攻撃を検出できるモデルが必要である。
本研究では,トランスフォーマーをベースとしたシーケンシャルモデリングフレームワークThreatFormer-IDSを提案する。
時系列評価を備えたToN IoTベンチマークでは、ThreatFormer-IDSがAUCROC 0.994、AUC-PR 0.956、Recall@1%FPR 0.910を達成した。
論文 参考訳(メタデータ) (2026-02-26T23:20:42Z) - Test-Time Adaptation for Tactile-Vision-Language Models [6.918033886034668]
触覚ビジョン言語(TVL)モデルは、現実のロボットやマルチモーダルな知覚タスクにますます多くデプロイされている。
既存のテスト時間適応法は、一様条件下でのフィルタリングを提供するが、モーダルシフトの下でのモダリティの信頼性の明示的な扱いは欠如している。
本稿では,予測の不確実性と摂動に基づく応答からモダリティ毎の信頼性を推定する信頼性認識フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-31T02:26:01Z) - TTP: Test-Time Padding for Adversarial Detection and Robust Adaptation on Vision-Language Models [32.85951917559796]
本稿では, 対向検出を行う軽量な防御フレームワークであるTest-Time Padding (TTP) を提案する。
TTPは最先端のテスト時間防衛を一貫して上回り、クリーンな精度を損なうことなく敵の堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2025-12-18T13:34:14Z) - SteeringTTA: Guiding Diffusion Trajectories for Robust Test-Time-Adaptation [10.159672026403097]
テスト時間適応(TTA)は、未ラベルのテストデータを用いてモデルや入力を更新することにより、分散シフト下でのディープモデルの性能劣化を補正することを目的としている。
本稿では,Fynman-Kac ステアリングを応用し,擬似ラベルによる報酬付き分類のための拡散型入力適応を導出する推論専用フレームワークである SteeringTTA を提案する。
論文 参考訳(メタデータ) (2025-10-16T12:46:53Z) - Source-Free Domain Adaptive Object Detection with Semantics Compensation [54.00183496587841]
Weak-to-strong Semantics Compensation (WSCo)を導入する。
WSCoは、クラス関連セマンティクスを補う。
WSCoは一般的なプラグインとして実装することができ、既存のSFODパイプラインと容易に統合できます。
論文 参考訳(メタデータ) (2024-10-07T23:32:06Z) - Uncertainty-Calibrated Test-Time Model Adaptation without Forgetting [65.21599711087538]
テスト時間適応(TTA)は、与えられたモデルw.r.t.を任意のテストサンプルに適用することにより、トレーニングデータとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
事前の手法は各テストサンプルに対してバックプロパゲーションを実行するため、多くのアプリケーションに対して許容できない最適化コストがかかる。
本稿では, 有効サンプル選択基準を策定し, 信頼性および非冗長なサンプルを同定する, 効率的なアンチフォッティングテスト時間適応法を提案する。
論文 参考訳(メタデータ) (2024-03-18T05:49:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。