論文の概要: ProtoTTA: Prototype-Guided Test-Time Adaptation
- arxiv url: http://arxiv.org/abs/2604.15494v1
- Date: Thu, 16 Apr 2026 19:52:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.639085
- Title: ProtoTTA: Prototype-Guided Test-Time Adaptation
- Title(参考訳): ProtoTTA: Prototype-Guided Test-Time Adaptation
- Authors: Mohammad Mahdi Abootorabi, Parvin Mousavi, Purang Abolmaesumi, Evan Shelhamer,
- Abstract要約: 本稿では,モデル出力のみに依存するのではなく,中間プロトタイプ信号を利用するプロトタイプモデルのためのフレームワークであるProtoTTAを紹介する。
ProtoTTAは、プロトタイプの類似性分布のエントロピーを最小化し、シフトしたデータに対する信頼性とプロトタイプ固有のアクティベーションを促進する。
また、新しい解釈可能性指標と視覚言語最小化モデル(VLM)評価フレームワークを導入し、TTA力学を説明する。
- 参考スコア(独自算出の注目度): 8.178991486617972
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep networks that rely on prototypes-interpretable representations that can be related to the model input-have gained significant attention for balancing high accuracy with inherent interpretability, which makes them suitable for critical domains such as healthcare. However, these models are limited by their reliance on training data, which hampers their robustness to distribution shifts. While test-time adaptation (TTA) improves the robustness of deep networks by updating parameters and statistics, the prototypes of interpretable models have not been explored for this purpose. We introduce ProtoTTA, a general framework for prototypical models that leverages intermediate prototype signals rather than relying solely on model outputs. ProtoTTA minimizes the entropy of the prototype-similarity distribution to encourage more confident and prototype-specific activations on shifted data. To maintain stability, we employ geometric filtering to restrict updates to samples with reliable prototype activations, regularized by prototype-importance weights and model-confidence scores. Experiments across four prototypical backbones on four diverse benchmarks spanning fine-grained vision, histopathology, and NLP demonstrate that ProtoTTA improves robustness over standard output entropy minimization while restoring correct semantic focus in prototype activations. We also introduce novel interpretability metrics and a vision-language model (VLM) evaluation framework to explain TTA dynamics, confirming ProtoTTA restores human-aligned semantic focus and correlates reliably with VLM-rated reasoning quality. Code is available at: https://github.com/DeepRCL/ProtoTTA.
- Abstract(参考訳): モデル入力に関連のあるプロトタイプ解釈可能な表現に依存するディープネットワークは、固有の解釈可能性と高い精度のバランスをとるために大きな注目を集め、医療などの重要な領域に適合する。
しかし、これらのモデルはトレーニングデータへの依存によって制限されており、分散シフトへの頑丈さを損なう。
テスト時間適応(TTA)は、パラメータや統計を更新することで、ディープネットワークの堅牢性を改善するが、この目的のために解釈可能なモデルのプロトタイプは検討されていない。
本稿では,モデル出力のみに依存するのではなく,中間プロトタイプ信号を利用するプロトタイプモデルのための汎用フレームワークであるProtoTTAを紹介する。
ProtoTTAは、プロトタイプの類似性分布のエントロピーを最小化し、シフトしたデータに対する信頼性とプロトタイプ固有のアクティベーションを促進する。
安定度を維持するため, 信頼性の高いプロトタイプアクティベーションを持つサンプルの更新を, プロトタイプ重要重量とモデル信頼度スコアで正規化するために, 幾何フィルタリングを用いる。
微細な視力、病理組織学、NLPにまたがる4つの多様なベンチマークにおける4つの原型バックボーンの実験により、ProtoTTAは、プロトタイプアクティベーションにおける正しいセマンティックフォーカスを復元しながら、標準出力エントロピー最小化よりも堅牢性を向上させることを示した。
また、新しい解釈可能性指標と視覚言語モデル(VLM)評価フレームワークを導入し、TTAの力学を説明し、ProtoTTAが人間の協調した意味的焦点を復元し、VLMの推論品質と確実に相関することを確認した。
コードは、https://github.com/DeepRCL/ProtoTTAで入手できる。
関連論文リスト
- Proto-Former: Unified Facial Landmark Detection by Prototype Transformer [77.47431726595111]
Proto-Formerは、統一的で適応的でエンドツーエンドの顔ランドマーク検出フレームワークである。
統一されたアーキテクチャ内で、複数のデータセットをまたいだ共同トレーニングを可能にする。
Proto-Formerは、既存の最先端手法よりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-17T06:00:25Z) - Model Correlation Detection via Random Selection Probing [62.093777777813756]
既存の類似性に基づく手法では、モデルパラメータにアクセスしたり、しきい値なしでスコアを生成する必要がある。
本稿では,モデル相関検出を統計的テストとして定式化する仮説テストフレームワークであるランダム選択探索(RSP)を紹介する。
RSPは相関の証拠を定量化する厳密なp-値を生成する。
論文 参考訳(メタデータ) (2025-09-29T01:40:26Z) - ProtoTS: Learning Hierarchical Prototypes for Explainable Time Series Forecasting [25.219624871510376]
本稿では,高精度かつ透明な意思決定を実現する新しい解釈可能な予測フレームワークであるProtoTSを提案する。
ProtoTSは、豊富な異種情報を保存する識別表現に基づいて、インスタンス-プロトタイプの類似性を計算する。
新たにリリースされたLOFデータセットを含む、複数の現実的なベンチマークの実験は、ProtoTSが予測精度の既存のメソッドを超えるだけでなく、専門家が選択可能な解釈を提供することを示している。
論文 参考訳(メタデータ) (2025-09-27T07:10:21Z) - Probabilistic Prototype Calibration of Vision-Language Models for Generalized Few-shot Semantic Segmentation [75.18058114915327]
一般化されたFew-Shot Semanticnative(GFSS)は、いくつかの注釈付き例だけでセグメンテーションモデルを新しいクラスに拡張することを目的としている。
プリトレーニング済みCLIPのマルチモーダルプロトタイプ上での確率的プロトタイプ校正フレームワークであるFewCLIPを提案する。
FewCLIPはGFSSとクラスインクリメンタルセッティングの両方で最先端のアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2025-06-28T18:36:22Z) - Bidirectional Prototype-Reward co-Evolution for Test-Time Adaptation of Vision-Language Models [38.63571023556356]
テスト時適応(TTA)は,分散シフトに直面した場合の視覚言語モデル(VLM)の性能維持に不可欠である。
BPRE(Underline Bidirectional Prototype-Reward co-Evolution)を提案する。
BPREは、機能品質評価とプロトタイプの進化を相乗的なフィードバックループを通じて統合する。
我々のモデルは、他のSOTA法と比較して一貫して優れた性能を達成し、VLMの一般化能力を向上させる。
論文 参考訳(メタデータ) (2025-03-12T13:40:33Z) - Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。
私たちのフレームワークは、3つの新しい目標のファミリーにつながります。
Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文 参考訳(メタデータ) (2024-10-10T17:18:30Z) - Test-Time Model Adaptation with Only Forward Passes [68.11784295706995]
テストタイム適応は、トレーニング済みのモデルを、潜在的に分布シフトのある未確認テストサンプルに適応させるのに有効であることが証明されている。
テスト時間フォワード最適化適応法(FOA)を提案する。
FOAは量子化された8ビットのViTで動作し、32ビットのViTで勾配ベースのTENTより優れ、ImageNet-Cで最大24倍のメモリ削減を実現する。
論文 参考訳(メタデータ) (2024-04-02T05:34:33Z) - Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models [19.683461002518147]
Test-Time Prototype Shifting (TPS)は、未ラベルのテスト入力を使用したデータセットのテストに視覚言語モデルを適用するために設計された先駆的なアプローチである。
TPSは、その後の予測のために最適化不要なプロトタイプの再利用を促進するだけでなく、プロンプトエンジニアリングにおける現在の進歩とシームレスに統合することを可能にする。
我々のフレームワークの特筆すべき点は、従来のテキストプロンプトチューニング手法と比較して、メモリと計算要求が大幅に削減されていることである。
論文 参考訳(メタデータ) (2024-03-19T17:54:34Z) - Prototypical Contrastive Learning of Unsupervised Representations [171.3046900127166]
原型コントラスト学習(Prototypeal Contrastive Learning, PCL)は、教師なし表現学習法である。
PCLは暗黙的にデータのセマンティック構造を学習された埋め込み空間にエンコードする。
PCLは、複数のベンチマークで最先端のインスタンスワイド・コントラスト学習法より優れている。
論文 参考訳(メタデータ) (2020-05-11T09:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。