論文の概要: GP-Adapter: Gaussian Process CLIP-Adapter for Few-Shot Out-of-Distribution Detection
- arxiv url: http://arxiv.org/abs/2606.07102v1
- Date: Fri, 05 Jun 2026 09:53:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.678455
- Title: GP-Adapter: Gaussian Process CLIP-Adapter for Few-Shot Out-of-Distribution Detection
- Title(参考訳): GP-Adapter:Few-Shot Out-of-Distribution DetectionのためのGaussian Process CLIP-Adapter
- Authors: Taisei Saito, Koretaka Ogata, Takafumi Hiroi,
- Abstract要約: GP-Adapterはトレーニング不要のフレームワークで、数ショットの分類とアウト・オブ・ディストリビューション検出のための不確実性モデリングでCLIPを拡張している。
GP-Adapterは、競合する数ショットのパフォーマンスを提供し、即時学習ベースラインと組み合わせた場合のOOD検出を一貫して改善することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose GP-Adapter, a training-free framework that augments CLIP (Contrastive Language-Image Pre-training) with Gaussian Process (GP) uncertainty modeling for few-shot classification and out-of-distribution (OOD) detection. While CLIP achieves strong zero-shot recognition, it yields deterministic similarity scores and offers limited uncertainty information, which is critical under distribution shift and data scarcity. GP-Adapter constructs modality-specific, class-wise one-class GPs on top of frozen CLIP embeddings using an RBF kernel for image features and a linear kernel for text prompts and fuses their predictive statistics to produce a variance-aware confidence score for OOD detection. The method requires no fine-tuning of the CLIP backbone and relies only on a small $K$-shot cache and lightweight hyperparameter selection, with memory cost scaling as $O(CK^2)$ for $C$ classes and $K$ shots. Experiments on ImageNet and multiple OOD benchmarks show that GP-Adapter provides competitive few-shot performance and consistently improves OOD detection when combined with prompt-learning baselines, highlighting the complementarity between GP-based uncertainty modeling and prompt learning. Overall, our results suggest that integrating probabilistic inference with large pre-trained vision-language models can improve reliability in low-data and distribution-shifted settings. Code is available at https://github.com/tms-byte/GP-Adapter
- Abstract(参考訳): GP-AdapterはCLIP(Contrastive Language- Image Pre-training)を拡張し,ガウス過程(GP)不確実性モデルを用いて,少数ショットの分類とアウト・オブ・ディストリビューション(OOD)の検出を行う。
CLIPは強力なゼロショット認識を実現するが、決定論的類似性スコアを獲得し、分散シフトやデータ不足において重要な、限られた不確実性情報を提供する。
GP-Adapterは、画像特徴のためのRBFカーネルとテキストプロンプトのための線形カーネルを使用して、凍結したCLIP埋め込みの上に、モダリティ固有のクラスワイドGPを構築し、その予測統計を融合して、OOD検出のための分散認識信頼スコアを生成する。
このメソッドは、CLIPのバックボーンを微調整する必要がなく、小さな$K$のキャッシュと軽量なハイパーパラメータ選択のみに依存し、メモリコストは$O(CK^2)$ for $C$クラスと$K$shotsである。
ImageNetと複数のOODベンチマークの実験によると、GP-Adapterは競合的な数ショットのパフォーマンスを提供し、即時学習ベースラインと組み合わせることで、OOD検出を一貫して改善し、GPベースの不確実性モデリングと即時学習の相補性を強調している。
以上の結果から,大規模な事前学習型視覚言語モデルと確率的推論を統合することにより,低データおよび分散シフト設定における信頼性が向上することが示唆された。
コードはhttps://github.com/tms-byte/GP-Adapterで入手できる。
関連論文リスト
- Benchmarking Few-shot Transferability of Pre-trained Models with Improved Evaluation Protocols [123.73663884421272]
より強力な事前訓練モデルと改良された適応アルゴリズムによって、わずかなショット転送が革新されている。
FEWTRANSは10種類のデータセットを含む総合的なベンチマークである。
FEWTRANS をリリースすることにより,数発の転写学習研究において再現性の向上を合理化するための厳密な "ルーラー" の提供を目指す。
論文 参考訳(メタデータ) (2026-02-28T05:41:57Z) - Conformalized Gaussian processes for online uncertainty quantification over graphs [27.90282886573793]
グラフ上の不確実性定量化(UQ)は、ネットワーク科学における多くの安全クリティカルな応用に現れる。
我々は、ランダム特徴(RF)に基づくカーネル近似を利用して、新しいグラフ対応パラメトリックGPモデルを考案する。
誤特定をモデル化するためのロバストなカバレッジを確保するため,我々はGPベースの集合予測器をオンラインコンフォメーション予測フレームワークを用いて検討した。
論文 参考訳(メタデータ) (2025-10-07T17:44:13Z) - Knowledge Regularized Negative Feature Tuning of Vision-Language Models for Out-of-Distribution Detection [54.433899174017185]
信頼性の高い機械学習モデルを構築するには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
我々はKR-NFT(Knowledge Regularized Negative Feature Tuning)と呼ばれる新しい手法を提案する。
NFTは、事前訓練されたテキスト特徴に分布認識変換を適用し、正および負の特徴を異なる空間に効果的に分離する。
ImageNetデータセットから数発のサンプルをトレーニングすると、KR-NFTはID分類精度とOOD検出を改善するだけでなく、FPR95を5.44%削減する。
論文 参考訳(メタデータ) (2025-07-26T07:44:04Z) - DeepRV: Accelerating spatiotemporal inference with pre-trained neural priors [0.0]
我々は、ハイパーRV推定を含む完全なGP精度と密に一致したニューラルネットワークサロゲートであるDeepRVを紹介する。
シミュレーションされたベンチマーク全体を通じて、DeepRVは非分離プログラミングを達成し、ロンドンの教育不足に対する現実世界の応用を実現している。
すべての実験は、1つのコンシューマグレードのGPU上で実行され、実践者のアクセシビリティを保証する。
論文 参考訳(メタデータ) (2025-03-27T13:04:41Z) - BayesAdapter: enhanced uncertainty estimation in CLIP few-shot adaptation [30.435971066422706]
最先端のCLIPアダプタの識別性能は,その不確実性評価能力と必ずしも相関しないことを示す。
ベイズ推定を利用して1点ではなく全確率分布を推定するベイズアダプタを導入する。
本手法は, キャリブレーションと選択的分類において, 精度の高い不確実性推定値を得る。
論文 参考訳(メタデータ) (2024-12-12T20:48:06Z) - Adapting Contrastive Language-Image Pretrained (CLIP) Models for
Out-of-Distribution Detection [1.597617022056624]
本研究では,視覚的アウトオブディストリビューション(OOD)検出のための事前訓練された特徴抽出器に関する総合的研究を行った。
我々は,OOD検出のための視覚言語モデルに適応するスタイリット擬似ラベル探索(PLP)と呼ばれる,シンプルでスケーラブルな新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-10T10:02:18Z) - Interactive Segmentation as Gaussian Process Classification [58.44673380545409]
クリックベースのインタラクティブセグメンテーション(IS)は、ユーザインタラクション下で対象オブジェクトを抽出することを目的としている。
現在のディープラーニング(DL)ベースの手法のほとんどは、主にセマンティックセグメンテーションの一般的なパイプラインに従っている。
本稿では,各画像上でガウス過程(GP)に基づく画素単位のバイナリ分類モデルとしてISタスクを定式化することを提案する。
論文 参考訳(メタデータ) (2023-02-28T14:01:01Z) - Weighted Ensembles for Active Learning with Adaptivity [60.84896785303314]
本稿では,ラベル付きデータに漸進的に適応した重み付きGPモデルのアンサンブルについて述べる。
この新しいEGPモデルに基づいて、不確実性および不一致ルールに基づいて、一連の取得関数が出現する。
適応的に重み付けされたEGPベースの取得関数のアンサンブルも、さらなる性能向上のために導入されている。
論文 参考訳(メタデータ) (2022-06-10T11:48:49Z) - Incremental Ensemble Gaussian Processes [53.3291389385672]
本稿では,EGPメタラーナーがGP学習者のインクリメンタルアンサンブル(IE-) GPフレームワークを提案し,それぞれが所定のカーネル辞書に属するユニークなカーネルを持つ。
各GP専門家は、ランダムな特徴ベースの近似を利用してオンライン予測とモデル更新を行い、そのスケーラビリティを生かし、EGPメタラーナーはデータ適応重みを生かし、熟練者ごとの予測を合成する。
新たなIE-GPは、EGPメタラーナーおよび各GP学習者内における構造化力学をモデル化することにより、時間変化関数に対応するように一般化される。
論文 参考訳(メタデータ) (2021-10-13T15:11:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。