論文の概要: TTL: Test-time Textual Learning for OOD Detection with Pretrained Vision-Language Models
- arxiv url: http://arxiv.org/abs/2604.15756v1
- Date: Fri, 17 Apr 2026 06:59:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.776026
- Title: TTL: Test-time Textual Learning for OOD Detection with Pretrained Vision-Language Models
- Title(参考訳): TTL:事前学習型視覚言語モデルを用いたOOD検出のためのテスト時テキスト学習
- Authors: Jinlun Ye, Jiang Liao, Runhe Lai, Xinhua Lu, Jiaxin Zhuang, Zhiyong Gan, Ruixuan Wang,
- Abstract要約: 我々は、未ラベルのテストストリームからOODテキストセマンティクスを学習するフレームワークであるTest-time Textual Learning (TTL)を紹介した。
TTLが学習可能なプロンプトを更新し、擬似ラベル付きテストサンプルを使用して新しいOOD知識をキャプチャする。
9つのOODデータセットを持つ2つの標準ベンチマークの実験は、TTLが一貫して最先端のパフォーマンスを達成することを示した。
- 参考スコア(独自算出の注目度): 10.528374873160702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision-language models (VLMs) such as CLIP exhibit strong Out-of-distribution (OOD) detection capabilities by aligning visual and textual representations. Recent CLIP-based test-time adaptation methods further improve detection performance by incorporating external OOD labels. However, such labels are finite and fixed, while the real OOD semantic space is inherently open-ended. Consequently, fixed labels fail to represent the diverse and evolving OOD semantics encountered in test streams. To address this limitation, we introduce Test-time Textual Learning (TTL), a framework that dynamically learns OOD textual semantics from unlabeled test streams, without relying on external OOD labels. TTL updates learnable prompts using pseudo-labeled test samples to capture emerging OOD knowledge. To suppress noise introduced by pseudo-labels, we introduce an OOD knowledge purification strategy that selects reliable OOD samples for adaptation while suppressing noise. In addition, TTL maintains an OOD Textual Knowledge Bank that stores high-quality textual features, providing stable score calibration across batches. Extensive experiments on two standard benchmarks with nine OOD datasets demonstrate that TTL consistently achieves state-of-the-art performance, highlighting the value of textual adaptation for robust test-time OOD detection. Our code is available at https://github.com/figec/TTL.
- Abstract(参考訳): CLIPのような視覚言語モデル(VLM)は、視覚的およびテキスト的表現を整列することで、強力なアウト・オブ・ディストリビューション(OOD)検出能力を示す。
最近のCLIPベースのテスト時間適応法は、外部OODラベルを組み込んだ検出性能をさらに向上する。
しかし、そのようなラベルは有限で固定的であり、実際の OOD 意味空間は本質的に開である。
その結果、固定ラベルは、テストストリームで発生する多様で進化するOODセマンティクスを表現できない。
この制限に対処するために、テスト時テキスト学習(TTL)というフレームワークを導入する。これは、外部のOODラベルに頼ることなく、ラベルのないテストストリームからOODテキストセマンティクスを動的に学習するフレームワークである。
TTLが学習可能なプロンプトを更新し、擬似ラベル付きテストサンプルを使用して新しいOOD知識をキャプチャする。
擬似ラベルが導入したノイズを抑制するため,ノイズを抑えながら信頼性の高いOODサンプルを選択するOOD知識浄化戦略を導入する。
さらにTTLは、高品質なテキスト機能を格納し、バッチ間で安定したスコアキャリブレーションを提供するOOD Textual Knowledge Bankを維持している。
9つのOODデータセットを持つ2つの標準ベンチマークに関する大規模な実験は、TTLが一貫して最先端のパフォーマンスを実現し、堅牢なテスト時間OOD検出のためのテキスト適応の価値を強調していることを示している。
私たちのコードはhttps://github.com/figec/TTLで公開されています。
関連論文リスト
- Mind the Way You Select Negative Texts: Pursuing the Distance Consistency in OOD Detection with VLMs [80.03370593724422]
Out-of-Distribution (OOD) は未知のクラスからサンプルを識別する。
現在の手法では、否定的なテキストとIDラベルを比較するなど、OOD検出中にモード内距離を組み込むことが多い。
テキストおよび視覚的視点から一貫したモーダル距離拡張を体系的に利用するフレームワークであるInterNegを提案する。
論文 参考訳(メタデータ) (2026-03-03T05:44:47Z) - Graph Out-of-Distribution Detection via Test-Time Calibration with Dual Dynamic Dictionaries [15.43092254877282]
グラフアウト・オブ・ディストリビューション(OOD)検出の鍵となる課題は、トレーニング中に接地トルースOODサンプルが存在しないことである。
動的に動的に更新された辞書を用いてOODスコアを校正する,BaCaと呼ばれる新しいテスト時間グラフOOD検出法を提案する。
BaCaは、OOD検出における既存の最先端メソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-11-17T16:14:48Z) - SimLabel: Consistency-Guided OOD Detection with Pretrained Vision-Language Models [7.90233294809002]
視覚言語モデル(VLM)における意味関連IDラベル間の画像テキスト理解能力について検討する。
我々は,IDとアウト・オブ・ディストリビューション(OOD)の分離性を高めるために,SimLabelと呼ばれる新しいポストホック戦略を提案する。
本実験は,様々なゼロショットOOD検出ベンチマークにおいて,SimLabelの優れた性能を示す。
論文 参考訳(メタデータ) (2025-01-20T13:36:30Z) - AdaNeg: Adaptive Negative Proxy Guided OOD Detection with Vision-Language Models [15.754054667010468]
事前学習された視覚言語モデルは、負のラベルをガイダンスとして使用することにより、配布外サンプル(OOD)を特定するのに効果的である。
我々は,実際のOOD画像の探索により,テスト中に動的に生成されるテクスタダプティブな負のプロキシを提案する。
AUROCは2.45%増加し,FPR95は6.48%低下した。
論文 参考訳(メタデータ) (2024-10-26T11:20:02Z) - Rethinking the Evaluation of Out-of-Distribution Detection: A Sorites Paradox [70.57120710151105]
既存のアウト・オブ・ディストリビューション(OOD)検出ベンチマークは、サンプルを新しいラベルでOODデータとして分類する。
いくつかの限界OODサンプルは、実際には分布内(ID)サンプルに密接なセマンティック内容を持ち、OODサンプルをソリテスパラドックス(英語版)と判定する。
この問題に対処するため,Incremental Shift OOD (IS-OOD) というベンチマークを構築した。
論文 参考訳(メタデータ) (2024-06-14T09:27:56Z) - Learning Transferable Negative Prompts for Out-of-Distribution Detection [22.983892817676495]
負のプロンプトを学習するための新しいOOD検出手法「NegPrompt」を提案する。
外部の外れ値データに依存することなく、IDデータのみでそのような負のプロンプトを学習する。
さまざまなImageNetベンチマークの実験では、NegPromptが最先端のプロンプトベースのOOD検出方法を上回ることが示されている。
論文 参考訳(メタデータ) (2024-04-04T07:07:34Z) - Negative Label Guided OOD Detection with Pretrained Vision-Language Models [96.67087734472912]
Out-of-distriion (OOD) は未知のクラスからサンプルを識別することを目的としている。
我々は,大規模なコーパスデータベースから大量の負のラベルを抽出する,NegLabelと呼ばれる新しいポストホックOOD検出手法を提案する。
論文 参考訳(メタデータ) (2024-03-29T09:19:52Z) - Estimating Soft Labels for Out-of-Domain Intent Detection [122.68266151023676]
Out-of-Domain (OOD)インテント検出は,実際の対話システムにおいて重要である。
擬似OODサンプルに対するソフトラベルを推定できる適応型ソフト擬似ラベル法(ASoul)を提案する。
論文 参考訳(メタデータ) (2022-11-10T13:31:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。