論文の概要: ANTS: Shaping the Adaptive Negative Textual Space by MLLM for OOD Detection
- arxiv url: http://arxiv.org/abs/2509.03951v1
- Date: Thu, 04 Sep 2025 07:26:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:10.085889
- Title: ANTS: Shaping the Adaptive Negative Textual Space by MLLM for OOD Detection
- Title(参考訳): ANTS:OOD検出のためのMLLMによる適応的負テキスト空間形成
- Authors: Zhu Wenjie, Zhang Yabin, Xin Jin, Wenjun Zeng, Lei Zhang,
- Abstract要約: マルチモーダル大言語モデル(MLLM)を用いた適応負テキスト空間(ANTS)の作成を提案する。
我々のANTSはFPR95を4.2%削減し、新しい最先端技術を確立しました。
- 参考スコア(独自算出の注目度): 22.041770912984372
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The introduction of negative labels (NLs) has proven effective in enhancing Out-of-Distribution (OOD) detection. However, existing methods often lack an understanding of OOD images, making it difficult to construct an accurate negative space. In addition, the presence of false negative labels significantly degrades their near-OOD performance. To address these issues, we propose shaping an Adaptive Negative Textual Space (ANTS) by leveraging the understanding and reasoning capabilities of multimodal large language models (MLLMs). Specifically, we identify images likely to be OOD samples as negative images and prompt the MLLM to describe these images, generating expressive negative sentences that precisely characterize the OOD distribution and enhance far-OOD detection. For the near-OOD setting, where OOD samples resemble the in-distribution (ID) subset, we first identify the subset of ID classes that are visually similar to negative images and then leverage the reasoning capability of MLLMs to generate visually similar negative labels tailored to this subset, effectively reducing false negatives and improving near-OOD detection. To balance these two types of negative textual spaces, we design an adaptive weighted score that enables the method to handle different OOD task settings (near-OOD and far-OOD) without relying on task-specific prior knowledge, making it highly adaptable in open environments. On the ImageNet benchmark, our ANTS significantly reduces the FPR95 by 4.2\%, establishing a new state-of-the-art. Furthermore, our method is training-free and zero-shot, enabling high scalability.
- Abstract(参考訳): 負のラベル(NLs)の導入は、アウト・オブ・ディストリビューション(OOD)の検出を高めるのに有効であることが証明されている。
しかし、既存の手法ではOOD画像の理解が欠如しており、正確な負の空間を構築することは困難である。
さらに、偽陰性ラベルの存在は、その近OOD性能を著しく低下させる。
これらの問題に対処するために,マルチモーダル大言語モデル(MLLM)の理解と推論能力を活用することで,適応的負のテクスチャ空間(ANTS)を形成することを提案する。
具体的には、OODサンプルである可能性のある画像を負の画像として識別し、MLLMにこれらの画像を記述するように促し、OOD分布を正確に特徴づける表現的負の文を生成し、遠方OD検出を強化する。
OODサンプルが非分布(ID)サブセットに類似する近OOD設定では、まず、負の画像と視覚的に類似したIDクラスのサブセットを特定し、次にMLLMの推論能力を活用して、このサブセットに適合した視覚的に類似した負ラベルを生成し、偽陰性を効果的に低減し、近OOD検出を改善する。
これら2種類の負のテキスト空間のバランスをとるために,タスク固有の事前知識に頼らずにOODタスク設定の異なるタスク設定(近OODと遠OOD)を処理可能な適応重み付きスコアを設計し,オープン環境において高い適応性を実現する。
ImageNetベンチマークでは、当社のANTSがFPR95を4.2\%削減し、新たな最先端技術を確立しています。
さらに,本手法はトレーニングフリーでゼロショットであり,高いスケーラビリティを実現する。
関連論文リスト
- Adaptive Multi-prompt Contrastive Network for Few-shot Out-of-distribution Detection [4.938957922033169]
アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)データセットでトレーニングされたモデルが利用できない出力を生成するのを防ぐために、アウト・オブ・ディストリビューション(OOD)サンプルを区別する試みである。
ほとんどのOOD検出方法は、トレーニングのために多くのIDサンプルを必要とし、実際の応用を著しく制限する。
クラス間およびクラス内分布の学習により,ID-OOD分離境界に適応する適応型マルチプロンプトコントラストネットワーク(AMCN)を提案する。
論文 参考訳(メタデータ) (2025-06-21T08:31:29Z) - AdaNeg: Adaptive Negative Proxy Guided OOD Detection with Vision-Language Models [15.754054667010468]
事前学習された視覚言語モデルは、負のラベルをガイダンスとして使用することにより、配布外サンプル(OOD)を特定するのに効果的である。
我々は,実際のOOD画像の探索により,テスト中に動的に生成されるテクスタダプティブな負のプロキシを提案する。
AUROCは2.45%増加し,FPR95は6.48%低下した。
論文 参考訳(メタデータ) (2024-10-26T11:20:02Z) - Rethinking the Evaluation of Out-of-Distribution Detection: A Sorites Paradox [70.57120710151105]
既存のアウト・オブ・ディストリビューション(OOD)検出ベンチマークは、サンプルを新しいラベルでOODデータとして分類する。
いくつかの限界OODサンプルは、実際には分布内(ID)サンプルに密接なセマンティック内容を持ち、OODサンプルをソリテスパラドックス(英語版)と判定する。
この問題に対処するため,Incremental Shift OOD (IS-OOD) というベンチマークを構築した。
論文 参考訳(メタデータ) (2024-06-14T09:27:56Z) - Iterative Deployment Exposure for Unsupervised Out-of-Distribution Detection [5.019613806273252]
Iterative Deployment Exposure (IDE)は、アウト・オブ・ディストリビューション(OOD)検出のための、新しくより現実的な設定である。
CSOは、マハラノビス距離と最寄りのアプローチを組み合わせた新しいU-OODスコアリング関数を使用している。
提案手法は, 医用画像の3つのモダリティに対して, 強いベースラインで大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2024-06-04T13:57:34Z) - Negative Label Guided OOD Detection with Pretrained Vision-Language Models [96.67087734472912]
Out-of-distriion (OOD) は未知のクラスからサンプルを識別することを目的としている。
我々は,大規模なコーパスデータベースから大量の負のラベルを抽出する,NegLabelと呼ばれる新しいポストホックOOD検出手法を提案する。
論文 参考訳(メタデータ) (2024-03-29T09:19:52Z) - Rethinking Out-of-distribution (OOD) Detection: Masked Image Modeling is
All You Need [52.88953913542445]
簡単な再構築手法を用いることで,OOD検出の性能が大幅に向上する可能性が示唆された。
我々は、OOD検出フレームワーク(MOOD)のプリテキストタスクとして、マスケ画像モデリング(Masked Image Modeling)を採用する。
論文 参考訳(メタデータ) (2023-02-06T08:24:41Z) - A Simple Test-Time Method for Out-of-Distribution Detection [45.11199798139358]
本稿では,OOD検出のための簡易なテスト時間線形訓練法を提案する。
分布外である入力画像の確率は、ニューラルネットワークが抽出した特徴と驚くほど線形に相関していることがわかった。
本稿では,提案手法のオンライン版を提案し,実世界のアプリケーションでより実用的な性能を実現する。
論文 参考訳(メタデータ) (2022-07-17T16:02:58Z) - Robust Out-of-distribution Detection for Neural Networks [51.19164318924997]
既存の検出機構は, 分布内およびOOD入力の評価において, 極めて脆弱であることを示す。
ALOE と呼ばれる実効性のあるアルゴリズムを提案する。このアルゴリズムは,逆向きに構築された逆数と外数の両方の例にモデルを公開することにより,堅牢なトレーニングを行う。
論文 参考訳(メタデータ) (2020-03-21T17:46:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。