論文の概要: NegAS: Negative Label Guided Attention and Scoring for Out-of-Distribution Object Detection with Vision-Language Models
- arxiv url: http://arxiv.org/abs/2606.22537v1
- Date: Sun, 21 Jun 2026 14:50:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:41:15.12562
- Title: NegAS: Negative Label Guided Attention and Scoring for Out-of-Distribution Object Detection with Vision-Language Models
- Title(参考訳): NegAS:視覚言語モデルを用いた分布外物体検出のための負のラベルガイド・アテンション・スコーリング
- Authors: Yingjie Zhang, Shuai Li, Peng Wang,
- Abstract要約: アウト・オブ・ディストリビューション(OOD)検出は、安全クリティカルなアプリケーションにおけるオブジェクト検出システムの堅牢性と信頼性を保証するために不可欠である。
従来の研究は主に一様検出器や視覚言語モデル(VLM)に基づく分類器に焦点を合わせてきたが、OODシナリオにおけるVLMに基づく物体検出装置の可能性はまだ検討されていない。
我々は,VLM検出器に特有の2つの課題を識別する: (i) テキスト誘導アテンションはIDラベルで前景を増強するが,背景を均一に扱い, (ii) シグモノイドをベースとしたマルチラベル出力はソフトマックスベースのOODスコアと互換性がない。
- 参考スコア(独自算出の注目度): 10.936920515353107
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Out-of-Distribution (OOD) detection is essential for ensuring the robustness and reliability of object detection systems deployed in safety-critical applications. While prior research has mainly focused on uni-modal detectors or vision-language model (VLM) based classifiers, the potential of VLM-based object detectors in OOD scenarios remains underexplored. In this work, we take the first step toward building OOD object detection methods upon VLMs. We identify two challenges specific to VLM detectors: (i) their text-guided attention enhances foreground with ID labels but treats background uniformly, leaving potential OOD regions unexploited for separating in-distribution (ID) from OOD instances; and (ii) their sigmoid-based multi-label outputs are incompatible with softmax-based OOD scores, calling for scoring functions consistent with VLM probabilistic outputs. Hence, we introduce Negative Label Guided Attention and Scoring (NegAS). To address (i), we propose a negative label guided attention module (NegA), where LLM-generated, visually-similar but semantically-different negative labels are used to guide attention toward potential OOD background regions. To address (ii), we introduce a novel sigmoid-based OOD scoring function (NegS) that leverages both ID and negative labels, producing strong responses for ID instances and suppressed responses for OOD ones. Extensive experiments demonstrate that our approach improves OOD detection performance by a large margin while maintaining ID accuracy, e.g., reducing the FPR95 by 11.4% on the COCO dataset and 25.5% on the OpenImages dataset compared to the baseline model. While initially designed for dense VLM detectors like YOLO-World, we successfully adapt NegAS to Grounding DINO, a query-based VLM transformer and achieve significant improvements, demonstrating the generalizability of our framework.
- Abstract(参考訳): Out-of-Distribution (OOD) 検出は、安全クリティカルなアプリケーションにデプロイされるオブジェクト検出システムの堅牢性と信頼性を保証するために不可欠である。
従来の研究は主に一様検出器や視覚言語モデル(VLM)に基づく分類器に焦点を合わせてきたが、OODシナリオにおけるVLMに基づく物体検出装置の可能性はまだ検討されていない。
本研究では,VLM 上で OOD オブジェクト検出手法を構築するための第一歩を踏み出す。
VLM検出器に特有の2つの課題を特定します。
i) テキスト誘導による注意は、IDラベルで前景を強化するが、背景を均一に扱い、OODインスタンスからID(In-distribution)を分離するための潜在的OOD領域を未開示のまま残す。
(II) それらのシグモイドに基づくマルチラベル出力は、ソフトマックスに基づくOODスコアと互換性がなく、VLM確率出力と整合したスコア関数を求める。
そこで我々はNegAS(Negative Label Guided Attention and Scoring)を紹介した。
宛て
i) 陰性ラベル誘導注意モジュール (NegA) を提案し, 視覚的に類似するが, 意味的に異なる負のラベルを用いて, 潜在的OOD背景領域への注意を誘導する。
宛て
(II) 新規なシグモイドを用いたOODスコアリング機能 (NegS) を導入し, ID と負のラベルを併用し,ID インスタンスに対する強い応答と OOD の応答を抑制する。
大規模な実験では,ID精度を維持しながらOOD検出性能を大きく向上し,COCOデータセットではFPR95が11.4%,OpenImagesデータセットでは25.5%削減された。
当初、YOLO-Worldのような高密度VLM検出器向けに設計されたが、我々はクエリベースのVLMトランスであるGrounding DINOにNegASを適応させることに成功し、我々のフレームワークの一般化性を実証した。
関連論文リスト
- Debiased Negative Mining Improves Out-of-distribution Detection with Pre-trained Vision-Language Models [30.819876174251863]
機械学習モデルの信頼性を高めるための重要なアプローチとして、アウト・オブ・ディストリビューション(OOD)検出が登場している。
本稿では,事前学習型視覚言語モデル(VLM)を用いたポストホックOOD検出の急激なパラダイムに焦点を当てた。
我々は, 負ラベルの分布を間接的に近似することにより, 負ラベルのサンプリングバイアスを補正する理論的枠組みを開発した。
論文 参考訳(メタデータ) (2026-05-22T15:57:56Z) - Harnessing Large Language and Vision-Language Models for Robust Out-of-Distribution Detection [11.277049921075026]
Out-of-distribution (OOD) 検出はゼロショットアプローチで大幅に進歩した。
本稿では,Far-OODシナリオとNear-OODシナリオの両方において,ゼロショットOOD検出性能を向上させる新しい手法を提案する。
本稿では,提案フレームワークを目標分布に適合させるために,新しい数発のプロンプトチューニングと視覚的プロンプトチューニングを導入する。
論文 参考訳(メタデータ) (2025-01-09T13:36:37Z) - What If the Input is Expanded in OOD Detection? [77.37433624869857]
Out-of-distriion (OOD) 検出は未知のクラスからのOOD入力を特定することを目的としている。
In-distriion(ID)データと区別するために,様々なスコアリング関数を提案する。
入力空間に異なる共通の汚職を用いるという、新しい視点を導入する。
論文 参考訳(メタデータ) (2024-10-24T06:47:28Z) - MarvelOVD: Marrying Object Recognition and Vision-Language Models for Robust Open-Vocabulary Object Detection [107.15164718585666]
開語彙検出コンテキスト下でのVLMの偏り予測の根本原因について検討した。
私たちの観察は、非常に優れたトレーニングターゲットを生成する、単純で効果的なパラダイム、コード化されたMarvelOVDにつながります。
我々の手法は、他の最先端技術よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2024-07-31T09:23:57Z) - Envisioning Outlier Exposure by Large Language Models for Out-of-Distribution Detection [71.93411099797308]
オープンワールドシナリオに機械学習モデルをデプロイする場合、アウト・オブ・ディストリビューション(OOD)サンプルは不可欠である。
本稿では,大規模言語モデル(LLM)の専門知識と推論能力を活用して,この制約に対処することを提案する。
EOEは、遠、近、きめ細かいOOD検出など、さまざまなタスクに一般化することができる。
EOEは様々なOODタスクで最先端のパフォーマンスを実現し、ImageNet-1Kデータセットに効果的にスケールできる。
論文 参考訳(メタデータ) (2024-06-02T17:09:48Z) - Negative Label Guided OOD Detection with Pretrained Vision-Language Models [96.67087734472912]
Out-of-distriion (OOD) は未知のクラスからサンプルを識別することを目的としている。
我々は,大規模なコーパスデータベースから大量の負のラベルを抽出する,NegLabelと呼ばれる新しいポストホックOOD検出手法を提案する。
論文 参考訳(メタデータ) (2024-03-29T09:19:52Z) - How Good Are LLMs at Out-of-Distribution Detection? [13.35571704613836]
アウト・オブ・ディストリビューション(OOD)検出は、機械学習(ML)モデルの信頼性を高める上で重要な役割を果たす。
本稿では,大規模言語モデル(LLM)の領域におけるOOD検出の先駆的実証研究について述べる。
論文 参考訳(メタデータ) (2023-08-20T13:15:18Z) - From Global to Local: Multi-scale Out-of-distribution Detection [129.37607313927458]
アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)トレーニングプロセス中にラベルが見られない未知のデータを検出することを目的としている。
近年の表現学習の進歩により,距離に基づくOOD検出がもたらされる。
グローバルな視覚情報と局所的な情報の両方を活用する第1のフレームワークであるマルチスケールOOD検出(MODE)を提案する。
論文 参考訳(メタデータ) (2023-08-20T11:56:25Z) - AUTO: Adaptive Outlier Optimization for Test-Time OOD Detection [79.51071170042972]
Out-of-Distribution (OOD) 検出は、任意のトレーニングインディストリビューション(ID)クラスに該当しないテストサンプルを検出することを目的としている。
データ安全性とプライバシにより、さまざまなシナリオに対して、事前にタスク固有の外れ値の収集が不可能になる。
テスト中にラベルのないデータストリームから実際のOODデータを利用することができる。
論文 参考訳(メタデータ) (2023-03-22T02:28:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。