論文の概要: Enhancing Few-Shot Out-of-Distribution Detection via the Refinement of Foreground and Background
- arxiv url: http://arxiv.org/abs/2601.15065v1
- Date: Wed, 21 Jan 2026 15:12:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.412038
- Title: Enhancing Few-Shot Out-of-Distribution Detection via the Refinement of Foreground and Background
- Title(参考訳): 前景と背景の微細化による分布検出の高速化
- Authors: Tianyu Li, Songyue Cai, Zongqian Wu, Ping Hu, Xiaofeng Zhu,
- Abstract要約: 本稿では,CLIPをベースとしたフォアグラウンド・バックグラウンド(FG-BG)分解のための新しいプラグイン・アンド・プレイフレームワークを提案する。
背景領域では、既存の手法では全てのパッチに対して均一な抑制戦略を採用しており、予測に対する異なるパッチの様々な貢献を見越している。
前景の地域では、既存の手法では、一部のローカルパッチが他のクラスと外観や意味的類似性を示す可能性があると適切に考慮できないため、トレーニングプロセスを誤解させる可能性がある。
- 参考スコア(独自算出の注目度): 22.29204897783237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: CLIP-based foreground-background (FG-BG) decomposition methods have demonstrated remarkable effectiveness in improving few-shot out-of-distribution (OOD) detection performance. However, existing approaches still suffer from several limitations. For background regions obtained from decomposition, existing methods adopt a uniform suppression strategy for all patches, overlooking the varying contributions of different patches to the prediction. For foreground regions, existing methods fail to adequately consider that some local patches may exhibit appearance or semantic similarity to other classes, which may mislead the training process. To address these issues, we propose a new plug-and-play framework. This framework consists of three core components: (1) a Foreground-Background Decomposition module, which follows previous FG-BG methods to separate an image into foreground and background regions; (2) an Adaptive Background Suppression module, which adaptively weights patch classification entropy; and (3) a Confusable Foreground Rectification module, which identifies and rectifies confusable foreground patches. Extensive experimental results demonstrate that the proposed plug-and-play framework significantly improves the performance of existing FG-BG decomposition methods. Code is available at: https://github.com/lounwb/FoBoR.
- Abstract(参考訳): CLIP-based preeground-background (FG-BG) 分解法は, ショットアウト・オブ・ディストリビューション(OOD)検出性能の向上に顕著な効果を示した。
しかし、既存のアプローチにはいくつかの制限がある。
分解から得られた背景領域に対して、既存の手法では、予測に対する異なるパッチの様々な貢献を見越して、すべてのパッチに対して均一な抑制戦略を採用している。
前景の地域では、既存の手法では、一部のローカルパッチが他のクラスと外観や意味的類似性を示す可能性があると適切に考慮できないため、トレーニングプロセスを誤解させる可能性がある。
これらの問題に対処するため,我々は新しいプラグイン・アンド・プレイフレームワークを提案する。
本フレームワークは,(1)フォアグラウンド-背景分解モジュール,(2)パッチの分類エントロピーを適応的に重み付けする適応的背景抑圧モジュール,(3)不確定なフォアグラウンドのパッチを識別・修正する不確定なフォアグラウンド整流モジュールの3つのコアコンポーネントから構成される。
実験結果から,既存のFG-BG分解法の性能を著しく向上することを示す。
コードは、https://github.com/lounwb/FoBoR.comで入手できる。
関連論文リスト
- Background Prompt for Few-Shot Out-of-Distribution Detection [39.66477903922584]
FS-OOD検出のための新しいFG-BG分解フレームワークであるMamboを提案する。
具体的には、背景情報と画像意味情報の両方を含む局所的背景類似性を得るために、まず背景プロンプトを学習することを提案する。
局所的背景類似度と局所クラス類似度の両方を用いて背景抽出を行い,従来手法における局所クラス類似度への依存性を低減する。
論文 参考訳(メタデータ) (2025-09-25T12:03:24Z) - Mixture-of-Noises Enhanced Forgery-Aware Predictor for Multi-Face Manipulation Detection and Localization [52.87635234206178]
本稿では,多面的操作検出と局所化に適したMoNFAPという新しいフレームワークを提案する。
このフレームワークには2つの新しいモジュールが含まれている: Forgery-aware Unified Predictor (FUP) Module と Mixture-of-Noises Module (MNM)。
論文 参考訳(メタデータ) (2024-08-05T08:35:59Z) - MSP-MVS: Multi-Granularity Segmentation Prior Guided Multi-View Stereo [8.303396507129266]
MSP-MVSは,マルチグラニュラリティセグメンテーションを導入する手法である。
相関信頼画素の等価分布と分解クラスタリングを実装した。
また,グローバルな最小マッチングコストの特定を支援するために,差分サンプリングの相乗的3次元最適化も導入する。
論文 参考訳(メタデータ) (2024-07-27T19:00:44Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - PAEDID: Patch Autoencoder Based Deep Image Decomposition For Pixel-level
Defective Region Segmentation [16.519583839906904]
欠陥領域分割のための非教師パッチオートエンコーダに基づくディープ画像分解法(PAEDID)を提案する。
パッチオートエンコーダ(PAE)ネットワークにより,より深い画像として共通の背景を学習する。
提案手法を採用することにより、画像中の欠陥領域を教師なしで正確に抽出することができる。
論文 参考訳(メタデータ) (2022-03-28T02:50:06Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - Image Splicing Detection, Localization and Attribution via JPEG Primary
Quantization Matrix Estimation and Clustering [49.75353434786065]
画像領域の異なる2つのJPEGアーチファクトの不整合の検出は、しばしば局所的な画像操作を検出するために使用される。
ドナー画像の異なる領域を識別するエンド・ツー・エンドシステムを提案する。
論文 参考訳(メタデータ) (2021-02-02T11:21:49Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。