論文の概要: Dual Feature Decoupling for Fine-Grained OOD Detection
- arxiv url: http://arxiv.org/abs/2606.05536v1
- Date: Thu, 04 Jun 2026 00:38:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.451076
- Title: Dual Feature Decoupling for Fine-Grained OOD Detection
- Title(参考訳): 微細なOOD検出のためのデュアル特徴デカップリング
- Authors: Xiaokun Li, Yaping Huang, Qingji Guan,
- Abstract要約: 我々は,OOD検出の微粒化に対処する新しいDual Feature Decoupling Network (DFDNet)を提案する。
DFDNetは、空間周波数デカップリングモジュールと再構成誘導デカップリングモジュールの2つのキーコンポーネントを含む。
提案手法は,複数のデータセット上での競合性能向上を実現する。
- 参考スコア(独自算出の注目度): 21.94764693480303
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Out-of-distribution detection (OOD) is an indispensable technique when applying machine learning models to real-world scenarios. Most existing OOD detection methods have been developed under the idealized assumption of large inter-class distributional differences, while largely overlooking fine-grained tasks characterized by subtle variations, such as medical image classification and vehicle recognition. The high visual similarity among fine-grained subcategories, together with the interference of background factors, makes OOD detection extremely challenging. To tackle this problem, we propose a novel Dual Feature Decoupling Network (DFDNet), which addresses fine-grained OOD detection from the perspective of feature disentanglement. The proposed DFDNet comprises two key components: a spatial-frequency decoupling module and a reconstruction-guided decoupling module. The spatial-frequency decoupling module is designed to preserve content features that are discriminative for classification while suppressing task-irrelevant style information. On the other hand, the reconstruction-guided decoupling module introduces a novel pixel-level adversarial reconstruction task to further remove low-level, non-discriminative information and enhance category-specific high-level semantic representations. Extensive experiments demonstrate that our method achieves competitive performance improvements on multiple datasets.
- Abstract(参考訳): Out-of-distriion Detection (OOD)は、機械学習モデルを現実のシナリオに適用する上で、必須のテクニックである。
既存のOOD検出法の多くは、医用画像分類や車両認識などの微妙な変化を特徴とするきめ細かなタスクを概ね見極めつつ、クラス間の分布差が大きいという理想的な仮定の下で開発された。
微粒なサブカテゴリ間の高い視覚的類似性は、背景因子の干渉とともに、OOD検出を極めて困難にしている。
この問題に対処するために,2次元特徴分離ネットワーク (DFDNet) を提案する。
提案するDFDNetは,空間周波数デカップリングモジュールと再構成誘導デカップリングモジュールの2つのキーコンポーネントから構成される。
空間周波数デカップリングモジュールは、タスク非関連スタイル情報を抑えつつ、分類に識別可能なコンテンツ特徴を保存するように設計されている。
一方、再構成誘導デカップリングモジュールは、低レベル、非識別情報をさらに除去し、カテゴリ固有の高レベルセマンティック表現を強化するために、新しい画素レベルの逆変換タスクを導入している。
大規模な実験により,本手法は複数のデータセット上での競合性能の向上を実証した。
関連論文リスト
- UniV2D: Bridging Visual Restoration and Semantic Perception for Underwater Salient Object Detection [71.83097731030254]
視覚的回復と有能な物体検出を協調的に最適化するUnified Vision-to-Detection Network (UniV2D)を提案する。
UniV2Dは、セマンティック駆動学習パラダイムを導入している。
定量評価と定性評価の両方において最先端の手法を著しく上回る。
論文 参考訳(メタデータ) (2026-05-08T02:31:45Z) - Source-Free Object Detection with Detection Transformer [59.33653163035064]
Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。
ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。
本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文 参考訳(メタデータ) (2025-10-13T07:35:04Z) - Equipping Vision Foundation Model with Mixture of Experts for Out-of-Distribution Detection [36.97738113847375]
OOD検出のための代表的視覚基盤モデルについて検討する。
事前訓練されたDINOv2モデルは、OOD検出のための高度に識別可能な特徴空間を自然に提供する。
ドメイン内(ID)データの微調整基盤モデルにより、OODの検出が向上する。
サブスペースに分割するMixture of Feature Experts (MoFE) モジュールを提案する。
論文 参考訳(メタデータ) (2025-10-12T13:00:53Z) - Hierarchical Mask-Enhanced Dual Reconstruction Network for Few-Shot Fine-Grained Image Classification [7.4334395431083715]
階層型マスク強化デュアルリコンストラクションネットワーク(HMDRN)を提案する。
HMDRNは、異なるネットワーク階層からの補完的な視覚情報を活用する二重層機能再構成と融合モジュールを組み込んでいる。
3つの挑戦的なきめ細かいデータセットの実験は、HDRNが最先端の手法を一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-06-25T09:15:59Z) - Toward Multi-class Anomaly Detection: Exploring Class-aware Unified Model against Inter-class Interference [67.36605226797887]
統一型異常検出(MINT-AD)のためのマルチクラスインプリシトニューラル表現変換器を提案する。
マルチクラス分布を学習することにより、モデルが変換器デコーダのクラス対応クエリ埋め込みを生成する。
MINT-ADは、カテゴリと位置情報を特徴埋め込み空間に投影することができ、さらに分類と事前確率損失関数によって監督される。
論文 参考訳(メタデータ) (2024-03-21T08:08:31Z) - You Only Train Once: A Unified Framework for Both Full-Reference and No-Reference Image Quality Assessment [45.62136459502005]
本稿では,完全な参照 (FR) と非参照 (NR) IQA を行うネットワークを提案する。
まず、入力画像から多レベル特徴を抽出するためにエンコーダを用いる。
FRおよびNR入力のユニバーサルアダプタとして階層的注意(HA)モジュールを提案する。
エンコーダの浅い層と深い層との間の特徴相関を調べるために, セマンティック・ディストーション・アウェア (SDA) モジュールを提案する。
論文 参考訳(メタデータ) (2023-10-14T11:03:04Z) - Improving Out-of-Distribution Detection with Disentangled Foreground and Background Features [23.266183020469065]
本稿では,IDトレーニングサンプルから前景と背景の特徴を密接な予測手法によって切り離す新しいフレームワークを提案する。
これは、様々な既存のOOD検出メソッドとシームレスに組み合わせられる汎用フレームワークである。
論文 参考訳(メタデータ) (2023-03-15T16:12:14Z) - WDiscOOD: Out-of-Distribution Detection via Whitened Linear Discriminant
Analysis [21.023001428704085]
本稿では,クラス固有情報とクラス非依存情報に基づく新しい特徴空間OOD検出スコアを提案する。
WDiscOODという手法の有効性を,大規模なImageNet-1kベンチマークで検証した。
論文 参考訳(メタデータ) (2023-03-14T00:13:57Z) - Modulating Localization and Classification for Harmonized Object
Detection [40.82723262074911]
2つのタスクを変調する相互学習フレームワークを提案する。
特に,2つのタスクは,新たな相互ラベル付け戦略によって互いに学習することを余儀なくされる。
COCOデータセットのベースライン検出器に対する大幅なパフォーマンス向上を実現しました。
論文 参考訳(メタデータ) (2021-03-16T10:36:02Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。