論文の概要: BackMix: Regularizing Open Set Recognition by Removing Underlying Fore-Background Priors
- arxiv url: http://arxiv.org/abs/2503.17717v1
- Date: Sat, 22 Mar 2025 10:23:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:36:48.334508
- Title: BackMix: Regularizing Open Set Recognition by Removing Underlying Fore-Background Priors
- Title(参考訳): BackMix: 事前の事前設定を削除してオープンセット認識を正規化
- Authors: Yu Wang, Junxian Mu, Hongzhi Huang, Qilong Wang, Pengfei Zhu, Qinghua Hu,
- Abstract要約: オープンセット認識(OSR)は、実世界のアプリケーションのための未知のサンプルを検出しながら、既知のサンプルを分類するモデルを必要とする。
既存の研究では、OSRモデルを正規化するために補助データセットから未知のサンプルを使用することで、驚くべき進歩が見られるが、それらは既知の外れ値を選択することに敏感であることが証明されている。
本研究では,画像の前景と背景の異なる背景を混合し,背景の背景を除去する新しい手法であるBackMixを提案する。
- 参考スコア(独自算出の注目度): 50.09148454840245
- License:
- Abstract: Open set recognition (OSR) requires models to classify known samples while detecting unknown samples for real-world applications. Existing studies show impressive progress using unknown samples from auxiliary datasets to regularize OSR models, but they have proved to be sensitive to selecting such known outliers. In this paper, we discuss the aforementioned problem from a new perspective: Can we regularize OSR models without elaborately selecting auxiliary known outliers? We first empirically and theoretically explore the role of foregrounds and backgrounds in open set recognition and disclose that: 1) backgrounds that correlate with foregrounds would mislead the model and cause failures when encounters 'partially' known images; 2) Backgrounds unrelated to foregrounds can serve as auxiliary known outliers and provide regularization via global average pooling. Based on the above insights, we propose a new method, Background Mix (BackMix), that mixes the foreground of an image with different backgrounds to remove the underlying fore-background priors. Specifically, BackMix first estimates the foreground with class activation maps (CAMs), then randomly replaces image patches with backgrounds from other images to obtain mixed images for training. With backgrounds de-correlated from foregrounds, the open set recognition performance is significantly improved. The proposed method is quite simple to implement, requires no extra operation for inferences, and can be seamlessly integrated into almost all of the existing frameworks. The code is released on https://github.com/Vanixxz/BackMix.
- Abstract(参考訳): オープンセット認識(OSR)は、実世界のアプリケーションのための未知のサンプルを検出しながら、既知のサンプルを分類するモデルを必要とする。
既存の研究では、OSRモデルを正規化するために補助データセットから未知のサンプルを使用することで、驚くべき進歩が見られるが、それらは既知の外れ値を選択することに敏感であることが証明されている。
本稿では、上記の問題を新しい視点から論じる:OSRモデルを補助的外乱を精巧に選択せずに正規化できるか?
私たちはまず、オープンセット認識における前景と背景の役割を経験的、理論的に探求し、それを開示します。
1) 前景と相関する背景は、モデルが「部分的に」既知の画像に遭遇すると失敗する可能性がある。
2) 前景とは無関係な背景は, 補助的な外装として機能し, グローバル平均プールによる正規化が可能である。
以上の知見に基づいて,画像の前景と背景の異なる背景を混合し,背景の背景を除去する新たな手法であるBackMixを提案する。
具体的には、BackMixはまず、クラスアクティベーションマップ(CAM)で前景を推定し、その後、画像パッチを他の画像の背景にランダムに置き換えて、トレーニング用の混合画像を取得する。
前景とは無関係な背景により、オープンセット認識性能が大幅に向上する。
提案手法は実装が非常に簡単で,推論に余分な操作を必要とせず,既存のフレームワークのほとんどすべてにシームレスに統合できる。
コードはhttps://github.com/Vanixxz/BackMix.comで公開されている。
関連論文リスト
- Is Foreground Prototype Sufficient? Few-Shot Medical Image Segmentation with Background-Fused Prototype [40.062825908232185]
Few-shot Semantic(FSS)は、トレーニング済みモデルを新しいクラスに適応するために、クラス毎に1つのラベル付きトレーニングサンプルをラベル付けする。
医用画像におけるFSSのための新しいプラガブルバックグラウンドフューズプロトタイプ(Bro)を提案する。
Bro氏はこの背景を2つのピボット設計で組み込んでいる。具体的には、FeaC(FeaC)は、クエリイメージとのクロスアテンションを利用して、最初にサポートイメージのノイズを低減します。
チャネルグループに基づくアテンション機構によりこれを実現し、敵構造は粗大な核融合を促進する。
論文 参考訳(メタデータ) (2024-12-04T02:51:22Z) - BackMix: Mitigating Shortcut Learning in Echocardiography with Minimal Supervision [1.3708815960776262]
本稿では,BackMix という,シンプルで効果的なバックグラウンド拡張手法を提案する。
背景を結果と無関係にすることで、モデルは超音波セクター内のデータに集中することを学ぶ。
提案手法を半教師付き環境で拡張し, セグメンテーションラベルの5%以下で, BackMixの正の効果が維持されていることを確認した。
論文 参考訳(メタデータ) (2024-06-27T13:06:47Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Learning to Detect Every Thing in an Open World [139.78830329914135]
我々は、Learning to Detect Every Thing (LDET)と呼ぶ、シンプルながら驚くほど強力なデータ拡張とトレーニングスキームを提案する。
可視だがラベル付けされていない背景オブジェクトの隠蔽を避けるため、元の画像の小さな領域から採取した背景画像上に注釈付きオブジェクトを貼り付ける。
LDETは、オープンワールドのインスタンスセグメンテーションタスクにおいて、多くのデータセットに大きな改善をもたらす。
論文 参考訳(メタデータ) (2021-12-03T03:56:06Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - The Blessings of Unlabeled Background in Untrimmed Videos [66.99259967869065]
Weakly-supervised Temporal Action Localization (WTAL)は、トレーニング中に利用可能なビデオレベルのアクションラベルのみを使用して、アクションインスタンスの間隔を検出することを目的としています。
重要な課題は、ビデオレベルでも照合されていない背景セグメントから関心のセグメントを区別する方法です。
そこで本稿では,PCA をベースとした時空間平滑化 PCA (TS-PCA) の創始者を提案する。
論文 参考訳(メタデータ) (2021-03-24T13:34:42Z) - Noise or Signal: The Role of Image Backgrounds in Object Recognition [93.55720207356603]
我々は、ImageNetイメージ上の前景と背景信号をアンタングリングするためのツールキットを作成する。
a)モデルが背景のみに依存して非自明な精度が得られること、(b)モデルが正しく分類された前景が存在する場合でも、しばしば画像の分類を誤っていること、が分かる。
論文 参考訳(メタデータ) (2020-06-17T16:54:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。