論文の概要: OpenSlot: Mixed Open-Set Recognition with Object-Centric Learning
- arxiv url: http://arxiv.org/abs/2407.02386v2
- Date: Sat, 04 Jan 2025 09:46:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:03:19.048388
- Title: OpenSlot: Mixed Open-Set Recognition with Object-Centric Learning
- Title(参考訳): OpenSlot: オープンセット認識とオブジェクト中心学習の混合
- Authors: Xu Yin, Fei Pan, Guoyuan An, Yuchi Huo, Zixuan Xie, Sung-Eui Yoon,
- Abstract要約: オープンセット認識(OSR)研究は通常、各画像は1つのクラスラベルしか含まないと仮定するが、未知のテストセットは既知のテストセットから切り離されたラベル空間を持つ。
本稿では,テスト画像が複数のクラスセマンティクスを含む混合OSR問題について紹介する。
本稿では,多様なクラスセマンティクスを表現し,クラス予測を生成するためにスロット機能を利用する,オブジェクト指向学習に基づくOpenSlotフレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.933996792254998
- License:
- Abstract: Existing open-set recognition (OSR) studies typically assume that each image contains only one class label, with the unknown test set (negative) having a disjoint label space from the known test set (positive), a scenario referred to as full-label shift. This paper introduces the mixed OSR problem, where test images contain multiple class semantics, with both known and unknown classes co-occurring in the negatives, leading to a more complex super-label shift that better reflects real-world scenarios. To tackle this challenge, we propose the OpenSlot framework, based on object-centric learning, which uses slot features to represent diverse class semantics and generate class predictions. The proposed anti-noise slot (ANS) technique helps mitigate the impact of noise (invalid or background) slots during classification training, addressing the semantic misalignment between class predictions and ground truth. We evaluate OpenSlot on both mixed and conventional OSR benchmarks. Without elaborate designs, our method not only excels existing approaches in detecting super-label shifts across OSR tasks, but also achieves state-of-the-art performance on conventional benchmarks. Meanwhile, OpenSlot can localize class objects without using bounding boxes during training, demonstrating competitive performance in open-set object detection and potential for generalization.
- Abstract(参考訳): 既存のオープンセット認識 (OSR) 研究では、各画像は1つのクラスラベルしか持たないが、未知のテストセット (負) は既知のテストセット (陽性) から切り離されたラベル空間を持ち、フルラベルシフトと呼ばれるシナリオである。
本稿では,テストイメージが複数のクラスセマンティクスを含む混合OSR問題を紹介し,未知のクラスと未知のクラスを負に共起させることにより,実世界のシナリオをよりよく反映したより複雑な超ラベルシフトを実現する。
この課題に対処するために,多様なクラスセマンティクスを表現し,クラス予測を生成するスロット機能を用いたオブジェクト中心学習に基づくOpenSlotフレームワークを提案する。
提案したアンチノイズスロット(ANS)技術は、分類訓練中のノイズ(無効またはバックグラウンド)スロットの影響を緩和し、クラス予測と基底真実のセマンティックなミスアライメントに対処する。
混合OSRベンチマークと従来OSRベンチマークの両方でOpenSlotを評価する。
精巧な設計がなければ,OSRタスク間の超ラベルシフトの検出に既存の手法を駆使するだけでなく,従来のベンチマーク上での最先端性能も達成する。
一方、OpenSlotはトレーニング中にバウンディングボックスを使わずにクラスオブジェクトをローカライズすることができ、オープンセットオブジェクト検出における競合性能と一般化の可能性を示す。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Open-Set Facial Expression Recognition [42.62439125553367]
顔表情認識(FER)モデルは一般的に、7つの基本クラスを固定したデータセットで訓練される。
最近の研究では、基本的なものよりもはるかに多くの表現が存在することが指摘されている。
オープンセットFERタスクを初めて提案する。
論文 参考訳(メタデータ) (2024-01-23T05:57:50Z) - Exploring Diverse Representations for Open Set Recognition [51.39557024591446]
オープンセット認識(OSR)では、テスト中に未知のサンプルを拒絶しながら、クローズドセットに属するサンプルを分類する必要がある。
現在、生成モデルはOSRの差別モデルよりもよく機能している。
本稿では,多種多様な表現を識別的に学習するMulti-Expert Diverse Attention Fusion(MEDAF)を提案する。
論文 参考訳(メタデータ) (2024-01-12T11:40:22Z) - IOMatch: Simplifying Open-Set Semi-Supervised Learning with Joint
Inliers and Outliers Utilization [36.102831230805755]
多くの現実世界のアプリケーションでは、ラベル付けされていないデータは必然的に、ラベル付けされたクラスのどれにも属さない、目に見えないクラスの外れ値を含む。
我々は,新しいオープンセットSSLフレームワークであるIOMatchを紹介した。
論文 参考訳(メタデータ) (2023-08-25T04:14:02Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - Class-Specific Semantic Reconstruction for Open Set Recognition [101.24781422480406]
オープンセット認識により、ディープニューラルネットワーク(DNN)は未知のクラスのサンプルを識別できる。
本稿では,自動エンコーダ(AE)とプロトタイプ学習を統合したCSSR(Class-Specific Semantic Reconstruction)を提案する。
複数のデータセットで実験を行った結果,提案手法は閉集合認識と開集合認識の両方において優れた性能を発揮することがわかった。
論文 参考訳(メタデータ) (2022-07-05T16:25:34Z) - Open-Set Representation Learning through Combinatorial Embedding [62.05670732352456]
ラベル付きクラスとラベルなしクラスの両方の例に基づく表現学習を通じて、データセットにおける新しい概念を識別することに興味がある。
異種ラベル空間上の複数の教師付きメタクラス分類器によって与えられる構成知識を用いて、自然に未知のクラス内のサンプルをクラスタリングする学習手法を提案する。
提案アルゴリズムは,未確認クラスの識別性の向上と,新しいクラスに一般化可能な既知のクラス表現の学習を併用して,新しい概念を探索する。
論文 参考訳(メタデータ) (2021-06-29T11:51:57Z) - Conditional Variational Capsule Network for Open Set Recognition [64.18600886936557]
オープンセット認識では、分類器はトレーニング時に未知の未知のクラスを検出する必要がある。
最近提案されたカプセルネットワークは、特に画像認識において、多くの分野で代替案を上回ることが示されている。
本提案では,訓練中,同じ既知のクラスのカプセルの特徴を,事前に定義されたガウス型に適合させることを推奨する。
論文 参考訳(メタデータ) (2021-04-19T09:39:30Z) - Hybrid Models for Open Set Recognition [28.62025409781781]
オープンセット認識は、トレーニングセット内のどのクラスにも属さないサンプルを検出するために分類器を必要とする。
本稿では,入力データを結合埋め込み空間にエンコードするエンコーダと,サンプルを不整クラスに分類する分類器と,フローベース密度推定器からなるOpenHybridを提案する。
標準オープンセットベンチマークの実験では、エンドツーエンドの訓練されたOpenHybridモデルは最先端の手法やフローベースのベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2020-03-27T16:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。