論文の概要: OpenSlot: Mixed Open-set Recognition with Object-centric Learning
- arxiv url: http://arxiv.org/abs/2407.02386v1
- Date: Tue, 2 Jul 2024 16:00:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-03 14:46:41.852615
- Title: OpenSlot: Mixed Open-set Recognition with Object-centric Learning
- Title(参考訳): OpenSlot: オープンセット認識とオブジェクト中心学習の混在
- Authors: Xu Yin, Fei Pan, Guoyuan An, Yuchi Huo, Zixuan Xie, Sung-Eui Yoon,
- Abstract要約: オープンセット認識(OSR)研究は通常、各画像は1つのクラスラベルしか持たず、未知のテストセット(負)は既知のテストセット(正)から切り離されたラベル空間を持つと仮定する。
本稿では、テスト画像が複数のクラスセマンティクスを含み、既知のクラスと未知のクラスが負に共起する混合OSR問題を紹介する。
オブジェクト指向学習に基づくOpenSlotフレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.933996792254998
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Existing open-set recognition (OSR) studies typically assume that each image contains only one class label, and the unknown test set (negative) has a disjoint label space from the known test set (positive), a scenario termed full-label shift. This paper introduces the mixed OSR problem, where test images contain multiple class semantics, with known and unknown classes co-occurring in negatives, leading to a more challenging super-label shift. Addressing the mixed OSR requires classification models to accurately distinguish different class semantics within images and measure their "knowness". In this study, we propose the OpenSlot framework, built upon object-centric learning. OpenSlot utilizes slot features to represent diverse class semantics and produce class predictions. Through our proposed anti-noise-slot (ANS) technique, we mitigate the impact of noise (invalid and background) slots during classification training, effectively addressing the semantic misalignment between class predictions and the ground truth. We conduct extensive experiments with OpenSlot on mixed & conventional OSR benchmarks. Without elaborate designs, OpenSlot not only exceeds existing OSR studies in detecting super-label shifts across single & multi-label mixed OSR tasks but also achieves state-of-the-art performance on conventional benchmarks. Remarkably, our method can localize class objects without using bounding boxes during training. The competitive performance in open-set object detection demonstrates OpenSlot's ability to explicitly explain label shifts and benefits in computational efficiency and generalization.
- Abstract(参考訳): 既存のオープンセット認識(OSR)研究は通常、各画像は1つのクラスラベルしか含まないと仮定し、未知のテストセット(負)は既知のテストセット(正)から切り離されたラベル空間を持ち、フルラベルシフトと呼ばれるシナリオを持つ。
本稿では,テストイメージが複数のクラスセマンティクスを含む混合OSR問題について紹介する。
混合OSRに対処するには、画像内の異なるクラスのセマンティクスを正確に識別し、それらの「既知のもの」を測定するための分類モデルが必要である。
本研究では,オブジェクト指向学習に基づくOpenSlotフレームワークを提案する。
OpenSlotはスロット機能を使用して、多様なクラスセマンティクスを表現し、クラス予測を生成する。
提案手法により,分類学習におけるノイズ(非有意および背景)スロットの影響を軽減し,クラス予測と基底真理とのセマンティックな相違を効果的に解決する。
混合OSRベンチマークにおけるOpenSlotの広範な実験を行った。
精巧な設計がなければ、OpenSlotはシングルラベルとマルチラベルの混合OSRタスク間の超ラベルシフトを検出する既存のOSR研究を超えるだけでなく、従来のベンチマークで最先端のパフォーマンスを達成する。
注目すべきは、トレーニング中にバウンディングボックスを使わずにクラスオブジェクトをローカライズできることだ。
オープンセットオブジェクト検出における競合性能は、計算効率と一般化におけるラベルシフトと利点を明確に説明できるOpenSlotの能力を示している。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Open-Set Facial Expression Recognition [42.62439125553367]
顔表情認識(FER)モデルは一般的に、7つの基本クラスを固定したデータセットで訓練される。
最近の研究では、基本的なものよりもはるかに多くの表現が存在することが指摘されている。
オープンセットFERタスクを初めて提案する。
論文 参考訳(メタデータ) (2024-01-23T05:57:50Z) - Exploring Diverse Representations for Open Set Recognition [51.39557024591446]
オープンセット認識(OSR)では、テスト中に未知のサンプルを拒絶しながら、クローズドセットに属するサンプルを分類する必要がある。
現在、生成モデルはOSRの差別モデルよりもよく機能している。
本稿では,多種多様な表現を識別的に学習するMulti-Expert Diverse Attention Fusion(MEDAF)を提案する。
論文 参考訳(メタデータ) (2024-01-12T11:40:22Z) - IOMatch: Simplifying Open-Set Semi-Supervised Learning with Joint
Inliers and Outliers Utilization [36.102831230805755]
多くの現実世界のアプリケーションでは、ラベル付けされていないデータは必然的に、ラベル付けされたクラスのどれにも属さない、目に見えないクラスの外れ値を含む。
我々は,新しいオープンセットSSLフレームワークであるIOMatchを紹介した。
論文 参考訳(メタデータ) (2023-08-25T04:14:02Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - Class-Specific Semantic Reconstruction for Open Set Recognition [101.24781422480406]
オープンセット認識により、ディープニューラルネットワーク(DNN)は未知のクラスのサンプルを識別できる。
本稿では,自動エンコーダ(AE)とプロトタイプ学習を統合したCSSR(Class-Specific Semantic Reconstruction)を提案する。
複数のデータセットで実験を行った結果,提案手法は閉集合認識と開集合認識の両方において優れた性能を発揮することがわかった。
論文 参考訳(メタデータ) (2022-07-05T16:25:34Z) - Open-Set Representation Learning through Combinatorial Embedding [62.05670732352456]
ラベル付きクラスとラベルなしクラスの両方の例に基づく表現学習を通じて、データセットにおける新しい概念を識別することに興味がある。
異種ラベル空間上の複数の教師付きメタクラス分類器によって与えられる構成知識を用いて、自然に未知のクラス内のサンプルをクラスタリングする学習手法を提案する。
提案アルゴリズムは,未確認クラスの識別性の向上と,新しいクラスに一般化可能な既知のクラス表現の学習を併用して,新しい概念を探索する。
論文 参考訳(メタデータ) (2021-06-29T11:51:57Z) - Conditional Variational Capsule Network for Open Set Recognition [64.18600886936557]
オープンセット認識では、分類器はトレーニング時に未知の未知のクラスを検出する必要がある。
最近提案されたカプセルネットワークは、特に画像認識において、多くの分野で代替案を上回ることが示されている。
本提案では,訓練中,同じ既知のクラスのカプセルの特徴を,事前に定義されたガウス型に適合させることを推奨する。
論文 参考訳(メタデータ) (2021-04-19T09:39:30Z) - Hybrid Models for Open Set Recognition [28.62025409781781]
オープンセット認識は、トレーニングセット内のどのクラスにも属さないサンプルを検出するために分類器を必要とする。
本稿では,入力データを結合埋め込み空間にエンコードするエンコーダと,サンプルを不整クラスに分類する分類器と,フローベース密度推定器からなるOpenHybridを提案する。
標準オープンセットベンチマークの実験では、エンドツーエンドの訓練されたOpenHybridモデルは最先端の手法やフローベースのベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2020-03-27T16:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。