論文の概要: OpenSlot: Mixed Open-Set Recognition with Object-Centric Learning
- arxiv url: http://arxiv.org/abs/2407.02386v2
- Date: Sat, 04 Jan 2025 09:46:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:03:19.048388
- Title: OpenSlot: Mixed Open-Set Recognition with Object-Centric Learning
- Title(参考訳): OpenSlot: オープンセット認識とオブジェクト中心学習の混合
- Authors: Xu Yin, Fei Pan, Guoyuan An, Yuchi Huo, Zixuan Xie, Sung-Eui Yoon,
- Abstract要約: オープンセット認識(OSR)研究は通常、各画像は1つのクラスラベルしか含まないと仮定するが、未知のテストセットは既知のテストセットから切り離されたラベル空間を持つ。
本稿では,テスト画像が複数のクラスセマンティクスを含む混合OSR問題について紹介する。
本稿では,多様なクラスセマンティクスを表現し,クラス予測を生成するためにスロット機能を利用する,オブジェクト指向学習に基づくOpenSlotフレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.933996792254998
- License:
- Abstract: Existing open-set recognition (OSR) studies typically assume that each image contains only one class label, with the unknown test set (negative) having a disjoint label space from the known test set (positive), a scenario referred to as full-label shift. This paper introduces the mixed OSR problem, where test images contain multiple class semantics, with both known and unknown classes co-occurring in the negatives, leading to a more complex super-label shift that better reflects real-world scenarios. To tackle this challenge, we propose the OpenSlot framework, based on object-centric learning, which uses slot features to represent diverse class semantics and generate class predictions. The proposed anti-noise slot (ANS) technique helps mitigate the impact of noise (invalid or background) slots during classification training, addressing the semantic misalignment between class predictions and ground truth. We evaluate OpenSlot on both mixed and conventional OSR benchmarks. Without elaborate designs, our method not only excels existing approaches in detecting super-label shifts across OSR tasks, but also achieves state-of-the-art performance on conventional benchmarks. Meanwhile, OpenSlot can localize class objects without using bounding boxes during training, demonstrating competitive performance in open-set object detection and potential for generalization.
- Abstract(参考訳): 既存のオープンセット認識 (OSR) 研究では、各画像は1つのクラスラベルしか持たないが、未知のテストセット (負) は既知のテストセット (陽性) から切り離されたラベル空間を持ち、フルラベルシフトと呼ばれるシナリオである。
本稿では,テストイメージが複数のクラスセマンティクスを含む混合OSR問題を紹介し,未知のクラスと未知のクラスを負に共起させることにより,実世界のシナリオをよりよく反映したより複雑な超ラベルシフトを実現する。
この課題に対処するために,多様なクラスセマンティクスを表現し,クラス予測を生成するスロット機能を用いたオブジェクト中心学習に基づくOpenSlotフレームワークを提案する。
提案したアンチノイズスロット(ANS)技術は、分類訓練中のノイズ(無効またはバックグラウンド)スロットの影響を緩和し、クラス予測と基底真実のセマンティックなミスアライメントに対処する。
混合OSRベンチマークと従来OSRベンチマークの両方でOpenSlotを評価する。
精巧な設計がなければ,OSRタスク間の超ラベルシフトの検出に既存の手法を駆使するだけでなく,従来のベンチマーク上での最先端性能も達成する。
一方、OpenSlotはトレーニング中にバウンディングボックスを使わずにクラスオブジェクトをローカライズすることができ、オープンセットオブジェクト検出における競合性能と一般化の可能性を示す。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Open-Set Facial Expression Recognition [42.62439125553367]
顔表情認識(FER)モデルは一般的に、7つの基本クラスを固定したデータセットで訓練される。
最近の研究では、基本的なものよりもはるかに多くの表現が存在することが指摘されている。
オープンセットFERタスクを初めて提案する。
論文 参考訳(メタデータ) (2024-01-23T05:57:50Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - IOMatch: Simplifying Open-Set Semi-Supervised Learning with Joint
Inliers and Outliers Utilization [36.102831230805755]
多くの現実世界のアプリケーションでは、ラベル付けされていないデータは必然的に、ラベル付けされたクラスのどれにも属さない、目に見えないクラスの外れ値を含む。
我々は,新しいオープンセットSSLフレームワークであるIOMatchを紹介した。
論文 参考訳(メタデータ) (2023-08-25T04:14:02Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - Open-World Object Detection via Discriminative Class Prototype Learning [4.055884768256164]
オープンワールドオブジェクト検出(OWOD)は、オブジェクト検出とインクリメンタルラーニングとオープンセットラーニングを組み合わせた難しい問題である。
OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: オープンワールドオブジェクト検出
論文 参考訳(メタデータ) (2023-02-23T03:05:04Z) - Generalized Category Discovery [148.32255950504182]
本稿では,ラベル付き画像集合とラベル付き画像集合とを併用した画像認識手法を提案する。
ここでは、未表示の画像はラベル付きクラスから、あるいは新しいものから来ているかもしれない。
まず、新しいカテゴリー発見から最先端のアルゴリズムを取り入れ、そのタスクに適応することで、強力なベースラインを確立する。
次に、単純だが効果的な半教師付き$k$-meansメソッドを導入する。
論文 参考訳(メタデータ) (2022-01-07T18:58:35Z) - Conditional Variational Capsule Network for Open Set Recognition [64.18600886936557]
オープンセット認識では、分類器はトレーニング時に未知の未知のクラスを検出する必要がある。
最近提案されたカプセルネットワークは、特に画像認識において、多くの分野で代替案を上回ることが示されている。
本提案では,訓練中,同じ既知のクラスのカプセルの特徴を,事前に定義されたガウス型に適合させることを推奨する。
論文 参考訳(メタデータ) (2021-04-19T09:39:30Z) - Learning Placeholders for Open-Set Recognition [38.57786747665563]
既知のクラスに対する分類性能を維持し、未知のクラスを拒絶するPlaceholdeRs for Open-SEt Recognition (Proser)を提案する。
Proserはマニホールドミックスアップによって新しいクラスを効率的に生成し、トレーニング中に予約されたオープンセット分類器の値を適応的に設定します。
論文 参考訳(メタデータ) (2021-03-28T09:18:15Z) - Learning Open Set Network with Discriminative Reciprocal Points [70.28322390023546]
オープンセット認識は、事前に定義されたクラスからサンプルを同時に分類し、残りを「未知」として識別することを目的としている。
本稿では,各既知圏に対応するクラス外空間のポテンシャル表現であるReciprocal Pointを提案する。
相互点によって構成される有界空間に基づいて、未知のリスクは多圏相互作用によって減少する。
論文 参考訳(メタデータ) (2020-10-31T03:20:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。