論文の概要: OpenSlot: Mixed Open-set Recognition with Object-centric Learning
- arxiv url: http://arxiv.org/abs/2407.02386v1
- Date: Tue, 2 Jul 2024 16:00:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-03 14:46:41.852615
- Title: OpenSlot: Mixed Open-set Recognition with Object-centric Learning
- Title(参考訳): OpenSlot: オープンセット認識とオブジェクト中心学習の混在
- Authors: Xu Yin, Fei Pan, Guoyuan An, Yuchi Huo, Zixuan Xie, Sung-Eui Yoon,
- Abstract要約: オープンセット認識(OSR)研究は通常、各画像は1つのクラスラベルしか持たず、未知のテストセット(負)は既知のテストセット(正)から切り離されたラベル空間を持つと仮定する。
本稿では、テスト画像が複数のクラスセマンティクスを含み、既知のクラスと未知のクラスが負に共起する混合OSR問題を紹介する。
オブジェクト指向学習に基づくOpenSlotフレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.933996792254998
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Existing open-set recognition (OSR) studies typically assume that each image contains only one class label, and the unknown test set (negative) has a disjoint label space from the known test set (positive), a scenario termed full-label shift. This paper introduces the mixed OSR problem, where test images contain multiple class semantics, with known and unknown classes co-occurring in negatives, leading to a more challenging super-label shift. Addressing the mixed OSR requires classification models to accurately distinguish different class semantics within images and measure their "knowness". In this study, we propose the OpenSlot framework, built upon object-centric learning. OpenSlot utilizes slot features to represent diverse class semantics and produce class predictions. Through our proposed anti-noise-slot (ANS) technique, we mitigate the impact of noise (invalid and background) slots during classification training, effectively addressing the semantic misalignment between class predictions and the ground truth. We conduct extensive experiments with OpenSlot on mixed & conventional OSR benchmarks. Without elaborate designs, OpenSlot not only exceeds existing OSR studies in detecting super-label shifts across single & multi-label mixed OSR tasks but also achieves state-of-the-art performance on conventional benchmarks. Remarkably, our method can localize class objects without using bounding boxes during training. The competitive performance in open-set object detection demonstrates OpenSlot's ability to explicitly explain label shifts and benefits in computational efficiency and generalization.
- Abstract(参考訳): 既存のオープンセット認識(OSR)研究は通常、各画像は1つのクラスラベルしか含まないと仮定し、未知のテストセット(負)は既知のテストセット(正)から切り離されたラベル空間を持ち、フルラベルシフトと呼ばれるシナリオを持つ。
本稿では,テストイメージが複数のクラスセマンティクスを含む混合OSR問題について紹介する。
混合OSRに対処するには、画像内の異なるクラスのセマンティクスを正確に識別し、それらの「既知のもの」を測定するための分類モデルが必要である。
本研究では,オブジェクト指向学習に基づくOpenSlotフレームワークを提案する。
OpenSlotはスロット機能を使用して、多様なクラスセマンティクスを表現し、クラス予測を生成する。
提案手法により,分類学習におけるノイズ(非有意および背景)スロットの影響を軽減し,クラス予測と基底真理とのセマンティックな相違を効果的に解決する。
混合OSRベンチマークにおけるOpenSlotの広範な実験を行った。
精巧な設計がなければ、OpenSlotはシングルラベルとマルチラベルの混合OSRタスク間の超ラベルシフトを検出する既存のOSR研究を超えるだけでなく、従来のベンチマークで最先端のパフォーマンスを達成する。
注目すべきは、トレーニング中にバウンディングボックスを使わずにクラスオブジェクトをローカライズできることだ。
オープンセットオブジェクト検出における競合性能は、計算効率と一般化におけるラベルシフトと利点を明確に説明できるOpenSlotの能力を示している。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Open-Set Facial Expression Recognition [42.62439125553367]
顔表情認識(FER)モデルは一般的に、7つの基本クラスを固定したデータセットで訓練される。
最近の研究では、基本的なものよりもはるかに多くの表現が存在することが指摘されている。
オープンセットFERタスクを初めて提案する。
論文 参考訳(メタデータ) (2024-01-23T05:57:50Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - IOMatch: Simplifying Open-Set Semi-Supervised Learning with Joint
Inliers and Outliers Utilization [36.102831230805755]
多くの現実世界のアプリケーションでは、ラベル付けされていないデータは必然的に、ラベル付けされたクラスのどれにも属さない、目に見えないクラスの外れ値を含む。
我々は,新しいオープンセットSSLフレームワークであるIOMatchを紹介した。
論文 参考訳(メタデータ) (2023-08-25T04:14:02Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - Open-World Object Detection via Discriminative Class Prototype Learning [4.055884768256164]
オープンワールドオブジェクト検出(OWOD)は、オブジェクト検出とインクリメンタルラーニングとオープンセットラーニングを組み合わせた難しい問題である。
OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: オープンワールドオブジェクト検出
論文 参考訳(メタデータ) (2023-02-23T03:05:04Z) - Generalized Category Discovery [148.32255950504182]
本稿では,ラベル付き画像集合とラベル付き画像集合とを併用した画像認識手法を提案する。
ここでは、未表示の画像はラベル付きクラスから、あるいは新しいものから来ているかもしれない。
まず、新しいカテゴリー発見から最先端のアルゴリズムを取り入れ、そのタスクに適応することで、強力なベースラインを確立する。
次に、単純だが効果的な半教師付き$k$-meansメソッドを導入する。
論文 参考訳(メタデータ) (2022-01-07T18:58:35Z) - Conditional Variational Capsule Network for Open Set Recognition [64.18600886936557]
オープンセット認識では、分類器はトレーニング時に未知の未知のクラスを検出する必要がある。
最近提案されたカプセルネットワークは、特に画像認識において、多くの分野で代替案を上回ることが示されている。
本提案では,訓練中,同じ既知のクラスのカプセルの特徴を,事前に定義されたガウス型に適合させることを推奨する。
論文 参考訳(メタデータ) (2021-04-19T09:39:30Z) - Learning Placeholders for Open-Set Recognition [38.57786747665563]
既知のクラスに対する分類性能を維持し、未知のクラスを拒絶するPlaceholdeRs for Open-SEt Recognition (Proser)を提案する。
Proserはマニホールドミックスアップによって新しいクラスを効率的に生成し、トレーニング中に予約されたオープンセット分類器の値を適応的に設定します。
論文 参考訳(メタデータ) (2021-03-28T09:18:15Z) - Learning Open Set Network with Discriminative Reciprocal Points [70.28322390023546]
オープンセット認識は、事前に定義されたクラスからサンプルを同時に分類し、残りを「未知」として識別することを目的としている。
本稿では,各既知圏に対応するクラス外空間のポテンシャル表現であるReciprocal Pointを提案する。
相互点によって構成される有界空間に基づいて、未知のリスクは多圏相互作用によって減少する。
論文 参考訳(メタデータ) (2020-10-31T03:20:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。