論文の概要: Open Set Recognition using Vision Transformer with an Additional
Detection Head
- arxiv url: http://arxiv.org/abs/2203.08441v1
- Date: Wed, 16 Mar 2022 07:34:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-18 01:10:52.860732
- Title: Open Set Recognition using Vision Transformer with an Additional
Detection Head
- Title(参考訳): 追加検出ヘッドを用いた視覚トランスフォーマによるオープンセット認識
- Authors: Feiyang Cai, Zhenkai Zhang, Jie Liu, Xenofon Koutsoukos
- Abstract要約: 視覚変換器(ViT)技術に基づくオープンセット認識(OSR)の新しい手法を提案する。
まず、閉集合分類を行うためにViTモデルを訓練する。
そして、ViTによって抽出された埋め込み特徴に付加検出ヘッドを取り付け、既知のデータの表現をクラス固有のクラスタにコンパクトに強制するように訓練する。
- 参考スコア(独自算出の注目度): 6.476341388938684
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep neural networks have demonstrated prominent capacities for image
classification tasks in a closed set setting, where the test data come from the
same distribution as the training data. However, in a more realistic open set
scenario, traditional classifiers with incomplete knowledge cannot tackle test
data that are not from the training classes. Open set recognition (OSR) aims to
address this problem by both identifying unknown classes and distinguishing
known classes simultaneously. In this paper, we propose a novel approach to OSR
that is based on the vision transformer (ViT) technique. Specifically, our
approach employs two separate training stages. First, a ViT model is trained to
perform closed set classification. Then, an additional detection head is
attached to the embedded features extracted by the ViT, trained to force the
representations of known data to class-specific clusters compactly. Test
examples are identified as known or unknown based on their distance to the
cluster centers. To the best of our knowledge, this is the first time to
leverage ViT for the purpose of OSR, and our extensive evaluation against
several OSR benchmark datasets reveals that our approach significantly
outperforms other baseline methods and obtains new state-of-the-art
performance.
- Abstract(参考訳): ディープニューラルネットワークは、テストデータがトレーニングデータと同じ分布から来るクローズドセット設定において、画像分類タスクに顕著な能力を示している。
しかし、より現実的なオープンセットのシナリオでは、不完全な知識を持つ従来の分類器は、トレーニングクラスからではないテストデータに対処できない。
オープンセット認識(OSR)は、未知のクラスを識別し、既知のクラスを同時に識別することでこの問題に対処することを目的としている。
本稿では,視覚変換器(ViT)技術に基づくOSRの新しいアプローチを提案する。
具体的には,2つの異なる訓練段階を用いる。
まず、閉集合分類を行うためにViTモデルを訓練する。
そして、ViTによって抽出された埋め込み特徴に付加検出ヘッドを取り付け、既知のデータの表現をクラス固有のクラスタにコンパクトに強制するように訓練する。
テスト例は、クラスタセンターへの距離に基づいて、既知の、または未知のものとして識別される。
我々の知る限り、OSRの目的のためにViTを活用するのはこれが初めてであり、OSRベンチマークデータセットに対する広範な評価により、我々のアプローチが他のベースラインメソッドを大幅に上回っており、新しい最先端のパフォーマンスが得られることが明らかになった。
関連論文リスト
- Activate and Reject: Towards Safe Domain Generalization under Category
Shift [71.95548187205736]
カテゴリーシフト(DGCS)下における領域一般化の実践的問題について検討する。
未知のクラスサンプルを同時に検出し、ターゲットドメイン内の既知のクラスサンプルを分類することを目的としている。
従来のDGと比較すると,1)ソースクラスのみを用いたトレーニングにおいて,未知の概念を学習する方法,2)ソーストレーニングされたモデルを未知の環境に適応する方法,の2つの新しい課題に直面している。
論文 参考訳(メタデータ) (2023-10-07T07:53:12Z) - LORD: Leveraging Open-Set Recognition with Unknown Data [10.200937444995944]
LORDは未知のデータを活用することでオープンセット認識を活用するためのフレームワークである。
我々は、背景データを利用した3つのモデルに依存しない訓練戦略を特定し、それらを確立された分類器に適用する。
論文 参考訳(メタデータ) (2023-08-24T06:12:41Z) - Learning Classifiers of Prototypes and Reciprocal Points for Universal
Domain Adaptation [79.62038105814658]
Universal Domainは、ドメインシフトとカテゴリシフトという2つのシフトを処理して、データセット間で知識を転送することを目的としている。
主な課題は、既知のクラス知識の分布をソースからターゲットに適応させながら、未知のターゲットサンプルを正しく識別することである。
既存のほとんどの手法は、まずターゲットが適応した既知の知識を訓練し、次に未知のターゲットサンプルを識別するために単一のしきい値に依存することでこの問題に対処する。
論文 参考訳(メタデータ) (2022-12-16T09:01:57Z) - Deepfake Detection via Joint Unsupervised Reconstruction and Supervised
Classification [25.84902508816679]
本稿では,再建作業と分類作業を同時に行うディープフェイク検出手法を提案する。
この方法は、あるタスクによって学習された情報を他のタスクと共有する。
提案手法は,一般的に使用されている3つのデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-11-24T05:44:26Z) - Feature Decoupling in Self-supervised Representation Learning for Open
Set Recognition [0.0]
オープンセット認識(OSR)問題には,2段階のトレーニング戦略を用いる。
最初の段階では、既知のクラスから入力されたサンプルの内容の特徴を抽出する自己教師付き特徴分離手法を導入する。
第2段階では、コンテンツ機能とクラスラベルを微調整します。
実験の結果,提案手法は画像やマルウェアのOSR問題において他者よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-09-28T19:21:53Z) - Open-set Recognition via Augmentation-based Similarity Learning [11.706887820422002]
ペアの類似点を学習することで未知(または見知らぬクラスサンプル)を検出することを提案する。
我々はOPG(Pseudo unseen data generationに基づくオープンセット認識)と呼ぶ。
論文 参考訳(メタデータ) (2022-03-24T17:49:38Z) - Open-Set Recognition: A Good Closed-Set Classifier is All You Need [146.6814176602689]
分類器が「ゼロ・オブ・ア・ア・ア・ベ」決定を行う能力は、閉集合クラスにおける精度と高い相関関係があることが示される。
この相関を利用して、閉セット精度を向上させることにより、クロスエントロピーOSR'ベースライン'の性能を向上させる。
また、セマンティックノベルティを検出するタスクをより尊重する新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2021-10-12T17:58:59Z) - SCARF: Self-Supervised Contrastive Learning using Random Feature
Corruption [72.35532598131176]
本稿では,特徴のランダムなサブセットを乱してビューを形成するコントラスト学習手法であるSCARFを提案する。
SCARFは既存の戦略を補完し、オートエンコーダのような代替手段より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-29T08:08:33Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Open-set Recognition based on the Combination of Deep Learning and
Ensemble Method for Detecting Unknown Traffic Scenarios [0.9711326718689492]
本研究では、Convolutional Neural Networks(CNN)とRandom Forest(RF)を組み合わせて、交通シナリオのオープンセット認識を提案する。
RFのアンサンブルの性質を継承することにより、極値理論と組み合わされた全ての木の投票パターンが未知のクラスを検出するのに適していることが示される。
論文 参考訳(メタデータ) (2021-05-17T06:48:15Z) - Conditional Variational Capsule Network for Open Set Recognition [64.18600886936557]
オープンセット認識では、分類器はトレーニング時に未知の未知のクラスを検出する必要がある。
最近提案されたカプセルネットワークは、特に画像認識において、多くの分野で代替案を上回ることが示されている。
本提案では,訓練中,同じ既知のクラスのカプセルの特徴を,事前に定義されたガウス型に適合させることを推奨する。
論文 参考訳(メタデータ) (2021-04-19T09:39:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。