論文の概要: Enlarging Instance-specific and Class-specific Information for Open-set
Action Recognition
- arxiv url: http://arxiv.org/abs/2303.15467v1
- Date: Sat, 25 Mar 2023 04:07:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 17:53:54.852901
- Title: Enlarging Instance-specific and Class-specific Information for Open-set
Action Recognition
- Title(参考訳): オープンセット行動認識のためのインスタンス固有・クラス固有情報の拡張
- Authors: Jun Cen, Shiwei Zhang, Xiang Wang, Yixuan Pei, Zhiwu Qing, Yingya
Zhang, Qifeng Chen
- Abstract要約: よりリッチなセマンティックな多様性を持つ機能は、同じ不確実性スコアの下で、オープンセットのパフォーマンスを著しく向上させることができる。
よりIS情報を保持するために、インスタンスの分散を同じクラス内に保持するために、新しいPSLフレームワークが提案されている。
- 参考スコア(独自算出の注目度): 47.69171542776917
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Open-set action recognition is to reject unknown human action cases which are
out of the distribution of the training set. Existing methods mainly focus on
learning better uncertainty scores but dismiss the importance of feature
representations. We find that features with richer semantic diversity can
significantly improve the open-set performance under the same uncertainty
scores. In this paper, we begin with analyzing the feature representation
behavior in the open-set action recognition (OSAR) problem based on the
information bottleneck (IB) theory, and propose to enlarge the
instance-specific (IS) and class-specific (CS) information contained in the
feature for better performance. To this end, a novel Prototypical Similarity
Learning (PSL) framework is proposed to keep the instance variance within the
same class to retain more IS information. Besides, we notice that unknown
samples sharing similar appearances to known samples are easily misclassified
as known classes. To alleviate this issue, video shuffling is further
introduced in our PSL to learn distinct temporal information between original
and shuffled samples, which we find enlarges the CS information. Extensive
experiments demonstrate that the proposed PSL can significantly boost both the
open-set and closed-set performance and achieves state-of-the-art results on
multiple benchmarks. Code is available at https://github.com/Jun-CEN/PSL.
- Abstract(参考訳): オープンセットアクション認識とは、トレーニングセットの分布外にある未知の人間のアクションケースを拒絶することである。
既存の手法は主に不確実性スコアの学習に重点を置いているが、特徴表現の重要性は無視している。
セマンティクスの多様性が豊かな機能は、同じ不確実性スコアの下で、オープンセットのパフォーマンスを大幅に改善できることが分かりました。
本稿では,情報ボトルネック(ib)理論に基づくオープンセット行動認識(osar)問題における特徴表現挙動の解析から始め,その特徴に含まれるインスタンス固有(is)情報とクラス固有(cs)情報を拡張して性能を向上させることを提案する。
この目的のために、新しいPSL(Prototypeal similarity Learning)フレームワークが提案され、よりIS情報を保持するために、インスタンスの分散を同じクラス内に保持する。
さらに、既知のサンプルと類似した外観を共有する未知のサンプルは、容易に既知のクラスとして分類される。
この問題を緩和するため、PSLではビデオシャッフルがさらに導入され、元のサンプルとシャッフルされたサンプルの時間的情報を学習し、CS情報を拡大する。
広汎な実験により,提案したPSLはオープンセットとクローズセットの両方のパフォーマンスを大幅に向上し,複数のベンチマークで最先端の結果が得られた。
コードはhttps://github.com/Jun-CEN/PSLで入手できる。
関連論文リスト
- Views Can Be Deceiving: Improved SSL Through Feature Space Augmentation [27.609748213840138]
本研究では,視覚表現学習における自己監督学習(SSL)に対する刺激的特徴の影響について検討する。
SSLの一般的な拡張は、画像空間における望ましくない不変性を引き起こす可能性があることを示す。
そこで,本研究では,pruningによりエンコーダの後半層を正規化することにより,事前学習中にこれらの表現からスプリアス情報を除去するLateTVGを提案する。
論文 参考訳(メタデータ) (2024-05-28T18:42:13Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - An Additive Instance-Wise Approach to Multi-class Model Interpretation [53.87578024052922]
解釈可能な機械学習は、ブラックボックスシステムの特定の予測を駆動する要因に関する洞察を提供する。
既存の手法は主に、局所的な加法的あるいはインスタンス的なアプローチに従う説明的入力特徴の選択に重点を置いている。
本研究は,両手法の長所を生かし,複数の対象クラスに対する局所的な説明を同時に学習するためのグローバルフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-07T06:50:27Z) - Weak Augmentation Guided Relational Self-Supervised Learning [80.0680103295137]
本稿では、異なるインスタンス間の関係をモデル化して表現を学習する新しいリレーショナル自己教師型学習(ReSSL)フレームワークを提案する。
提案手法では,異なるインスタンス間でのペアワイズ類似度の分布を,テクトitrelationmetricとして高めている。
実験の結果,提案したReSSLは,ネットワークアーキテクチャの異なる最先端手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2022-03-16T16:14:19Z) - Active Learning for Open-set Annotation [38.739845944840454]
我々はLfOSAと呼ばれる新しいアクティブラーニングフレームワークを提案する。このフレームワークは、効果的なサンプリング戦略を用いて分類性能を高め、アノテーションのための既知のクラスからサンプルを正確に検出する。
実験結果から,提案手法は既知のクラスの選択精度を著しく向上し,アノテーションコストの低い分類精度を最先端の能動学習法よりも向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-01-18T06:11:51Z) - ReSSL: Relational Self-Supervised Learning with Weak Augmentation [68.47096022526927]
自己教師付き学習は、データアノテーションなしで視覚表現を学ぶことに成功しました。
本稿では,異なるインスタンス間の関係をモデル化して表現を学習する新しいリレーショナルSSLパラダイムを提案する。
提案したReSSLは,性能とトレーニング効率の両面で,従来の最先端アルゴリズムよりも大幅に優れています。
論文 参考訳(メタデータ) (2021-07-20T06:53:07Z) - ECKPN: Explicit Class Knowledge Propagation Network for Transductive
Few-shot Learning [53.09923823663554]
クラスレベルの知識は、ほんの一握りのサンプルから人間が容易に学習することができる。
本稿では,この問題に対処する明示的クラス知識伝達ネットワーク(ECKPN)を提案する。
筆者らは,4つの数ショット分類ベンチマークについて広範な実験を行い,提案したECKPNが最先端の手法よりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2021-06-16T02:29:43Z) - Self-supervised Detransformation Autoencoder for Representation Learning
in Open Set Recognition [0.0]
オープンセット認識問題に対する自己超越手法であるDetransformation Autoencoder (DTAE)を提案する。
提案手法は,未知のクラスを検出し,未知のクラスを分類する上で,大きな利益をもたらす。
論文 参考訳(メタデータ) (2021-05-28T02:45:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。