論文の概要: Learning Class Regularized Features for Action Recognition
- arxiv url: http://arxiv.org/abs/2002.02651v1
- Date: Fri, 7 Feb 2020 07:27:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 04:09:34.579638
- Title: Learning Class Regularized Features for Action Recognition
- Title(参考訳): 行動認識のための学習クラス正規化特徴
- Authors: Alexandros Stergiou, Ronald Poppe, and Remco C. Veltkamp
- Abstract要約: 本稿では,階層活性化のクラスベース正規化を行うクラス正規化手法を提案する。
動作認識に最先端CNNアーキテクチャのクラス正規化ブロックを用いることで,Kineetics,UCF-101,HMDB-51データセットにおいて,それぞれ1.8%,1.2%,1.4%の体系的改善が得られた。
- 参考スコア(独自算出の注目度): 68.90994813947405
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training Deep Convolutional Neural Networks (CNNs) is based on the notion of
using multiple kernels and non-linearities in their subsequent activations to
extract useful features. The kernels are used as general feature extractors
without specific correspondence to the target class. As a result, the extracted
features do not correspond to specific classes. Subtle differences between
similar classes are modeled in the same way as large differences between
dissimilar classes. To overcome the class-agnostic use of kernels in CNNs, we
introduce a novel method named Class Regularization that performs class-based
regularization of layer activations. We demonstrate that this not only improves
feature search during training, but also allows an explicit assignment of
features per class during each stage of the feature extraction process. We show
that using Class Regularization blocks in state-of-the-art CNN architectures
for action recognition leads to systematic improvement gains of 1.8%, 1.2% and
1.4% on the Kinetics, UCF-101 and HMDB-51 datasets, respectively.
- Abstract(参考訳): 深層畳み込みニューラルネットワーク(CNN)のトレーニングは、複数のカーネルと非線形をその後のアクティベーションに使用して有用な特徴を抽出するという概念に基づいている。
カーネルは、ターゲットクラスに特定の対応を持たずに、一般的な特徴抽出器として使用される。
その結果、抽出された特徴は特定のクラスに対応しない。
類似クラス間の部分差は、異種クラス間の大きな差と同じ方法でモデル化される。
CNNにおけるカーネルのクラスに依存しない使用を克服するために,クラス正規化と呼ばれる新しい手法を導入する。
これは、トレーニング中の特徴探索を改善するだけでなく、特徴抽出プロセスの各段階でクラス毎の機能の明示的な割り当てを可能にする。
動作認識に最先端CNNアーキテクチャのクラス正規化ブロックを用いることで,Kineetics, UCF-101, HMDB-51データセットにおいて, それぞれ1.8%, 1.2%, 1.4%の体系的改善が得られた。
関連論文リスト
- Enhancing Visual Continual Learning with Language-Guided Supervision [76.38481740848434]
継続的な学習は、モデルが以前獲得した知識を忘れずに新しいタスクを学習できるようにすることを目的としている。
ワンホットラベルが伝達する少ない意味情報は,タスク間の効果的な知識伝達を妨げている,と我々は主張する。
具体的には, PLM を用いて各クラスのセマンティックターゲットを生成し, 凍結し, 監視信号として機能する。
論文 参考訳(メタデータ) (2024-03-24T12:41:58Z) - Dynamic Perceiver for Efficient Visual Recognition [87.08210214417309]
特徴抽出手順と早期分類タスクを分離する動的知覚器(Dyn-Perceiver)を提案する。
特徴ブランチは画像の特徴を抽出し、分類ブランチは分類タスクに割り当てられた遅延コードを処理する。
早期出口は分類枝に限られており、低レベルの特徴において線形分離性は不要である。
論文 参考訳(メタデータ) (2023-06-20T03:00:22Z) - AttriCLIP: A Non-Incremental Learner for Incremental Knowledge Learning [53.32576252950481]
連続学習は、モデルが逐次到着したデータから段階的に知識を学習できるようにすることを目的としている。
本稿では,新しいクラスやタスクの知識を段階的に抽出する,AttriCLIPという非インクリメンタル学習手法を提案する。
論文 参考訳(メタデータ) (2023-05-19T07:39:17Z) - Class-Specific Attention (CSA) for Time-Series Classification [8.390973438687777]
本稿では,クラス固有の重要な特徴を抽出し,時系列の全体的な分類性能を向上させるために,新しいクラス固有アテンション(CSA)モジュールを提案する。
CSAモジュールに埋め込まれたNNモデルは、ほとんどの場合ベースモデルを改善することができ、精度は最大42%向上する。
統計分析の結果, CSAモジュールを組み込んだNNモデルの性能は, MTSの67%, UTSのテストケースの80%において, ベースNNモデルよりも優れていた。
論文 参考訳(メタデータ) (2022-11-19T07:51:51Z) - FRANS: Automatic Feature Extraction for Time Series Forecasting [2.3226893628361682]
ドメイン知識を必要としない静的な機能のための自律的機能検索ネットワークを開発した。
以上の結果から,ほとんどの状況において,我々の特徴が精度の向上につながることが明らかとなった。
論文 参考訳(メタデータ) (2022-09-15T03:14:59Z) - Exploring Category-correlated Feature for Few-shot Image Classification [27.13708881431794]
本稿では,従来の知識として,新しいクラスとベースクラスのカテゴリ相関を探索し,シンプルで効果的な特徴補正手法を提案する。
提案手法は, 広く使用されている3つのベンチマークにおいて, 一定の性能向上が得られる。
論文 参考訳(メタデータ) (2021-12-14T08:25:24Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - GAN for Vision, KG for Relation: a Two-stage Deep Network for Zero-shot
Action Recognition [33.23662792742078]
ゼロショット動作認識のための2段階のディープニューラルネットワークを提案する。
サンプリング段階では,授業の動作特徴と単語ベクトルによって訓練されたGAN(Generative Adversarial Network)を利用する。
分類段階において、アクションクラスの単語ベクトルと関連するオブジェクトの関係に基づいて知識グラフを構築する。
論文 参考訳(メタデータ) (2021-05-25T09:34:42Z) - Conditional Variational Capsule Network for Open Set Recognition [64.18600886936557]
オープンセット認識では、分類器はトレーニング時に未知の未知のクラスを検出する必要がある。
最近提案されたカプセルネットワークは、特に画像認識において、多くの分野で代替案を上回ることが示されている。
本提案では,訓練中,同じ既知のクラスのカプセルの特徴を,事前に定義されたガウス型に適合させることを推奨する。
論文 参考訳(メタデータ) (2021-04-19T09:39:30Z) - Online Sequential Extreme Learning Machines: Features Combined From
Hundreds of Midlayers [0.0]
本稿では階層型オンラインシーケンシャル学習アルゴリズム(H-OS-ELM)を提案する。
アルゴリズムは、一定のブロックサイズまたは異なるブロックサイズでチャンクごとにチャンクを学習することができる。
論文 参考訳(メタデータ) (2020-06-12T00:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。