論文の概要: Multi-Expert Human Action Recognition with Hierarchical Super-Class
Learning
- arxiv url: http://arxiv.org/abs/2112.07015v1
- Date: Mon, 13 Dec 2021 21:08:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 16:58:09.680891
- Title: Multi-Expert Human Action Recognition with Hierarchical Super-Class
Learning
- Title(参考訳): 階層型スーパークラス学習による人間行動認識
- Authors: Hojat Asgarian Dehkordi, Ali Soltani Nezhad, Hossein Kashiani,
Shahriar Baradaran Shokouhi, Ahmad Ayatollahi
- Abstract要約: 人間の行動認識のための2段階のマルチエキスパート分類法を提案する。
提案手法では、粗粒度位相が最も重要な粒度の専門家を選択する。
そして、粒度の細かい専門家が各スーパークラス内の複雑な詳細をエンコードし、クラス間の変動が増加する。
- 参考スコア(独自算出の注目度): 1.1199585259018459
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In still image human action recognition, existing studies have mainly
leveraged extra bounding box information along with class labels to mitigate
the lack of temporal information in still images; however, preparing extra data
with manual annotation is time-consuming and also prone to human errors.
Moreover, the existing studies have not addressed action recognition with
long-tailed distribution. In this paper, we propose a two-phase multi-expert
classification method for human action recognition to cope with long-tailed
distribution by means of super-class learning and without any extra
information. To choose the best configuration for each super-class and
characterize inter-class dependency between different action classes, we
propose a novel Graph-Based Class Selection (GCS) algorithm. In the proposed
approach, a coarse-grained phase selects the most relevant fine-grained
experts. Then, the fine-grained experts encode the intricate details within
each super-class so that the inter-class variation increases. Extensive
experimental evaluations are conducted on various public human action
recognition datasets, including Stanford40, Pascal VOC 2012 Action, BU101+, and
IHAR datasets. The experimental results demonstrate that the proposed method
yields promising improvements. To be more specific, in IHAR, Sanford40, Pascal
VOC 2012 Action, and BU101+ benchmarks, the proposed approach outperforms the
state-of-the-art studies by 8.92%, 0.41%, 0.66%, and 2.11 % with much less
computational cost and without any auxiliary annotation information. Besides,
it is proven that in addressing action recognition with long-tailed
distribution, the proposed method outperforms its counterparts by a significant
margin.
- Abstract(参考訳): 静止画像のヒューマンアクション認識では、既存の研究は主に余分なバウンディングボックス情報とクラスラベルを利用して、静止画像における時間的情報の欠如を軽減するが、手動アノテーションによる追加データの準備は時間がかかり、ヒューマンエラーの原因となる。
さらに,本研究は長期分布を伴う行動認識に対処していない。
本稿では,スーパークラス学習によるロングテール分布に対処し,余分な情報を持たず,人間行動認識のための二相多能性分類法を提案する。
各スーパークラスの最適な構成を選択し、異なるアクションクラス間のクラス間の依存関係を特徴付けるために、新しいグラフベースクラス選択(gcs)アルゴリズムを提案する。
提案手法では,粗粒度が最も適切な細粒度の専門家を選択する。
そして、粒度の細かい専門家が各スーパークラスの複雑な詳細をエンコードし、クラス間の変動が増加する。
Stanford40、Pascal VOC 2012 Action、BU101+、IHARデータセットなど、さまざまな公開人の行動認識データセットに対して、大規模な実験的評価が行われた。
実験の結果,提案手法は有望な改善をもたらすことがわかった。
より具体的に言うと、IHAR、Sanford40、Pascal VOC 2012 Action、BU101+ベンチマークでは、提案されたアプローチは最先端の研究を8.92%、0.41%、0.66%、および2.11%で上回り、計算コストが大幅に低減され、補助的なアノテーション情報がない。
さらに,長い尾の分布を持つ動作認識において,提案手法は,その性能を著しく向上させることが証明された。
関連論文リスト
- Granularity Matters in Long-Tail Learning [62.30734737735273]
より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。
既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。
補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文 参考訳(メタデータ) (2024-10-21T13:06:21Z) - Active Learning to Guide Labeling Efforts for Question Difficulty Estimation [1.0514231683620516]
トランスフォーマーベースのニューラルネットワークは、主に教師なしの手法ではなく、教師なし学習における独立した研究によって、最先端のパフォーマンスを達成する。
この研究は、教師付きヒューマン・イン・ザ・ループアプローチであるQDEのアクティブ・ラーニングを探求することで、研究ギャップを埋める。
PowerVarianceの取得によるアクティブな学習は、トレーニングデータの10%だけをラベル付けした後、完全に教師されたモデルに近いパフォーマンスを達成することを示す実験である。
論文 参考訳(メタデータ) (2024-09-14T02:02:42Z) - Learning Discriminative Spatio-temporal Representations for Semi-supervised Action Recognition [23.44320273156057]
本稿では,適応コントラスト学習(ACL)戦略とマルチスケールテンポラル学習(MTL)戦略を提案する。
ACL戦略は、ラベル付きデータのクラスプロトタイプにより、全ての未ラベルサンプルの信頼性を評価し、擬ラベル付きサンプルバンクから正負のサンプルを適応的に選択し、コントラスト学習を構築する。
MTL戦略は、長期クリップからの情報的意味を強調し、ノイズ情報を抑制しながら、それらを短期クリップに統合する。
論文 参考訳(メタデータ) (2024-04-25T08:49:08Z) - SuperDisco: Super-Class Discovery Improves Visual Recognition for the
Long-Tail [69.50380510879697]
我々は,長い尾の認識のための超クラス表現を発見するアルゴリズムであるSuperDiscoを提案する。
我々は,長期分布を扱うための表現学習を指導するために,超クラスグラフを構築することを学ぶ。
論文 参考訳(メタデータ) (2023-03-31T19:51:12Z) - PromptCAL: Contrastive Affinity Learning via Auxiliary Prompts for
Generalized Novel Category Discovery [39.03732147384566]
Generalized Novel Category Discovery (GNCD) 設定は、既知のクラスや新しいクラスから来るラベルなしのトレーニングデータを分類することを目的としている。
本稿では,この課題に対処するために,PromptCALと呼ばれる補助視覚プロンプトを用いたコントラスト親和性学習法を提案する。
提案手法は,クラストークンと視覚的プロンプトのための既知のクラスと新しいクラスのセマンティッククラスタリングを改善するために,信頼性の高いペアワイズサンプル親和性を発見する。
論文 参考訳(メタデータ) (2022-12-11T20:06:14Z) - Fine-Grained Visual Classification using Self Assessment Classifier [12.596520707449027]
識別的特徴の抽出は、きめ細かい視覚的分類タスクにおいて重要な役割を担っている。
本稿では,画像とトップkの予測クラスを同時に活用する自己評価手法を提案する。
本手法は,CUB200-2011,Stanford Dog,FGVC Aircraft のデータセットに対して,最新の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-05-21T07:41:27Z) - Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and
Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。
そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。
粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文 参考訳(メタデータ) (2021-08-15T02:21:01Z) - Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。
モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。
Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文 参考訳(メタデータ) (2020-07-20T05:57:42Z) - Deep Learning feature selection to unhide demographic recommender
systems factors [63.732639864601914]
行列分解モデルは意味的知識を含まない因子を生成する。
DeepUnHideは、協調フィルタリングレコメンデータシステムにおいて、ユーザとアイテムファクタから、人口統計情報を抽出することができる。
論文 参考訳(メタデータ) (2020-06-17T17:36:48Z) - Learning From Multiple Experts: Self-paced Knowledge Distillation for
Long-tailed Classification [106.08067870620218]
我々は,LFME(Learning From Multiple Experts)と呼ばれる自己評価型知識蒸留フレームワークを提案する。
提案するLFMEフレームワークは,複数の'Experts'からの知識を集約して,統一された学生モデルを学ぶ。
提案手法は,最先端の手法に比べて優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-01-06T12:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。