Fugu-MT 論文翻訳(概要): Multi-Expert Human Action Recognition with Hierarchical Super-Class Learning

論文の概要: Multi-Expert Human Action Recognition with Hierarchical Super-Class Learning

arxiv url: http://arxiv.org/abs/2112.07015v1
Date: Mon, 13 Dec 2021 21:08:53 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-15 16:58:09.680891
Title: Multi-Expert Human Action Recognition with Hierarchical Super-Class Learning
Title（参考訳）: 階層型スーパークラス学習による人間行動認識
Authors: Hojat Asgarian Dehkordi, Ali Soltani Nezhad, Hossein Kashiani, Shahriar Baradaran Shokouhi, Ahmad Ayatollahi
Abstract要約: 人間の行動認識のための2段階のマルチエキスパート分類法を提案する。提案手法では、粗粒度位相が最も重要な粒度の専門家を選択する。そして、粒度の細かい専門家が各スーパークラス内の複雑な詳細をエンコードし、クラス間の変動が増加する。
参考スコア（独自算出の注目度）: 1.1199585259018459
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In still image human action recognition, existing studies have mainly leveraged extra bounding box information along with class labels to mitigate the lack of temporal information in still images; however, preparing extra data with manual annotation is time-consuming and also prone to human errors. Moreover, the existing studies have not addressed action recognition with long-tailed distribution. In this paper, we propose a two-phase multi-expert classification method for human action recognition to cope with long-tailed distribution by means of super-class learning and without any extra information. To choose the best configuration for each super-class and characterize inter-class dependency between different action classes, we propose a novel Graph-Based Class Selection (GCS) algorithm. In the proposed approach, a coarse-grained phase selects the most relevant fine-grained experts. Then, the fine-grained experts encode the intricate details within each super-class so that the inter-class variation increases. Extensive experimental evaluations are conducted on various public human action recognition datasets, including Stanford40, Pascal VOC 2012 Action, BU101+, and IHAR datasets. The experimental results demonstrate that the proposed method yields promising improvements. To be more specific, in IHAR, Sanford40, Pascal VOC 2012 Action, and BU101+ benchmarks, the proposed approach outperforms the state-of-the-art studies by 8.92%, 0.41%, 0.66%, and 2.11 % with much less computational cost and without any auxiliary annotation information. Besides, it is proven that in addressing action recognition with long-tailed distribution, the proposed method outperforms its counterparts by a significant margin.
Abstract（参考訳）: 静止画像のヒューマンアクション認識では、既存の研究は主に余分なバウンディングボックス情報とクラスラベルを利用して、静止画像における時間的情報の欠如を軽減するが、手動アノテーションによる追加データの準備は時間がかかり、ヒューマンエラーの原因となる。さらに,本研究は長期分布を伴う行動認識に対処していない。本稿では,スーパークラス学習によるロングテール分布に対処し,余分な情報を持たず,人間行動認識のための二相多能性分類法を提案する。各スーパークラスの最適な構成を選択し、異なるアクションクラス間のクラス間の依存関係を特徴付けるために、新しいグラフベースクラス選択(gcs)アルゴリズムを提案する。提案手法では,粗粒度が最も適切な細粒度の専門家を選択する。そして、粒度の細かい専門家が各スーパークラスの複雑な詳細をエンコードし、クラス間の変動が増加する。 Stanford40、Pascal VOC 2012 Action、BU101+、IHARデータセットなど、さまざまな公開人の行動認識データセットに対して、大規模な実験的評価が行われた。実験の結果,提案手法は有望な改善をもたらすことがわかった。より具体的に言うと、IHAR、Sanford40、Pascal VOC 2012 Action、BU101+ベンチマークでは、提案されたアプローチは最先端の研究を8.92%、0.41%、0.66%、および2.11%で上回り、計算コストが大幅に低減され、補助的なアノテーション情報がない。さらに,長い尾の分布を持つ動作認識において,提案手法は,その性能を著しく向上させることが証明された。

関連論文リスト

Granularity Matters in Long-Tail Learning [62.30734737735273]
より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文参考訳（メタデータ） (2024-10-21T13:06:21Z)
Active Learning to Guide Labeling Efforts for Question Difficulty Estimation [1.0514231683620516]
トランスフォーマーベースのニューラルネットワークは、主に教師なしの手法ではなく、教師なし学習における独立した研究によって、最先端のパフォーマンスを達成する。この研究は、教師付きヒューマン・イン・ザ・ループアプローチであるQDEのアクティブ・ラーニングを探求することで、研究ギャップを埋める。 PowerVarianceの取得によるアクティブな学習は、トレーニングデータの10%だけをラベル付けした後、完全に教師されたモデルに近いパフォーマンスを達成することを示す実験である。
論文参考訳（メタデータ） (2024-09-14T02:02:42Z)
Learning Discriminative Spatio-temporal Representations for Semi-supervised Action Recognition [23.44320273156057]
本稿では,適応コントラスト学習(ACL)戦略とマルチスケールテンポラル学習(MTL)戦略を提案する。 ACL戦略は、ラベル付きデータのクラスプロトタイプにより、全ての未ラベルサンプルの信頼性を評価し、擬ラベル付きサンプルバンクから正負のサンプルを適応的に選択し、コントラスト学習を構築する。 MTL戦略は、長期クリップからの情報的意味を強調し、ノイズ情報を抑制しながら、それらを短期クリップに統合する。
論文参考訳（メタデータ） (2024-04-25T08:49:08Z)
SuperDisco: Super-Class Discovery Improves Visual Recognition for the Long-Tail [69.50380510879697]
我々は,長い尾の認識のための超クラス表現を発見するアルゴリズムであるSuperDiscoを提案する。我々は,長期分布を扱うための表現学習を指導するために,超クラスグラフを構築することを学ぶ。
論文参考訳（メタデータ） (2023-03-31T19:51:12Z)
PromptCAL: Contrastive Affinity Learning via Auxiliary Prompts for Generalized Novel Category Discovery [39.03732147384566]
Generalized Novel Category Discovery (GNCD) 設定は、既知のクラスや新しいクラスから来るラベルなしのトレーニングデータを分類することを目的としている。本稿では,この課題に対処するために,PromptCALと呼ばれる補助視覚プロンプトを用いたコントラスト親和性学習法を提案する。提案手法は,クラストークンと視覚的プロンプトのための既知のクラスと新しいクラスのセマンティッククラスタリングを改善するために,信頼性の高いペアワイズサンプル親和性を発見する。
論文参考訳（メタデータ） (2022-12-11T20:06:14Z)
Fine-Grained Visual Classification using Self Assessment Classifier [12.596520707449027]
識別的特徴の抽出は、きめ細かい視覚的分類タスクにおいて重要な役割を担っている。本稿では,画像とトップkの予測クラスを同時に活用する自己評価手法を提案する。本手法は,CUB200-2011,Stanford Dog,FGVC Aircraft のデータセットに対して,最新の結果が得られることを示す。
論文参考訳（メタデータ） (2022-05-21T07:41:27Z)
Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文参考訳（メタデータ） (2021-08-15T02:21:01Z)
Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。 Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文参考訳（メタデータ） (2020-07-20T05:57:42Z)
Deep Learning feature selection to unhide demographic recommender systems factors [63.732639864601914]
行列分解モデルは意味的知識を含まない因子を生成する。 DeepUnHideは、協調フィルタリングレコメンデータシステムにおいて、ユーザとアイテムファクタから、人口統計情報を抽出することができる。
論文参考訳（メタデータ） (2020-06-17T17:36:48Z)
Learning From Multiple Experts: Self-paced Knowledge Distillation for Long-tailed Classification [106.08067870620218]
我々は,LFME(Learning From Multiple Experts)と呼ばれる自己評価型知識蒸留フレームワークを提案する。提案するLFMEフレームワークは,複数の'Experts'からの知識を集約して,統一された学生モデルを学ぶ。提案手法は,最先端の手法に比べて優れた性能が得られることを示す。
論文参考訳（メタデータ） (2020-01-06T12:57:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。