論文の概要: Multi-Expert Human Action Recognition with Hierarchical Super-Class
Learning
- arxiv url: http://arxiv.org/abs/2112.07015v1
- Date: Mon, 13 Dec 2021 21:08:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 16:58:09.680891
- Title: Multi-Expert Human Action Recognition with Hierarchical Super-Class
Learning
- Title(参考訳): 階層型スーパークラス学習による人間行動認識
- Authors: Hojat Asgarian Dehkordi, Ali Soltani Nezhad, Hossein Kashiani,
Shahriar Baradaran Shokouhi, Ahmad Ayatollahi
- Abstract要約: 人間の行動認識のための2段階のマルチエキスパート分類法を提案する。
提案手法では、粗粒度位相が最も重要な粒度の専門家を選択する。
そして、粒度の細かい専門家が各スーパークラス内の複雑な詳細をエンコードし、クラス間の変動が増加する。
- 参考スコア(独自算出の注目度): 1.1199585259018459
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In still image human action recognition, existing studies have mainly
leveraged extra bounding box information along with class labels to mitigate
the lack of temporal information in still images; however, preparing extra data
with manual annotation is time-consuming and also prone to human errors.
Moreover, the existing studies have not addressed action recognition with
long-tailed distribution. In this paper, we propose a two-phase multi-expert
classification method for human action recognition to cope with long-tailed
distribution by means of super-class learning and without any extra
information. To choose the best configuration for each super-class and
characterize inter-class dependency between different action classes, we
propose a novel Graph-Based Class Selection (GCS) algorithm. In the proposed
approach, a coarse-grained phase selects the most relevant fine-grained
experts. Then, the fine-grained experts encode the intricate details within
each super-class so that the inter-class variation increases. Extensive
experimental evaluations are conducted on various public human action
recognition datasets, including Stanford40, Pascal VOC 2012 Action, BU101+, and
IHAR datasets. The experimental results demonstrate that the proposed method
yields promising improvements. To be more specific, in IHAR, Sanford40, Pascal
VOC 2012 Action, and BU101+ benchmarks, the proposed approach outperforms the
state-of-the-art studies by 8.92%, 0.41%, 0.66%, and 2.11 % with much less
computational cost and without any auxiliary annotation information. Besides,
it is proven that in addressing action recognition with long-tailed
distribution, the proposed method outperforms its counterparts by a significant
margin.
- Abstract(参考訳): 静止画像のヒューマンアクション認識では、既存の研究は主に余分なバウンディングボックス情報とクラスラベルを利用して、静止画像における時間的情報の欠如を軽減するが、手動アノテーションによる追加データの準備は時間がかかり、ヒューマンエラーの原因となる。
さらに,本研究は長期分布を伴う行動認識に対処していない。
本稿では,スーパークラス学習によるロングテール分布に対処し,余分な情報を持たず,人間行動認識のための二相多能性分類法を提案する。
各スーパークラスの最適な構成を選択し、異なるアクションクラス間のクラス間の依存関係を特徴付けるために、新しいグラフベースクラス選択(gcs)アルゴリズムを提案する。
提案手法では,粗粒度が最も適切な細粒度の専門家を選択する。
そして、粒度の細かい専門家が各スーパークラスの複雑な詳細をエンコードし、クラス間の変動が増加する。
Stanford40、Pascal VOC 2012 Action、BU101+、IHARデータセットなど、さまざまな公開人の行動認識データセットに対して、大規模な実験的評価が行われた。
実験の結果,提案手法は有望な改善をもたらすことがわかった。
より具体的に言うと、IHAR、Sanford40、Pascal VOC 2012 Action、BU101+ベンチマークでは、提案されたアプローチは最先端の研究を8.92%、0.41%、0.66%、および2.11%で上回り、計算コストが大幅に低減され、補助的なアノテーション情報がない。
さらに,長い尾の分布を持つ動作認識において,提案手法は,その性能を著しく向上させることが証明された。
関連論文リスト
- Towards Long-Tailed Recognition for Graph Classification via
Collaborative Experts [10.99232053983369]
我々は,CoMe(Collaborative Multi-expert Learning)を用いたグラフレベル分類フレームワークを提案する。
頭と尾の授業のコントリビューションを均衡させるために,まず表現学習の観点から,バランスの取れたコントラスト学習を開発する。
マルチエキスパートフレームワークにおける協調を促進するために,複数の専門家の間でゲート融合・アンタングルド知識蒸留を実施している。
論文 参考訳(メタデータ) (2023-08-31T10:12:32Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - SuperDisco: Super-Class Discovery Improves Visual Recognition for the
Long-Tail [69.50380510879697]
我々は,長い尾の認識のための超クラス表現を発見するアルゴリズムであるSuperDiscoを提案する。
我々は,長期分布を扱うための表現学習を指導するために,超クラスグラフを構築することを学ぶ。
論文 参考訳(メタデータ) (2023-03-31T19:51:12Z) - PromptCAL: Contrastive Affinity Learning via Auxiliary Prompts for
Generalized Novel Category Discovery [39.03732147384566]
Generalized Novel Category Discovery (GNCD) 設定は、既知のクラスや新しいクラスから来るラベルなしのトレーニングデータを分類することを目的としている。
本稿では,この課題に対処するために,PromptCALと呼ばれる補助視覚プロンプトを用いたコントラスト親和性学習法を提案する。
提案手法は,クラストークンと視覚的プロンプトのための既知のクラスと新しいクラスのセマンティッククラスタリングを改善するために,信頼性の高いペアワイズサンプル親和性を発見する。
論文 参考訳(メタデータ) (2022-12-11T20:06:14Z) - Multi-level Contrast Network for Wearables-based Joint Activity
Segmentation and Recognition [10.828099015828693]
ウェアラブルを用いたヒューマンアクティビティ認識(HAR)は、多くのスマートヘルスケアアプリケーションで広く採用可能な、有望な研究である。
ほとんどのHARアルゴリズムは、必要不可欠なが滅多に悪用されないマルチクラスウィンドウ問題の影響を受けやすい。
我々は,HARにセグメンテーション技術を導入し,共同活動セグメンテーションと認識を実現した。
論文 参考訳(メタデータ) (2022-08-16T05:39:02Z) - Fine-Grained Visual Classification using Self Assessment Classifier [12.596520707449027]
識別的特徴の抽出は、きめ細かい視覚的分類タスクにおいて重要な役割を担っている。
本稿では,画像とトップkの予測クラスを同時に活用する自己評価手法を提案する。
本手法は,CUB200-2011,Stanford Dog,FGVC Aircraft のデータセットに対して,最新の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-05-21T07:41:27Z) - Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and
Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。
そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。
粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文 参考訳(メタデータ) (2021-08-15T02:21:01Z) - Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。
モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。
Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文 参考訳(メタデータ) (2020-07-20T05:57:42Z) - Deep Learning feature selection to unhide demographic recommender
systems factors [63.732639864601914]
行列分解モデルは意味的知識を含まない因子を生成する。
DeepUnHideは、協調フィルタリングレコメンデータシステムにおいて、ユーザとアイテムファクタから、人口統計情報を抽出することができる。
論文 参考訳(メタデータ) (2020-06-17T17:36:48Z) - Learning From Multiple Experts: Self-paced Knowledge Distillation for
Long-tailed Classification [106.08067870620218]
我々は,LFME(Learning From Multiple Experts)と呼ばれる自己評価型知識蒸留フレームワークを提案する。
提案するLFMEフレームワークは,複数の'Experts'からの知識を集約して,統一された学生モデルを学ぶ。
提案手法は,最先端の手法に比べて優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-01-06T12:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。