論文の概要: An Ensemble of Knowledge Sharing Models for Dynamic Hand Gesture
Recognition
- arxiv url: http://arxiv.org/abs/2008.05732v1
- Date: Thu, 13 Aug 2020 07:37:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 23:22:27.689231
- Title: An Ensemble of Knowledge Sharing Models for Dynamic Hand Gesture
Recognition
- Title(参考訳): ダイナミックハンドジェスチャー認識のための知識共有モデルの集合
- Authors: Kenneth Lai and Svetlana Yanushkevich
- Abstract要約: 本稿では,人間と機械の相互作用の文脈における動的ジェスチャー認識に着目した。
本稿では,2つのサブネットワーク,変圧器,命令ニューロン,長期記憶型リカレントニューラルネットワーク(RNN)からなるモデルを提案する。
提案された知識共有モデルのアンサンブルは、骨格情報のみを使用して全体の86.11%の精度を示す。
- 参考スコア(独自算出の注目度): 1.7158296436650335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The focus of this paper is dynamic gesture recognition in the context of the
interaction between humans and machines. We propose a model consisting of two
sub-networks, a transformer and an ordered-neuron long-short-term-memory
(ON-LSTM) based recurrent neural network (RNN). Each sub-network is trained to
perform the task of gesture recognition using only skeleton joints. Since each
sub-network extracts different types of features due to the difference in
architecture, the knowledge can be shared between the sub-networks. Through
knowledge distillation, the features and predictions from each sub-network are
fused together into a new fusion classifier. In addition, a cyclical learning
rate can be used to generate a series of models that are combined in an
ensemble, in order to yield a more generalizable prediction. The proposed
ensemble of knowledge-sharing models exhibits an overall accuracy of 86.11%
using only skeleton information, as tested using the Dynamic Hand Gesture-14/28
dataset
- Abstract(参考訳): 本稿では,人間と機械の相互作用の文脈における動的ジェスチャー認識に着目した。
本稿では,2つのサブネットワーク,トランスフォーマーと命令ニューロロン長期記憶(ON-LSTM)に基づくリカレントニューラルネットワーク(RNN)からなるモデルを提案する。
各サブネットワークは、骨格関節のみを用いてジェスチャー認識のタスクを実行するように訓練される。
各サブネットワークはアーキテクチャの違いによって異なるタイプの特徴を抽出するため、サブネットワーク間で知識を共有することができる。
知識蒸留により、各サブネットワークの特徴と予測を融合して新しい融合分類器となる。
さらに、循環学習率を使用して、より一般化可能な予測を得るために、アンサンブルに組み合わされた一連のモデルを生成することができる。
提案された知識共有モデルのアンサンブルは、Dynamic Hand Gesture-14/28データセットを用いて、骨格情報のみを使用して、全体の86.11%の精度を示す。
関連論文リスト
- Transfer Learning with Reconstruction Loss [12.906500431427716]
本稿では,モデルに新たな再構築段階を追加することで,新たなモデル学習手法を提案する。
提案手法は、学習した特徴を一般化し、伝達しやすくし、効率的な伝達学習に容易に利用できる。
数値シミュレーションでは、MNIST手書き桁の転送学習、デバイス間無線ネットワークの電力割り当て、複数入出力ネットワークのダウンリンクビームフォーミングとローカライゼーションの3つの応用が研究されている。
論文 参考訳(メタデータ) (2024-03-31T00:22:36Z) - Squeeze aggregated excitation network [0.0]
畳み込みニューラルネットワークは、視覚タスクのパターンを読み取る空間表現を持つ。
本稿では,Squeeze集約励起ネットワークであるSaEnetを提案する。
論文 参考訳(メタデータ) (2023-08-25T12:30:48Z) - Joint-bone Fusion Graph Convolutional Network for Semi-supervised
Skeleton Action Recognition [65.78703941973183]
本稿では,CD-JBF-GCNをエンコーダとし,ポーズ予測ヘッドをデコーダとして使用する新しい相関駆動型ジョイントボーン・フュージョングラフ畳み込みネットワークを提案する。
具体的には、CD-JBF-GCは、関節ストリームと骨ストリームの間の運動伝達を探索することができる。
自己教師型トレーニング段階におけるポーズ予測に基づくオートエンコーダにより、未ラベルデータから動作表現を学習することができる。
論文 参考訳(メタデータ) (2022-02-08T16:03:15Z) - Hierarchical Variational Memory for Few-shot Learning Across Domains [120.87679627651153]
本稿では,プロトタイプの各レベルが階層メモリから対応する情報を取得する階層型プロトタイプモデルを提案する。
このモデルには、ドメインシフトの状況が要求される場合、異なるセマンティックレベルの機能を柔軟に依存する能力が備わっている。
モデルにおける各コンポーネントの有効性を示すために、徹底的なアブレーション研究を行っている。
論文 参考訳(メタデータ) (2021-12-15T15:01:29Z) - Multi-Scale Semantics-Guided Neural Networks for Efficient
Skeleton-Based Human Action Recognition [140.18376685167857]
スケルトンに基づく行動認識には,単純なマルチスケールセマンティクス誘導ニューラルネットワークが提案されている。
MS-SGNは、NTU60、NTU120、SYSUデータセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-11-07T03:50:50Z) - PredRNN: A Recurrent Neural Network for Spatiotemporal Predictive
Learning [109.84770951839289]
歴史的文脈からビジュアルダイナミクスを学習するための新しいリカレントネットワークであるPredRNNを紹介する。
本手法は,3つの標準データセット上で高い競争結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-17T08:28:30Z) - Gesture Recognition from Skeleton Data for Intuitive Human-Machine
Interaction [0.6875312133832077]
本稿では,手工芸品の集合に基づく動的ジェスチャーのセグメント化と分類のためのアプローチを提案する。
ジェスチャー認識方法はスライディングウィンドウを適用し、空間次元と時間次元の両方から情報を抽出する。
最終的に、認識されたジェスチャーは、協調ロボットと対話するために使用される。
論文 参考訳(メタデータ) (2020-08-26T11:28:50Z) - CNN+RNN Depth and Skeleton based Dynamic Hand Gesture Recognition [3.0255457622022486]
本稿では、畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)の2つのディープラーニング技術のパワーを組み合わせることを提案する。
全体的な精度は85.46%で、ダイナミックハンドジェスチャ14/28データセットで達成されている。
論文 参考訳(メタデータ) (2020-07-22T10:25:19Z) - Incremental Training of a Recurrent Neural Network Exploiting a
Multi-Scale Dynamic Memory [79.42778415729475]
本稿では,マルチスケール学習を対象とする,漸進的に訓練された再帰的アーキテクチャを提案する。
隠れた状態を異なるモジュールに分割することで、シンプルなRNNのアーキテクチャを拡張する方法を示す。
新しいモジュールがモデルに反復的に追加され、徐々に長い依存関係を学習するトレーニングアルゴリズムについて議論する。
論文 参考訳(メタデータ) (2020-06-29T08:35:49Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。