論文の概要: Spatial Transformer Network with Transfer Learning for Small-scale
Fine-grained Skeleton-based Tai Chi Action Recognition
- arxiv url: http://arxiv.org/abs/2206.15002v1
- Date: Thu, 30 Jun 2022 03:25:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-01 14:48:06.274765
- Title: Spatial Transformer Network with Transfer Learning for Small-scale
Fine-grained Skeleton-based Tai Chi Action Recognition
- Title(参考訳): 微粒スケルトンを用いたタイチ行動認識のための伝達学習を用いた空間変換器ネットワーク
- Authors: Lin Yuan, Zhen He, Qiang Wang, Leiyang Xu, Xiang Ma
- Abstract要約: ニューラルネットワークを用いて,小型できめ細かな台知行動データセットを認識できる。
NTU RGB+Dデータセットを用いた転送学習手法を提案する。
実験結果から,我々の汎用モデルパイプラインは,小型できめ細かな太知動作認識の精度が高いことがわかった。
- 参考スコア(独自算出の注目度): 15.300957157881784
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human action recognition is a quite hugely investigated area where most
remarkable action recognition networks usually use large-scale coarse-grained
action datasets of daily human actions as inputs to state the superiority of
their networks. We intend to recognize our small-scale fine-grained Tai Chi
action dataset using neural networks and propose a transfer-learning method
using NTU RGB+D dataset to pre-train our network. More specifically, the
proposed method first uses a large-scale NTU RGB+D dataset to pre-train the
Transformer-based network for action recognition to extract common features
among human motion. Then we freeze the network weights except for the fully
connected (FC) layer and take our Tai Chi actions as inputs only to train the
initialized FC weights. Experimental results show that our general model
pipeline can reach a high accuracy of small-scale fine-grained Tai Chi action
recognition with even few inputs and demonstrate that our method achieves the
state-of-the-art performance compared with previous Tai Chi action recognition
methods.
- Abstract(参考訳): 人間の行動認識は、最も顕著な行動認識ネットワークが、通常、日々の行動の大規模な粗い行動データセットを、ネットワークの優越性を記述する入力として利用する、非常に大きな研究領域である。
我々は,ニューラルネットワークを用いて小型のタイチアクションデータセットを認識し,ntu rgb+dデータセットを用いたトランスファーラーニング手法を提案する。
より具体的には、提案手法はまず大規模なNTU RGB+Dデータセットを用いて、行動認識のためのTransformerベースのネットワークを事前訓練し、人間の動きの共通特徴を抽出する。
次に、完全連結(FC)層を除いてネットワークウェイトを凍結し、タイチ動作を入力として、初期化されたFCウェイトをトレーニングする。
実験結果から,我々の汎用モデルパイプラインは,たとえ入力が少なくても,小型のタイチ動作認識を高精度に達成できることを示すとともに,従来のタイチ動作認識法と比較して,最先端の性能を達成できることを示す。
関連論文リスト
- Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Out-of-Distribution Detection using Neural Activation Prior [15.673290330356194]
アウト・オブ・ディストリビューション検出(OOD)は、機械学習モデルを現実世界にデプロイする上で重要な技術である。
OOD検出のためのシンプルで効果的なニューラルアクティベーションプリミティブ(NAP)を提案する。
提案手法は,CIFARベンチマークとImageNetデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-02-28T08:45:07Z) - Advances on Concept Drift Detection in Regression Tasks using Social
Networks Theory [5.25961378238154]
スケールフリーネットワークレグレシタ (SFNR) は、ソーシャルネットワーク理論を用いた動的アンサンブルに基づく回帰手法である。
概念のドリフトを検出するため、SFNRはAdaptive Window (ADWIN)アルゴリズムを使用している。
その結果,特にコンセプトドリフト時の精度が向上した。
論文 参考訳(メタデータ) (2023-04-19T16:13:28Z) - Human Activity Recognition from Wi-Fi CSI Data Using Principal
Component-Based Wavelet CNN [3.9533044769534444]
HAR(Human Activity Recognition)は、監視、セキュリティ、医療分野に応用された新興技術である。
実用リアルタイムアプリケーションにロバスト性と効率性を提供する新しいアプローチとして,主成分に基づくウェーブレット畳み込みニューラルネットワーク(PCWCNN)を提案する。
提案したPCWCNNモデルが,既存のアプローチよりも優れた実データセットで非常によく動作することを実証的に示す。
論文 参考訳(メタデータ) (2022-12-26T13:45:19Z) - UMSNet: An Universal Multi-sensor Network for Human Activity Recognition [10.952666953066542]
本稿では,人間行動認識のためのユニバーサルマルチセンサネットワーク(UMSNet)を提案する。
特に,新しい軽量センサ残差ブロック(LSRブロック)を提案する。
我々のフレームワークは明確な構造を持ち、様々な種類のマルチモーダル時系列分類タスクに直接適用することができる。
論文 参考訳(メタデータ) (2022-05-24T03:29:54Z) - Adaptive Convolutional Dictionary Network for CT Metal Artifact
Reduction [62.691996239590125]
本稿では,金属人工物削減のための適応畳み込み辞書ネットワーク(ACDNet)を提案する。
我々のACDNetは、トレーニングデータを介して、アーティファクトフリーCT画像の事前を自動で学習し、入力されたCT画像ごとに表現カーネルを適応的に調整することができる。
本手法は,モデルに基づく手法の明確な解釈可能性を継承し,学習に基づく手法の強力な表現能力を維持する。
論文 参考訳(メタデータ) (2022-05-16T06:49:36Z) - Neural Maximum A Posteriori Estimation on Unpaired Data for Motion
Deblurring [87.97330195531029]
本稿では、ニューラルネットワークをトレーニングし、失明したデータから視覚情報や鋭いコンテンツを復元するためのニューラルネットワークの最大Aポストエリオリ(NeurMAP)推定フレームワークを提案する。
提案されたNeurMAPは、既存のデブロアリングニューラルネットワークに対するアプローチであり、未使用データセット上のイメージデブロアリングネットワークのトレーニングを可能にする最初のフレームワークである。
論文 参考訳(メタデータ) (2022-04-26T08:09:47Z) - Joint-bone Fusion Graph Convolutional Network for Semi-supervised
Skeleton Action Recognition [65.78703941973183]
本稿では,CD-JBF-GCNをエンコーダとし,ポーズ予測ヘッドをデコーダとして使用する新しい相関駆動型ジョイントボーン・フュージョングラフ畳み込みネットワークを提案する。
具体的には、CD-JBF-GCは、関節ストリームと骨ストリームの間の運動伝達を探索することができる。
自己教師型トレーニング段階におけるポーズ予測に基づくオートエンコーダにより、未ラベルデータから動作表現を学習することができる。
論文 参考訳(メタデータ) (2022-02-08T16:03:15Z) - Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。
ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。
提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-02T07:50:50Z) - Self-supervised Human Activity Recognition by Learning to Predict
Cross-Dimensional Motion [16.457778420360537]
スマートフォン加速度計データを用いた人間行動認識のための自己教師型学習法を提案する。
まず、ラベルなし入力信号の表現は、深層畳み込みニューラルネットワークを訓練して加速度計値のセグメントを予測することによって学習される。
このタスクでは、凍結ネットワークの端に多数の完全に接続されたレイヤを追加し、ラベル付き加速度センサ信号で付加されたレイヤをトレーニングし、人間の活動の分類を学ぶ。
論文 参考訳(メタデータ) (2020-10-21T02:14:31Z) - Towards Accurate Knowledge Transfer via Target-awareness Representation
Disentanglement [56.40587594647692]
本稿では,TRED(Target-Awareness Representation Disentanglement)の概念を取り入れた新しいトランスファー学習アルゴリズムを提案する。
TREDは、対象のタスクに関する関連する知識を元のソースモデルから切り離し、ターゲットモデルを微調整する際、レギュレータとして使用する。
各種実世界のデータセットを用いた実験により,本手法は標準微調整を平均2%以上安定的に改善することが示された。
論文 参考訳(メタデータ) (2020-10-16T17:45:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。