論文の概要: Integrating Features for Recognizing Human Activities through Optimized Parameters in Graph Convolutional Networks and Transformer Architectures
- arxiv url: http://arxiv.org/abs/2408.16442v1
- Date: Thu, 29 Aug 2024 11:07:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-30 14:12:45.198665
- Title: Integrating Features for Recognizing Human Activities through Optimized Parameters in Graph Convolutional Networks and Transformer Architectures
- Title(参考訳): グラフ畳み込みネットワークとトランスフォーマーアーキテクチャにおける最適パラメータによる人間の活動認識機能の統合
- Authors: Mohammad Belal, Taimur Hassan, Abdelfatah Hassan, Nael Alsheikh, Noureldin Elhendawi, Irfan Hussain,
- Abstract要約: 本研究は,特徴融合が行動認識の精度に与える影響を強調した。
2つのディープラーニングモデル、特にTransformerモデルとGraph Convolutional Network(PO-GCN)の精度とF1スコアを評価した。
PO-GCNは活動認識において標準モデルより優れている。
- 参考スコア(独自算出の注目度): 0.6157382820537721
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human activity recognition is a major field of study that employs computer vision, machine vision, and deep learning techniques to categorize human actions. The field of deep learning has made significant progress, with architectures that are extremely effective at capturing human dynamics. This study emphasizes the influence of feature fusion on the accuracy of activity recognition. This technique addresses the limitation of conventional models, which face difficulties in identifying activities because of their limited capacity to understand spatial and temporal features. The technique employs sensory data obtained from four publicly available datasets: HuGaDB, PKU-MMD, LARa, and TUG. The accuracy and F1-score of two deep learning models, specifically a Transformer model and a Parameter-Optimized Graph Convolutional Network (PO-GCN), were evaluated using these datasets. The feature fusion technique integrated the final layer features from both models and inputted them into a classifier. Empirical evidence demonstrates that PO-GCN outperforms standard models in activity recognition. HuGaDB demonstrated a 2.3% improvement in accuracy and a 2.2% increase in F1-score. TUG showed a 5% increase in accuracy and a 0.5% rise in F1-score. On the other hand, LARa and PKU-MMD achieved lower accuracies of 64% and 69% respectively. This indicates that the integration of features enhanced the performance of both the Transformer model and PO-GCN.
- Abstract(参考訳): 人間の行動認識は、人間の行動の分類にコンピュータビジョン、機械ビジョン、深層学習技術を用いる主要な研究分野である。
ディープラーニングの分野は、人間のダイナミクスを捉えるのに非常に効果的なアーキテクチャによって、大きな進歩を遂げた。
本研究は,特徴融合が行動認識の精度に与える影響を強調した。
本手法は,空間的特徴や時間的特徴を理解する能力に限界があるため,活動を特定するのに困難を伴う従来のモデルの限界に対処する。
この技術は、HuGaDB、PKU-MMD、LARa、TUGの4つの公開データセットから得られた知覚データを利用する。
これらのデータセットを用いて、2つのディープラーニングモデル、特にトランスフォーマーモデルとパラメータ最適化グラフ畳み込みネットワーク(PO-GCN)の精度とF1スコアを評価した。
特徴融合技術は両方のモデルから最終層の特徴を統合し、それらを分類器に入力した。
実証的な証拠は、PO-GCNが活性認識の標準モデルより優れていることを示している。
HuGaDBは精度が2.3%向上し、F1スコアが2.2%向上した。
TUGの精度は5%上昇し、F1スコアは0.5%上昇した。
一方,LARaとPKU-MMDはいずれも64%,PKU-MMDは69%であった。
このことは、機能の統合によってTransformerモデルとPO-GCNの性能が向上したことを示している。
関連論文リスト
- Handling Geometric Domain Shifts in Semantic Segmentation of Surgical RGB and Hyperspectral Images [67.66644395272075]
本稿では,幾何学的アウト・オブ・ディストリビューションデータに直面する場合の,最先端のセマンティックセマンティックセマンティクスモデルの最初の解析を行う。
本稿では, 汎用性を高めるために, 有機移植(Organ Transplantation)と呼ばれる拡張技術を提案する。
我々の拡張技術は、RGBデータに対して最大67%、HSIデータに対して90%のSOAモデル性能を改善し、実際のOODテストデータに対して、分配内パフォーマンスのレベルでのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-27T19:13:15Z) - Feature Fusion for Human Activity Recognition using Parameter-Optimized Multi-Stage Graph Convolutional Network and Transformer Models [0.6157382820537721]
この研究は、HuGaDB、PKU-MMD、LARa、TUGデータセットからの知覚データを用いている。
PO-MS-GCNとTransformerの2つのモデルが訓練され評価され、PO-MS-GCNは最先端モデルを上回った。
HuGaDBとTUGは高い精度とf1スコアを獲得し、LARaとPKU-MMDは低いスコアを示した。
論文 参考訳(メタデータ) (2024-06-24T13:44:06Z) - Impact of Domain Knowledge and Multi-Modality on Intelligent Molecular Property Prediction: A Systematic Survey [22.73437302209673]
様々なベンチマークに基づいて,近年のディープラーニング手法を検証,定量的に分析する。
分子情報の統合は、回帰処理と分類処理の両方において分子特性予測(MPP)を大幅に改善する。
また、1D SMILESによる2Dグラフの強化により、回帰タスクのマルチモーダル学習性能が最大9.1%向上し、3D情報による2Dグラフの増大により、分類タスクのパフォーマンスが最大13.2%向上することを発見した。
論文 参考訳(メタデータ) (2024-02-11T17:29:58Z) - New Approach for an Affective Computing-Driven Quality of Experience
(QoE) Prediction [0.0]
本稿では,感情型コンピュータ駆動のQuality of Experience(QoE)予測の新しいモデルを提案する。
The best results were obtained with a LSTM based model, presented a F1-score from 68% to 78%。
論文 参考訳(メタデータ) (2023-11-05T13:21:07Z) - Data-Centric Long-Tailed Image Recognition [49.90107582624604]
ロングテールモデルは高品質なデータに対する強い需要を示している。
データ中心のアプローチは、モデルパフォーマンスを改善するために、データの量と品質の両方を強化することを目的としています。
現在、情報強化の有効性を説明するメカニズムに関する研究が不足している。
論文 参考訳(メタデータ) (2023-11-03T06:34:37Z) - Robust Learning with Progressive Data Expansion Against Spurious
Correlation [65.83104529677234]
本研究では,2層非線形畳み込みニューラルネットワークの学習過程について検討した。
分析の結果,不均衡なデータ群と学習容易なスプリアス特徴が学習過程におけるスプリアス特徴の優位性に繋がる可能性が示唆された。
本稿では,PDEと呼ばれる新たなトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-08T05:44:06Z) - Skeleton-based Human Action Recognition via Convolutional Neural
Networks (CNN) [4.598337780022892]
骨格に基づく行動認識における最先端の貢献のほとんどは、人体を表現し特徴を抽出するグラフニューラルネットワーク(GCN)アーキテクチャを取り入れている。
我々の研究は、CNNがGCNに匹敵する結果が得られることを実証し、適切なトレーニング手法、強化、拡張が適用できることを示した。
論文 参考訳(メタデータ) (2023-01-31T01:26:17Z) - Directed Acyclic Graph Factorization Machines for CTR Prediction via
Knowledge Distillation [65.62538699160085]
本稿では,既存の複雑な相互作用モデルから,知識蒸留によるCTR予測のための高次特徴相互作用を学習するための非巡回グラフファクトリゼーションマシン(KD-DAGFM)を提案する。
KD-DAGFMは、オンラインとオフラインの両方の実験において、最先端のFLOPの21.5%未満で最高の性能を達成する。
論文 参考訳(メタデータ) (2022-11-21T03:09:42Z) - Learning Diversified Feature Representations for Facial Expression
Recognition in the Wild [97.14064057840089]
本稿では,CNN層が抽出した顔表情認識アーキテクチャの特徴を多様化する機構を提案する。
AffectNet,FER+,RAF-DBの3つの顔表情認識実験の結果,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-10-17T19:25:28Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - Facial Emotion Recognition: State of the Art Performance on FER2013 [0.0]
FER2013データセットで最高の単一ネットワーク分類精度を達成しました。
我々のモデルは、追加のトレーニングデータを用いることなく、FER2013上で73.28 %の最先端のシングルネットワーク精度を実現する。
論文 参考訳(メタデータ) (2021-05-08T04:20:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。