論文の概要: Video-based Exercise Classification and Activated Muscle Group Prediction with Hybrid X3D-SlowFast Network
- arxiv url: http://arxiv.org/abs/2406.06703v1
- Date: Mon, 10 Jun 2024 18:05:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-12 20:35:12.736895
- Title: Video-based Exercise Classification and Activated Muscle Group Prediction with Hybrid X3D-SlowFast Network
- Title(参考訳): ハイブリッドX3D-SlowFastネットワークを用いたビデオベース運動分類と活動筋群予測
- Authors: Manvik Pasula, Pramit Saha,
- Abstract要約: 本稿では,運動分類と筋群活性化予測(MGAP)のための簡易かつ効果的な戦略を提案する。
この分野における以前の研究は、主に搭載されたセンサーへの依存と限られた運動範囲によって支配されている。
我々の研究は、幅広いエクササイズと筋群を含むビデオベースのディープラーニングフレームワークを用いている。
- 参考スコア(独自算出の注目度): 2.9312156642007303
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper introduces a simple yet effective strategy for exercise classification and muscle group activation prediction (MGAP). These tasks have significant implications for personal fitness, facilitating more affordable, accessible, safer, and simpler exercise routines. This is particularly relevant for novices and individuals with disabilities. Previous research in the field is mostly dominated by the reliance on mounted sensors and a limited scope of exercises, reducing practicality for everyday use. Furthermore, existing MGAP methodologies suffer from a similar dependency on sensors and a restricted range of muscle groups, often excluding strength training exercises, which are pivotal for a comprehensive fitness regimen. Addressing these limitations, our research employs a video-based deep learning framework that encompasses a broad spectrum of exercises and muscle groups, including those vital for strength training. Utilizing the "Workout/Exercises Video" dataset, our approach integrates the X3D and SlowFast video activity recognition models in an effective way to enhance exercise classification and MGAP performance. Our findings demonstrate that this hybrid method obtained via weighted ensemble outperforms existing baseline models in accuracy. Pretrained models play a crucial role in enhancing overall performance, with optimal channel reduction values for the SlowFast model identified near 10. Through an ablation study that explores fine-tuning, we further elucidate the interrelation between the two tasks. Our composite model, a weighted-average ensemble of X3D and SlowFast, sets a new benchmark in both exercise classification and MGAP across all evaluated categories, offering a robust solution to the limitations of previous approaches.
- Abstract(参考訳): 本稿では,運動分類と筋群活性化予測(MGAP)のための簡易かつ効果的な戦略を提案する。
これらのタスクは、より手頃で、アクセスしやすく、安全で、より簡単なエクササイズルーチンを促進するために、個人のフィットネスに重要な意味を持つ。
これは特に障害のある初心者や個人に関係している。
この分野におけるこれまでの研究は、主に搭載センサーへの依存と運動範囲の制限によって支配されており、日常的な使用の実用性が低下している。
さらに、既存のMGAP法は、センサーと制限された筋肉群への同様の依存に悩まされ、多くの場合、総合的なフィットネスレギュレーションにおいて重要な強度トレーニング演習を除外する。
これらの制限に対処するために、我々の研究は、力トレーニングに不可欠な運動や筋グループを含む幅広い範囲の運動を含む、ビデオベースのディープラーニングフレームワークを使用している。
ワークアウト/エクササイズビデオ」データセットを利用することで、エクササイズ分類とMGAP性能を向上させる効果的な方法として、X3DとSlowFastのビデオアクティビティ認識モデルを統合する。
その結果,重み付けアンサンブルにより得られたハイブリッド手法は,既存のベースラインモデルよりも精度が高いことがわかった。
事前学習したモデルは,SlowFastモデルに対して,10付近で同定された最適なチャネル縮小値を用いて,全体的な性能向上に重要な役割を果たす。
微調整を探求するアブレーション研究を通じて、この2つのタスク間の相互関係をさらに解明する。
X3DとSlowFastの重み付き平均アンサンブルである我々の複合モデルは、すべての評価カテゴリーでエクササイズ分類とMGAPの両方の新しいベンチマークを設定し、従来のアプローチの限界に対する堅牢な解決策を提供する。
関連論文リスト
- Intelligent Repetition Counting for Unseen Exercises: A Few-Shot Learning Approach with Sensor Signals [0.4998632546280975]
本研究は、IMU信号の解析により、運動繰り返しを自動カウントする方法を開発した。
本稿では,深度測定に基づく数点学習手法を用いた反復カウント手法を提案する。
86.8%の確率で、28回の異なるエクササイズで1セットに10回以上の繰り返しを正確に数えることが可能である。
論文 参考訳(メタデータ) (2024-10-01T05:04:40Z) - On Machine Learning Approaches for Protein-Ligand Binding Affinity Prediction [2.874893537471256]
本研究では,タンパク質-リガンド結合親和性予測における古典的木モデルと高度なニューラルネットワークの性能を評価する。
2次元モデルと3次元モデルを組み合わせることで、現在の最先端のアプローチを超えて、アクティブな学習結果が向上することを示す。
論文 参考訳(メタデータ) (2024-07-15T13:06:00Z) - Efficient Continual Pre-training by Mitigating the Stability Gap [68.49269649759005]
本研究では,Large Language Models (LLM) の継続事前学習における挙動について検討する。
固定された計算予算内でのLLM性能を向上させるための3つの効果的な戦略を提案する。
当社の戦略は,OpenLlama-3Bモデルの平均医療タスク性能を36.2%から40.7%に改善し,当初のトレーニング予算の40%に過ぎなかった。
論文 参考訳(メタデータ) (2024-06-21T02:28:37Z) - Rehabilitation Exercise Quality Assessment through Supervised Contrastive Learning with Hard and Soft Negatives [2.166000001057538]
運動ベースのリハビリテーションプログラムは、生活の質を高め、死亡率と再入院率を減らすのに有効であることが証明されている。
これらのプログラムは一般的に様々なエクササイズタイプを規定しており、リハビリテーションエクササイズアセスメントデータセットにおいて明確な課題となっている。
本稿では,すべての運動タイプに適用可能な単一モデルをトレーニングするための,硬質で軟質な負のサンプルを用いた教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-05T08:38:25Z) - Sample Less, Learn More: Efficient Action Recognition via Frame Feature
Restoration [59.6021678234829]
本稿では,2つのスパースサンプリングおよび隣接するビデオフレームの中間特徴を復元する新しい手法を提案する。
提案手法の統合により, 一般的な3つのベースラインの効率は50%以上向上し, 認識精度は0.5%低下した。
論文 参考訳(メタデータ) (2023-07-27T13:52:42Z) - TWINS: A Fine-Tuning Framework for Improved Transferability of
Adversarial Robustness and Generalization [89.54947228958494]
本稿では,様々な分類タスクにおいて,逆向きに事前訓練されたモデルの微調整に焦点を当てる。
本稿では,TWINS(Two-WIng NormliSation)ファインチューニングフレームワークを提案する。
TWINSは、一般化とロバスト性の両方の観点から、幅広い画像分類データセットに有効であることが示されている。
論文 参考訳(メタデータ) (2023-03-20T14:12:55Z) - Towards Activated Muscle Group Estimation in the Wild [44.7050439903772]
野生の身体活動における活動筋領域の同定を目的としたビデオベースの活動筋群推定(AMGE)の課題に取り組む。
我々は135の異なる活動と20のラベル付き筋群を持つ15Kビデオクリップを特徴とする筋マップデータセットを提供する。
このデータセットはYouTubeのビデオで構築されており、特にハイインテンシティ・インターバルトレーニング(HIIT)をターゲットとしている。
論文 参考訳(メタデータ) (2023-03-02T04:12:53Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Delving into 3D Action Anticipation from Streaming Videos [99.0155538452263]
アクション予測は、部分的な観察でアクションを認識することを目的としている。
本稿では,いくつかの相補的評価指標を導入し,フレームワイド動作分類に基づく基本モデルを提案する。
また,全動作表現とクラス非依存行動ラベルという2つの側面から補助情報を取り入れたマルチタスク学習戦略についても検討する。
論文 参考訳(メタデータ) (2019-06-15T10:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。