論文の概要: Pose-Aware Multi-Level Motion Parsing for Action Quality Assessment
- arxiv url: http://arxiv.org/abs/2511.05611v1
- Date: Thu, 06 Nov 2025 13:00:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.494043
- Title: Pose-Aware Multi-Level Motion Parsing for Action Quality Assessment
- Title(参考訳): 行動品質評価のためのポーズ対応マルチレベル動作解析
- Authors: Shuaikang Zhu, Yang Yang, Chen Sun,
- Abstract要約: 人間のポーズは行動品質評価(AQA)の基礎となる。
本稿では,空間的・時間的特徴の強化によるAQAのための新しいマルチレベルモーションフレームワークを提案する。
本フレームワークは,アクションセグメンテーションとアクションスコアリングの両タスクにおいて,最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 7.956640274660439
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Human pose serves as a cornerstone of action quality assessment (AQA), where subtle spatial-temporal variations in pose often distinguish excellence from mediocrity. In high-level competitions, these nuanced differences become decisive factors in scoring. In this paper, we propose a novel multi-level motion parsing framework for AQA based on enhanced spatial-temporal pose features. On the first level, the Action-Unit Parser is designed with the help of pose extraction to achieve precise action segmentation and comprehensive local-global pose representations. On the second level, Motion Parser is used by spatial-temporal feature learning to capture pose changes and appearance details for each action-unit. Meanwhile, some special conditions other than body-related will impact action scoring, like water splash in diving. In this work, we design an additional Condition Parser to offer users more flexibility in their choices. Finally, Weight-Adjust Scoring Module is introduced to better accommodate the diverse requirements of various action types and the multi-scale nature of action-units. Extensive evaluations on large-scale diving sports datasets demonstrate that our multi-level motion parsing framework achieves state-of-the-art performance in both action segmentation and action scoring tasks.
- Abstract(参考訳): 人間のポーズは行動品質評価(AQA)の基盤として機能し、ポーズにおける微妙な空間的・時間的変動は、メディオクリティーと区別されることが多い。
高レベルの競技では、これらの微妙な違いが得点の決定的な要因となる。
本稿では,空間的・時間的ポーズの強化に基づく,AQAのための新しい多段階動作解析フレームワークを提案する。
最初のレベルでは、アクションセグメンテーションと包括的なローカル-グローバルなポーズ表現を実現するために、アクション抽出の助けを借りてAction-Unit Parserが設計されている。
第2のレベルでは、モーションパーサーは空間的時間的特徴学習によって、各アクションユニットのポーズの変化と外観の詳細をキャプチャするために使用される。
一方、身体関連以外の特別な条件は、ダイビング時の水しぶきなど、アクションスコアに影響を及ぼす。
この作業では、ユーザに選択した柔軟性を提供するために、追加の条件パーザを設計します。
最後に、様々なアクションタイプの多様な要求とアクションユニットのマルチスケールな性質に適合させるために、Weight-Adjust Scoring Moduleが導入された。
大規模ダイビングスポーツデータセットに対する広範囲な評価は、我々の多段階動作解析フレームワークがアクションセグメンテーションとアクションスコアリングの両方において最先端のパフォーマンスを達成することを示す。
関連論文リスト
- Action Quality Assessment via Hierarchical Pose-guided Multi-stage Contrastive Regression [46.25518274714238]
アクションアセスメント(AQA)は、運動性能の自動的、公平な評価を目的としている。
現在の手法では、動画を固定フレームに分割することに集中しており、サブアクションの時間的連続性を損なう。
階層的なポーズ誘導型多段階コントラスト回帰による行動品質評価手法を提案する。
論文 参考訳(メタデータ) (2025-01-07T10:20:16Z) - DiverseMotion: Towards Diverse Human Motion Generation via Discrete
Diffusion [70.33381660741861]
テキスト記述に基づく高品質な人間の動作を合成するための新しいアプローチであるDiverseMotionを提案する。
我々のDiverseMotionは、最先端のモーション品質と競争力の多様性を達成できることを示す。
論文 参考訳(メタデータ) (2023-09-04T05:43:48Z) - Action Sensitivity Learning for Temporal Action Localization [35.65086250175736]
本稿では,時間的行動ローカライゼーションの課題に取り組むために,行動感性学習フレームワーク(ASL)を提案する。
まず、クラスレベルでのアクション感度とインスタンスレベルでのアクション感度を学習するための軽量なアクション感度評価器を導入する。
各フレームの動作感度に基づいて、アクション認識フレームを正のペアとしてサンプリングし、アクション非関連フレームを除去する機能を強化するために、アクション感性コントラスト損失を設計する。
論文 参考訳(メタデータ) (2023-05-25T04:19:14Z) - Multi-modal Prompting for Low-Shot Temporal Action Localization [95.19505874963751]
低ショット(ゼロショット・少数ショット)シナリオ下での時間的行動局所化の問題点を考察する。
クラスに依存しない2段階のアクションローカライズアーキテクチャをTransformerに導入し,その後にオープン語彙分類を行った。
論文 参考訳(メタデータ) (2023-03-21T10:40:13Z) - EAN: Event Adaptive Network for Enhanced Action Recognition [66.81780707955852]
本稿では,映像コンテンツの動的性質を調査するための統合された行動認識フレームワークを提案する。
まず、局所的な手がかりを抽出する際に、動的スケールの時空間カーネルを生成し、多様な事象を適応的に適合させる。
第2に、これらのキューを正確にグローバルなビデオ表現に集約するために、トランスフォーマーによって選択されたいくつかの前景オブジェクト間のインタラクションのみをマイニングすることを提案する。
論文 参考訳(メタデータ) (2021-07-22T15:57:18Z) - Semi-Supervised Few-Shot Atomic Action Recognition [59.587738451616495]
半教師付き数発のアトミック・アクション認識のための新しいモデルを提案する。
我々のモデルは、教師なしおよびコントラスト付きビデオ埋め込み、ゆるやかなアクションアライメント、マルチヘッド特徴比較、アテンションベースのアグリゲーションを特徴としている。
実験により,本モデルは,それぞれの最先端の分類精度よりも高い精度を全監督条件下で達成できることが確認された。
論文 参考訳(メタデータ) (2020-11-17T03:59:05Z) - FineGym: A Hierarchical Video Dataset for Fine-grained Action
Understanding [118.32912239230272]
FineGymは体操ビデオの上に構築された新しいアクション認識データセットだ。
アクションレベルとサブアクションレベルの両方で3レベルのセマンティック階層を持つテンポラリアノテーションを提供する。
この新たな粒度レベルは、行動認識に重大な課題をもたらす。
論文 参考訳(メタデータ) (2020-04-14T17:55:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。