Fugu-MT 論文翻訳(概要): Unlabeled Action Quality Assessment Based on Multi-dimensional Adaptive Constrained Dynamic Time Warping

論文の概要: Unlabeled Action Quality Assessment Based on Multi-dimensional Adaptive Constrained Dynamic Time Warping

arxiv url: http://arxiv.org/abs/2410.14161v2
Date: Sun, 27 Oct 2024 09:23:05 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:37.316077
Title: Unlabeled Action Quality Assessment Based on Multi-dimensional Adaptive Constrained Dynamic Time Warping
Title（参考訳）: 多次元適応型動的時間ワープに基づくラベルなし動作品質評価
Authors: Renguang Chen, Guolong Zheng, Xu Yang, Zhide Chen, Jiwu Shu, Wencheng Yang, Kexin Zhu, Chen Feng,
Abstract要約: 本稿では,動作品質評価のためのMED-ACDTW法を提案する。提案手法では2次元および3次元の空間次元と複数の人体特徴を用いてテンプレートとテストビデオの特徴を比較する。適応的制約スキームは、行動品質評価の判別可能性を約30%向上させる。
参考スコア（独自算出の注目度）: 12.639728404278255
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The growing popularity of online sports and exercise necessitates effective methods for evaluating the quality of online exercise executions. Previous action quality assessment methods, which relied on labeled scores from motion videos, exhibited slightly lower accuracy and discriminability. This limitation hindered their rapid application to newly added exercises. To address this problem, this paper presents an unlabeled Multi-Dimensional Exercise Distance Adaptive Constrained Dynamic Time Warping (MED-ACDTW) method for action quality assessment. Our approach uses an athletic version of DTW to compare features from template and test videos, eliminating the need for score labels during training. The result shows that utilizing both 2D and 3D spatial dimensions, along with multiple human body features, improves the accuracy by 2-3% compared to using either 2D or 3D pose estimation alone. Additionally, employing MED for score calculation enhances the precision of frame distance matching, which significantly boosts overall discriminability. The adaptive constraint scheme enhances the discriminability of action quality assessment by approximately 30%. Furthermore, to address the absence of a standardized perspective in sports class evaluations, we introduce a new dataset called BGym.
Abstract（参考訳）: オンラインスポーツやエクササイズの普及は、オンラインエクササイズの実行の質を評価する効果的な方法を必要としている。従来の動作品質評価手法は動画のラベル付きスコアに依存していたが, 精度はわずかに低下し, 識別性も低下した。この制限により、新たな演習への迅速な適用が妨げられた。そこで本研究では,動作品質評価のための多次元運動距離適応動的時間ワープ(MED-ACDTW)手法を提案する。我々のアプローチでは、DTWの運動バージョンを使用してテンプレートとテストビデオの特徴を比較し、トレーニング中にスコアラベルを不要にする。その結果,2次元と3次元の両方の空間次元と複数の人体の特徴を併用することにより,2次元と3次元のポーズ推定だけで比較すると精度が2-3%向上することがわかった。さらに、スコア計算にMEDを用いると、フレーム距離マッチングの精度が向上し、全体的な識別性が著しく向上する。適応的制約スキームは、行動品質評価の判別可能性を約30%向上させる。さらに,スポーツクラス評価における標準化された視点の欠如に対処するために,BGymという新しいデータセットを導入する。

関連論文リスト

Gesture Generation (Still) Needs Improved Human Evaluation Practices: Insights from a Community-Driven State-of-the-Art Benchmark [55.41250396114216]
音声認識による3Dジェスチャー生成における人的評価の実践について検討する。本稿では,広範に使用されているBEAT2モーションキャプチャーデータセットの詳細な評価プロトコルを提案する。
論文参考訳（メタデータ） (2025-11-03T05:17:28Z)
Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文参考訳（メタデータ） (2025-10-08T10:09:47Z)
Real-Time Feedback and Benchmark Dataset for Isometric Pose Evaluation [1.6358813089575626]
ポーズ評価のためのリアルタイムフィードバックシステムを提案する。私たちのコントリビューションには、これまでで最大のマルチクラスの等尺運動ビデオデータセットのリリースが含まれています。その結果、ホームワークアウトのための知的かつパーソナライズされた運動訓練システムの実現可能性が高まった。
論文参考訳（メタデータ） (2025-06-13T13:33:59Z)
Multi-person Physics-based Pose Estimation for Combat Sports [0.689728655482787]
スパースマルチカメラを用いた戦闘スポーツにおける正確な3次元ポーズ推定のための新しい枠組みを提案する。提案手法は,トランスフォーマーを用いたトップダウン手法により,堅牢なマルチビュー2Dポーズトラッキングを実現する。我々はさらに、多対人物理に基づく軌道最適化のステップを導入することにより、ポーズリアリズムとロバスト性をさらに強化する。
論文参考訳（メタデータ） (2025-04-11T00:08:14Z)
Action Quality Assessment via Hierarchical Pose-guided Multi-stage Contrastive Regression [25.657978409890973]
アクションアセスメント(AQA)は、運動性能の自動的、公平な評価を目的としている。現在の手法では、動画を固定フレームに分割することに集中しており、サブアクションの時間的連続性を損なう。階層的なポーズ誘導型多段階コントラスト回帰による行動品質評価手法を提案する。
論文参考訳（メタデータ） (2025-01-07T10:20:16Z)
ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文参考訳（メタデータ） (2024-11-12T11:32:56Z)
DynaWeightPnP: Toward global real-time 3D-2D solver in PnP without correspondences [7.191124861153032]
本稿では,3次元形状と2次元形状をリアルタイムに整列する最適なポーズを,対応なしに推定する,特別な視点-n-Point(ウェイト)問題に対処する。血管内画像ガイド下インターベンションにおける3D-2D中心ライン登録作業の典型的な例について実験を行った。その結果,提案アルゴリズムは60Hz/31Hzの登録処理速度を既存手法に匹敵する競争精度で達成することを確認した。
論文参考訳（メタデータ） (2024-09-27T05:31:33Z)
Uncertainty-Aware Testing-Time Optimization for 3D Human Pose Estimation [68.75387874066647]
本研究では3次元ポーズ推定のための不確実性認識テスト時間最適化フレームワークを提案する。我々のアプローチは、Human3.6Mの4.5%という大きなマージンで、過去最高の結果を上回っている。
論文参考訳（メタデータ） (2024-02-04T04:28:02Z)
FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文参考訳（メタデータ） (2023-12-28T14:52:07Z)
Geometry-Aware Video Quality Assessment for Dynamic Digital Human [56.17852258306602]
DDH-QAチャレンジのための新しい非参照(NR)幾何対応ビデオ品質評価手法を提案する。提案手法はDDH-QAデータベース上での最先端性能を実現する。
論文参考訳（メタデータ） (2023-10-24T16:34:03Z)
Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and Class-balanced Pseudo-Labeling [38.07637524378327]
ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文参考訳（メタデータ） (2023-07-16T04:34:11Z)
LocATe: End-to-end Localization of Actions in 3D with Transformers [91.28982770522329]
LocATeは、3Dシーケンスでアクションを共同でローカライズし認識するエンドツーエンドのアプローチである。画像やパッチの特徴を入力として考えるトランスフォーマーベースのオブジェクト検出や分類モデルとは異なり、LocATeのトランスフォーマーモデルはシーケンス内のアクション間の長期的な相関をキャプチャすることができる。 BABEL-TAL-20 (BT20) という新しい,挑戦的で,より現実的なベンチマークデータセットを導入する。
論文参考訳（メタデータ） (2022-03-21T03:35:32Z)
Activation to Saliency: Forming High-Quality Labels for Unsupervised Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文参考訳（メタデータ） (2021-12-07T11:54:06Z)
Reduced Reference Perceptual Quality Model and Application to Rate Control for 3D Point Cloud Compression [61.110938359555895]
レート歪み最適化では、ビットレートの制約を受ける再構成品質尺度を最大化してエンコーダ設定を決定する。本稿では,V-PCC幾何および色量化パラメータを変数とする線形知覚品質モデルを提案する。 400個の圧縮された3D点雲による主観的品質試験の結果,提案モデルが平均評価値とよく相関していることが示唆された。また、同じ目標ビットレートに対して、提案モデルに基づくレート歪みの最適化は、ポイント・ツー・ポイントの客観的な品質指標による徹底的な探索に基づくレート歪みの最適化よりも高い知覚品質を提供することを示した。
論文参考訳（メタデータ） (2020-11-25T12:42:02Z)
Multi-Scale Networks for 3D Human Pose Estimation with Inference Stage Optimization [33.02708860641971]
モノクロビデオから3Dのポーズを推定することは、まだまだ難しい課題だ。既存の多くのメソッドは、対象の人が他のオブジェクトに干渉されたり、トレーニングデータのスケールや速度に対して動きが速すぎたり、遅くなったりすると低下する。頑健な3次元ポーズ推定のための時間的ネットワークを提案する。
論文参考訳（メタデータ） (2020-10-13T15:24:28Z)
A review of 3D human pose estimation algorithms for markerless motion capture [0.0]
我々は過去5年間の主要な人間のポーズ推定手法を概観し、メトリクス、ベンチマーク、メソッド構造に注目した。本稿では,方法の分類や今後の研究の方向性の導出に使用する精度,速度,堅牢性に基づく分類法を提案する。
論文参考訳（メタデータ） (2020-10-13T15:07:01Z)
3D Human Pose Estimation using Spatio-Temporal Networks with Explicit Occlusion Training [40.933783830017035]
近年の大きな進歩にもかかわらず、モノラルなタスクから3Dのポーズを推定することは依然として難しい課題である。頑健な3次元ポーズ推定のための時間的ビデオネットワークを提案する。本研究では,各フレームに2次元関節やキーポイントの予測,および3次元関節やキーポイントを推定するために,多段階の時間的畳み込みネットワーク(TCN)を適用した。
論文参考訳（メタデータ） (2020-04-07T09:12:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。