論文の概要: CaFlow: Enhancing Long-Term Action Quality Assessment with Causal Counterfactual Flow
- arxiv url: http://arxiv.org/abs/2511.21653v1
- Date: Wed, 26 Nov 2025 18:25:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.24235
- Title: CaFlow: Enhancing Long-Term Action Quality Assessment with Causal Counterfactual Flow
- Title(参考訳): CaFlow:Causal Counterfactal Flowによる長期アクション品質評価の強化
- Authors: Ruisheng Han, Kanglei Zhou, Shuang Chen, Amir Atapour-Abarghouei, Hubert P. H. Shum,
- Abstract要約: アクション品質アセスメント(AQA)は、アクションビデオから詳細な実行スコアを予測する。
フィギュアスケートやリズミカル体操のような長期AQAは、拡張時間力学のモデリングを必要とするため、特に困難である。
両方向の時間条件付きフローと反ファクトデコンバウンディングを統合した統合フレームワークであるCaFlowを提案する。
- 参考スコア(独自算出の注目度): 25.3923767595433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Action Quality Assessment (AQA) predicts fine-grained execution scores from action videos and is widely applied in sports, rehabilitation, and skill evaluation. Long-term AQA, as in figure skating or rhythmic gymnastics, is especially challenging since it requires modeling extended temporal dynamics while remaining robust to contextual confounders. Existing approaches either depend on costly annotations or rely on unidirectional temporal modeling, making them vulnerable to spurious correlations and unstable long-term representations. To this end, we propose CaFlow, a unified framework that integrates counterfactual de-confounding with bidirectional time-conditioned flow. The Causal Counterfactual Regularization (CCR) module disentangles causal and confounding features in a self-supervised manner and enforces causal robustness through counterfactual interventions, while the BiT-Flow module models forward and backward dynamics with a cycle-consistency constraint to produce smoother and more coherent representations. Extensive experiments on multiple long-term AQA benchmarks demonstrate that CaFlow achieves state-of-the-art performance. Code is available at https://github.com/Harrison21/CaFlow
- Abstract(参考訳): アクション品質評価(AQA)は、アクションビデオからのきめ細かい実行スコアを予測し、スポーツ、リハビリテーション、スキル評価に広く適用されている。
フィギュアスケートやリズミカル体操のように、長期のAQAは特に困難である。
既存のアプローチはコストのかかるアノテーションに依存するか、一方向の時間的モデリングに依存しているため、急激な相関や不安定な長期的表現に弱い。
この目的のために,双方向の時間条件流と反ファクトデコンバウンディングを統合した統合フレームワークであるCaFlowを提案する。
因果正則化(Causal Counterfactual Regularization, CCR)モジュールは、因果正則化(Cousal Counterfactual Regularization, 因果正則化)モジュールを自己監督的な方法で切り離し、反ファクト的介入を通じて因果的堅牢性を強制する一方、BiT-Flowモジュールは、より滑らかで一貫性のある表現を生成するために、サイクル整合性制約を伴う前方および後方ダイナミクスをモデル化する。
複数の長期AQAベンチマークに対する大規模な実験は、CaFlowが最先端のパフォーマンスを達成することを実証している。
コードはhttps://github.com/Harrison21/CaFlowで入手できる。
関連論文リスト
- TimeFlow: Towards Stochastic-Aware and Efficient Time Series Generation via Flow Matching Modeling [2.74279932215302]
時系列データは、下流の時系列マイニングタスクを幅広くサポートするため、重要な研究トピックとして浮上している。
エンコーダのみのアーキテクチャを統合する新しいフローマッチングフレームワークであるTimeFlowを提案する。
私たちのモデルは、生成品質、多様性、効率において、一貫して強力なベースラインを上回ります。
論文 参考訳(メタデータ) (2025-11-11T08:28:26Z) - Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - Unified Flow Matching for Long Horizon Event Forecasting [3.0639815065447036]
本稿では,マーク付き時間点プロセスのための一貫したフローマッチングフレームワークを提案する。
両コンポーネントの連続時間フローを学習することにより,逐次復号化を伴わずにコヒーレントな長地平線イベントトラジェクトリを生成する。
実世界の6つのベンチマークでモデルを評価し,精度と生成効率の両面で自己回帰ベースラインと拡散ベースラインを大幅に改善した。
論文 参考訳(メタデータ) (2025-08-06T19:42:49Z) - FineCausal: A Causal-Based Framework for Interpretable Fine-Grained Action Quality Assessment [13.936546696317617]
我々はFineing-HMCaデータセット上で最先端のパフォーマンスを実現する新しい因果ベースのフレームワークであるFineusDivalを紹介する。
当社のアプローチでは,Graph Attention Networkベースの因果介入モジュールを活用して,バックグラウンド共同設立者から人間中心の手がかりを遠ざけている。
当社のデュアルモジュール戦略により、FinCausalは、最先端のスコアリング性能を達成するだけでなく、どの機能が評価を駆動するかを透過的かつ解釈可能なフィードバックを提供する、詳細な時間的表現を生成することができる。
論文 参考訳(メタデータ) (2025-03-31T10:02:29Z) - FELLE: Autoregressive Speech Synthesis with Token-Wise Coarse-to-Fine Flow Matching [56.30231216917128]
FELLEは、言語モデリングとトークンワイドフローマッチングを統合する自動回帰モデルである。
各連続値トークンに対して、FELLEは、前ステップからの情報を組み込んで、フローマッチングにおける一般的な事前分布を変更する。
FELLEは、言語モデルの出力に基づいて階層的に連続値のトークンを生成する。
論文 参考訳(メタデータ) (2025-02-16T13:54:32Z) - Interpretable Long-term Action Quality Assessment [12.343701556374556]
長時間の行動品質評価(AQA)は、ビデオにおける活動の実行を評価する。
現在のAQA法は、クリップの特徴を平均化することで単一のスコアを生成する。
長期的なビデオは、アクションの複雑さと多様性のために、さらなる困難を生じさせる。
論文 参考訳(メタデータ) (2024-08-21T15:09:09Z) - ChiroDiff: Modelling chirographic data with Diffusion Models [132.5223191478268]
チャーログラフィーデータのための強力なモデルクラスである「拡散確率モデル(Denoising Diffusion Probabilistic Models)」やDDPMを導入している。
我々のモデルは「ChiroDiff」と呼ばれ、非自己回帰的であり、全体論的概念を捉えることを学び、したがって高い時間的サンプリングレートに回復する。
論文 参考訳(メタデータ) (2023-04-07T15:17:48Z) - BSN++: Complementary Boundary Regressor with Scale-Balanced Relation
Modeling for Temporal Action Proposal Generation [85.13713217986738]
我々は,時間的提案生成のための補完的境界回帰器と関係モデリングを利用する新しいフレームワークであるBSN++を提案する。
当然のことながら、提案されたBSN++は、時間的アクションローカライゼーションタスクに関するCVPR19 - ActivityNetのリーダーボードで1位にランクインした。
論文 参考訳(メタデータ) (2020-09-15T07:08:59Z) - Learn to cycle: Time-consistent feature discovery for action recognition [83.43682368129072]
時間的変動を一般化することは、ビデオにおける効果的な行動認識の前提条件である。
Squeeze Re Temporal Gates (SRTG) を導入する。
SRTPGブロックを使用する場合,GFLOの数は最小限に抑えられ,一貫した改善が見られた。
論文 参考訳(メタデータ) (2020-06-15T09:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。