論文の概要: Breaking the Passive Learning Trap: An Active Perception Strategy for Human Motion Prediction
- arxiv url: http://arxiv.org/abs/2511.14237v1
- Date: Tue, 18 Nov 2025 08:15:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:53.006158
- Title: Breaking the Passive Learning Trap: An Active Perception Strategy for Human Motion Prediction
- Title(参考訳): 受動的学習トラップを打破する:人間の動作予測のためのアクティブな知覚戦略
- Authors: Juncheng Hu, Zijian Zhang, Zeyu Wang, Guoyu Wang, Yingji Li, Kedi Lyu,
- Abstract要約: 人間の動作予測のための能動知覚戦略(APS)を提案する。
APSは補助学習目標を導入しながら、運動特性を明示的に符号化する。
実験により,本手法は新たな最先端の既存手法を大きなマージンで実現することが示された。
- 参考スコア(独自算出の注目度): 17.106453744027217
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Forecasting 3D human motion is an important embodiment of fine-grained understanding and cognition of human behavior by artificial agents. Current approaches excessively rely on implicit network modeling of spatiotemporal relationships and motion characteristics, falling into the passive learning trap that results in redundant and monotonous 3D coordinate information acquisition while lacking actively guided explicit learning mechanisms. To overcome these issues, we propose an Active Perceptual Strategy (APS) for human motion prediction, leveraging quotient space representations to explicitly encode motion properties while introducing auxiliary learning objectives to strengthen spatio-temporal modeling. Specifically, we first design a data perception module that projects poses into the quotient space, decoupling motion geometry from coordinate redundancy. By jointly encoding tangent vectors and Grassmann projections, this module simultaneously achieves geometric dimension reduction, semantic decoupling, and dynamic constraint enforcement for effective motion pose characterization. Furthermore, we introduce a network perception module that actively learns spatio-temporal dependencies through restorative learning. This module deliberately masks specific joints or injects noise to construct auxiliary supervision signals. A dedicated auxiliary learning network is designed to actively adapt and learn from perturbed information. Notably, APS is model agnostic and can be integrated with different prediction models to enhance active perceptual. The experimental results demonstrate that our method achieves the new state-of-the-art, outperforming existing methods by large margins: 16.3% on H3.6M, 13.9% on CMU Mocap, and 10.1% on 3DPW.
- Abstract(参考訳): 3次元の人間の動きを予測することは、人工エージェントによる人間の行動のきめ細かい理解と認識の重要な具体化である。
現在のアプローチでは、時空間関係と運動特性の暗黙的なネットワークモデリングを過度に頼り、能動的な学習メカニズムを欠きながら、冗長で単調な3D座標情報取得をもたらす受動的学習トラップに陥る。
これらの課題を克服するために,人間の動き予測のための能動知覚戦略 (APS) を提案し,空間表現を利用して運動特性を明示的に符号化し,時空間モデルを強化するための補助学習目標を導入する。
具体的には、まず、座標の冗長性から運動幾何学を分離し、商空間に投影するデータ知覚モジュールを設計する。
接ベクトルとグラスマン射影を共同で符号化することにより、このモジュールは幾何学的次元の減少、意味的な疎結合、そして効果的な動きのポーズ特徴付けのための動的制約強制を同時に達成する。
さらに,回復学習を通じて時空間依存を積極的に学習するネットワーク認識モジュールを導入する。
このモジュールは、特定の関節を意図的にマスクしたり、ノイズを注入して補助的な監視信号を構成する。
専用の補助学習ネットワークは、摂動情報から積極的に適応し、学習するために設計されている。
特に、APSはモデル非依存であり、様々な予測モデルと統合して、アクティブな知覚を高めることができる。
実験の結果,H3.6Mが16.3%,CMU Mocapが13.9%,3DPWが10.1%,従来の手法よりも高い性能を示した。
関連論文リスト
- Foundation Model for Skeleton-Based Human Action Understanding [56.89025287217221]
本稿では,統一骨格に基づくDense Representation Learningフレームワークを提案する。
USDRLはトランスフォーマーベースのDense Spatio-Temporal (DSTE)、Multi-Grained Feature Deorrelation (MG-FD)、Multi-Perspective Consistency Training (MPCT)で構成されている。
論文 参考訳(メタデータ) (2025-08-18T02:42:16Z) - Spatio-Temporal Branching for Motion Prediction using Motion Increments [55.68088298632865]
HMP(Human Motion Prediction)はその多種多様な応用により、人気のある研究トピックとして浮上している。
従来の手法は手作りの機能と機械学習技術に依存している。
HMPのためのインクリメンタル情報を用いた時空間分岐ネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-02T12:04:28Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Motion Prediction via Joint Dependency Modeling in Phase Space [40.54430409142653]
我々は、運動解剖学の明示的な事前知識を活用するために、新しい畳み込みニューラルモデルを導入する。
次に,個々の関節機能間の暗黙的関係を学習するグローバル最適化モジュールを提案する。
本手法は,大規模な3次元人体動作ベンチマークデータセットを用いて評価する。
論文 参考訳(メタデータ) (2022-01-07T08:30:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。