論文の概要: Scriboora: Rethinking Human Pose Forecasting
- arxiv url: http://arxiv.org/abs/2511.15565v1
- Date: Wed, 19 Nov 2025 15:58:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.883138
- Title: Scriboora: Rethinking Human Pose Forecasting
- Title(参考訳): Scriboora: 人間のポーズ予測を再考する
- Authors: Daniel Bermuth, Alexander Poeppel, Wolfgang Reif,
- Abstract要約: 本稿では,絶対的なポーズ予測のタスクにおいて,ポーズ予測アルゴリズムを広範囲に評価する。
最近の音声モデルは、ポーズ予測のタスクに効率的に適応でき、最先端の性能を向上させることができる。
- 参考スコア(独自算出の注目度): 44.79834103607383
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Human pose forecasting predicts future poses based on past observations, and has many significant applications in areas such as action recognition, autonomous driving or human-robot interaction. This paper evaluates a wide range of pose forecasting algorithms in the task of absolute pose forecasting, revealing many reproducibility issues, and provides a unified training and evaluation pipeline. After drawing a high-level analogy to the task of speech understanding, it is shown that recent speech models can be efficiently adapted to the task of pose forecasting, and improve current state-of-the-art performance. At last the robustness of the models is evaluated, using noisy joint coordinates obtained from a pose estimator model, to reflect a realistic type of noise, which is more close to real-world applications. For this a new dataset variation is introduced, and it is shown that estimated poses result in a substantial performance degradation, and how much of it can be recovered again by unsupervised finetuning.
- Abstract(参考訳): 人間のポーズ予測は過去の観測に基づいて将来のポーズを予測し、アクション認識、自律運転、人間とロボットの相互作用といった分野に多くの重要な応用がある。
本稿では、絶対ポーズ予測のタスクにおいて、様々なポーズ予測アルゴリズムを評価し、再現性の問題を明らかにし、統一的なトレーニングと評価パイプラインを提供する。
音声理解タスクに高レベルなアナロジーを描画した後,最近の音声モデルは,ポーズ予測タスクに効率的に適応し,最先端の性能を向上させることができることを示した。
最後に、ポーズ推定器モデルから得られたノイズの多いジョイント座標を用いて、実世界の応用に近い現実的なタイプのノイズを反映して、モデルのロバスト性を評価する。
このために、新しいデータセットのバリエーションを導入し、推定されたポーズがパフォーマンスを著しく劣化させ、また、教師なしの微調整によってその多くを回復できることを示す。
関連論文リスト
- Unsupervised Domain Adaptation for Occlusion Resilient Human Pose Estimation [23.0839810713682]
排除は人間のポーズ推定アルゴリズムにとって重要な課題である。
OR-POSE: Occlusion Resilient Human POSE Estimationのための教師なしドメイン適応を提案する。
論文 参考訳(メタデータ) (2025-01-06T05:30:37Z) - Gait Recognition from Highly Compressed Videos [3.1049440318608568]
一般的な緩和戦略は、頑健性を改善するためにノイズデータ上の微調整ポーズ推定モデルを含む。
本稿では,監視映像の事前処理と改善を目的としたタスク対象のアーティファクト修正モデルを組み込んだ処理パイプラインを提案する。
本実験は歩行解析性能の向上を図り,提案手法の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2024-04-18T13:46:16Z) - Fine-grained Forecasting Models Via Gaussian Process Blurring Effect [6.472434306724611]
時系列予測は、複雑な時間的依存関係と動的な時間的依存関係が存在するため、困難なタスクである。
より多くのトレーニングデータを使用することで精度が向上するが、このソースは制限されることが多い。
我々は、エンドツーエンドの予測・デノゲーションパラダイムを提唱し、画像生成のためのDenoisingアプローチを成功させています。
論文 参考訳(メタデータ) (2023-12-21T20:25:16Z) - DiffPose: SpatioTemporal Diffusion Model for Video-Based Human Pose
Estimation [16.32910684198013]
本稿では、条件付きヒートマップ生成問題として、ビデオに基づく人間のポーズ推定を定式化する新しい拡散アーキテクチャDiffPoseを提案する。
ポーズ推定タスクにおけるDiffPoseの特徴として,(i)複数のポーズ推定を組み合わせて予測精度を向上させる能力,(ii)モデルを再訓練することなく特徴改善のための反復的なステップ数を調整する能力,の2点を挙げる。
論文 参考訳(メタデータ) (2023-07-31T14:00:23Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - Back2Future: Leveraging Backfill Dynamics for Improving Real-time
Predictions in Future [73.03458424369657]
公衆衛生におけるリアルタイム予測では、データ収集は簡単で要求の多いタスクである。
過去の文献では「バックフィル」現象とそのモデル性能への影響についてはほとんど研究されていない。
我々は、与えられたモデルの予測をリアルタイムで洗練することを目的とした、新しい問題とニューラルネットワークフレームワークBack2Futureを定式化する。
論文 参考訳(メタデータ) (2021-06-08T14:48:20Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - Confidence Adaptive Anytime Pixel-Level Recognition [86.75784498879354]
任意の時間推論は、いつでも停止される可能性のある予測の進行を行うモデルを必要とする。
我々は,任意のピクセルレベルの認識に対して,最初の統一とエンドツーエンドのモデルアプローチを提案する。
論文 参考訳(メタデータ) (2021-04-01T20:01:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。