論文の概要: PoseBench3D: A Cross-Dataset Analysis Framework for 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2505.10888v1
- Date: Fri, 16 May 2025 05:49:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:14.182774
- Title: PoseBench3D: A Cross-Dataset Analysis Framework for 3D Human Pose Estimation
- Title(参考訳): PoseBench3D: 人間の3次元姿勢推定のためのクロスデータセット分析フレームワーク
- Authors: Saad Manzur, Bryan Vela, Brandon Vela, Aditya Agrawal, Lan-Anh Dang-Vu, David Li, Wayne Hayes,
- Abstract要約: 本稿では,各手法を各種データセット上で評価する,標準化されたテスト環境を提案する。
本稿では,事前および将来のモデルを体系的に再評価するための統合フレームワークであるPoseBench3Dを提案する。
- 参考スコア(独自算出の注目度): 1.470703050699957
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable three-dimensional human pose estimation is becoming increasingly important for real-world applications, yet much of prior work has focused solely on the performance within a single dataset. In practice, however, systems must adapt to diverse viewpoints, environments, and camera setups -- conditions that differ significantly from those encountered during training, which is often the case in real-world scenarios. To address these challenges, we present a standardized testing environment in which each method is evaluated on a variety of datasets, ensuring consistent and fair cross-dataset comparisons -- allowing for the analysis of methods on previously unseen data. Therefore, we propose PoseBench3D, a unified framework designed to systematically re-evaluate prior and future models across four of the most widely used datasets for human pose estimation -- with the framework able to support novel and future datasets as the field progresses. Through a unified interface, our framework provides datasets in a pre-configured yet easily modifiable format, ensuring compatibility with diverse model architectures. We re-evaluated the work of 18 methods, either trained or gathered from existing literature, and reported results using both Mean Per Joint Position Error (MPJPE) and Procrustes Aligned Mean Per Joint Position Error (PA-MPJPE) metrics, yielding more than 100 novel cross-dataset evaluation results. Additionally, we analyze performance differences resulting from various pre-processing techniques and dataset preparation parameters -- offering further insight into model generalization capabilities.
- Abstract(参考訳): 信頼性の高い3次元の人間のポーズ推定は、現実世界のアプリケーションにとってますます重要になっている。
しかし実際には、システムは様々な視点、環境、カメラの設定に適応する必要があります。
これらの課題に対処するために、我々は、各メソッドがさまざまなデータセットで評価され、一貫性と公正なクロスデータセット比較を保証する、標準化されたテスト環境を提示します。
そこで我々はPoseBench3Dを提案する。PoseBench3Dは、人間のポーズ推定に最も広く使われている4つのデータセットに対して、事前および将来のモデルを体系的に再評価するように設計された統合フレームワークで、フィールドが進行するにつれて、新しいデータセットと将来のデータセットをサポートすることができる。
統一インターフェースを通じて、当社のフレームワークは、設定済みだが容易に変更可能なフォーマットでデータセットを提供し、多様なモデルアーキテクチャとの互換性を確保する。
既存の文献から収集した18種類の手法の成果を再評価し,MPJPE(Mean Per Joint Position Error)とPA-MPJPE(Procrustes Aligned Mean Per Joint Position Error)を用いて,100以上の新たなクロスデータセット評価結果を得た。
さらに、さまざまな前処理技術とデータセット準備パラメータから生じるパフォーマンスの違いを分析し、モデル一般化機能に関するさらなる洞察を提供する。
関連論文リスト
- EBES: Easy Benchmarking for Event Sequences [17.277513178760348]
イベントシーケンス(英: Event Sequences、EvS)とは、不規則なサンプリング間隔と分類的特徴と数値的特徴の混合を特徴とするシーケンシャルデータである。
EBESは、シーケンスレベルのターゲットを持つEvS分類のための包括的なベンチマークである。
9つのモダンモデルを実装したオープンソースのPyTorchライブラリとともに、標準化された評価シナリオとプロトコルを備えている。
論文 参考訳(メタデータ) (2024-10-04T13:03:43Z) - What is the Right Notion of Distance between Predict-then-Optimize Tasks? [35.842182348661076]
特徴量やラベル次元にのみ依存する従来のデータセット距離は,PtO(Predict-then-then-then)の文脈では情報性が欠如していることが示される。
下流決定の影響を組み込んだ新しいデータセット距離を提案する。
以上の結果から,この決定認識データセット距離は,PtOコンテキストにおける適応成功を効果的に捉えていることが明らかとなった。
論文 参考訳(メタデータ) (2024-09-11T04:13:17Z) - SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation On Diverse Modalities [55.87169702896249]
Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。
本稿では,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの完全かつ公平な評価を行う。
本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文 参考訳(メタデータ) (2024-07-16T12:52:29Z) - FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - State-of-the-art Models for Object Detection in Various Fields of
Application [0.0]
COCOミニバル、COCOテスト、Pascal VOC 2007、ADE20K、ImageNetがレビューされている。
データセットは、多様性、データの質、バイアスの最小化、品質のラベル付けなどの観点から、他と密に比較した後、手作業で取得される。
各データセットの上位モデルとその最適なユースケースをリストアップする。
論文 参考訳(メタデータ) (2022-11-01T20:25:32Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Post-hoc Models for Performance Estimation of Machine Learning Inference [22.977047604404884]
さまざまなシナリオにおいて、推論中に機械学習モデルがどれだけうまく機能するかを推定することが重要である。
性能評価をさまざまなメトリクスやシナリオに体系的に一般化する。
提案したポストホックモデルは標準信頼ベースラインを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2021-10-06T02:20:37Z) - Inference Stage Optimization for Cross-scenario 3D Human Pose Estimation [97.93687743378106]
既存の3Dポーズ推定モデルは、目に見えないポーズを持つ新しいシナリオに適用する場合、パフォーマンス低下を被る。
本稿では、3次元ポーズモデルの一般化性を改善するための新しいフレームワークである推論段階最適化(ISO)を提案する。
注目すべきは、MPI-INF-3DHPで83.6%の最先端の3D PCKが得られることだ。
論文 参考訳(メタデータ) (2020-07-04T09:45:18Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。