論文の概要: PoseBench3D: A Cross-Dataset Analysis Framework for 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2505.10888v1
- Date: Fri, 16 May 2025 05:49:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:14.182774
- Title: PoseBench3D: A Cross-Dataset Analysis Framework for 3D Human Pose Estimation
- Title(参考訳): PoseBench3D: 人間の3次元姿勢推定のためのクロスデータセット分析フレームワーク
- Authors: Saad Manzur, Bryan Vela, Brandon Vela, Aditya Agrawal, Lan-Anh Dang-Vu, David Li, Wayne Hayes,
- Abstract要約: 本稿では,各手法を各種データセット上で評価する,標準化されたテスト環境を提案する。
本稿では,事前および将来のモデルを体系的に再評価するための統合フレームワークであるPoseBench3Dを提案する。
- 参考スコア(独自算出の注目度): 1.470703050699957
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable three-dimensional human pose estimation is becoming increasingly important for real-world applications, yet much of prior work has focused solely on the performance within a single dataset. In practice, however, systems must adapt to diverse viewpoints, environments, and camera setups -- conditions that differ significantly from those encountered during training, which is often the case in real-world scenarios. To address these challenges, we present a standardized testing environment in which each method is evaluated on a variety of datasets, ensuring consistent and fair cross-dataset comparisons -- allowing for the analysis of methods on previously unseen data. Therefore, we propose PoseBench3D, a unified framework designed to systematically re-evaluate prior and future models across four of the most widely used datasets for human pose estimation -- with the framework able to support novel and future datasets as the field progresses. Through a unified interface, our framework provides datasets in a pre-configured yet easily modifiable format, ensuring compatibility with diverse model architectures. We re-evaluated the work of 18 methods, either trained or gathered from existing literature, and reported results using both Mean Per Joint Position Error (MPJPE) and Procrustes Aligned Mean Per Joint Position Error (PA-MPJPE) metrics, yielding more than 100 novel cross-dataset evaluation results. Additionally, we analyze performance differences resulting from various pre-processing techniques and dataset preparation parameters -- offering further insight into model generalization capabilities.
- Abstract(参考訳): 信頼性の高い3次元の人間のポーズ推定は、現実世界のアプリケーションにとってますます重要になっている。
しかし実際には、システムは様々な視点、環境、カメラの設定に適応する必要があります。
これらの課題に対処するために、我々は、各メソッドがさまざまなデータセットで評価され、一貫性と公正なクロスデータセット比較を保証する、標準化されたテスト環境を提示します。
そこで我々はPoseBench3Dを提案する。PoseBench3Dは、人間のポーズ推定に最も広く使われている4つのデータセットに対して、事前および将来のモデルを体系的に再評価するように設計された統合フレームワークで、フィールドが進行するにつれて、新しいデータセットと将来のデータセットをサポートすることができる。
統一インターフェースを通じて、当社のフレームワークは、設定済みだが容易に変更可能なフォーマットでデータセットを提供し、多様なモデルアーキテクチャとの互換性を確保する。
既存の文献から収集した18種類の手法の成果を再評価し,MPJPE(Mean Per Joint Position Error)とPA-MPJPE(Procrustes Aligned Mean Per Joint Position Error)を用いて,100以上の新たなクロスデータセット評価結果を得た。
さらに、さまざまな前処理技術とデータセット準備パラメータから生じるパフォーマンスの違いを分析し、モデル一般化機能に関するさらなる洞察を提供する。
関連論文リスト
- Investigating Domain Gaps for Indoor 3D Object Detection [60.55242233729081]
本研究では,屋内3次元物体検出器を1つのデータセットから別のデータセットに適応させる作業について考察する。
本稿では, ScanNet, SUN RGB-D, 3D Frontのデータセットと, 新たに提案した大規模データセット ProcTHOR-OD と ProcFront を用いたベンチマークを提案する。
本研究は,3次元物体検出器におけるドメインギャップの違いが,合成から現実への適応,点雲品質適応,レイアウト適応,インスタンス特徴適応など,さまざまな適応シナリオについて実験を行った。
論文 参考訳(メタデータ) (2025-08-24T16:34:19Z) - VOccl3D: A Video Benchmark Dataset for 3D Human Pose and Shape Estimation under real Occlusions [12.739233840342958]
VOccl3Dは3Dボディポーズと形状アノテーションを備えたビデオベースのヒューマンオクルージョンデータセットである。
AGORAやBEDLAMといった作品に触発されて,先進的なコンピュータグラフィックスレンダリング技術を用いてこのデータセットを構築した。
論文 参考訳(メタデータ) (2025-08-09T00:13:46Z) - Ensemble-Based Deepfake Detection using State-of-the-Art Models with Robust Cross-Dataset Generalisation [0.0]
機械学習ベースのDeepfake検出モデルは、ベンチマークデータセットで印象的な結果を得た。
しかし、アウト・オブ・ディストリビューションデータで評価すると、その性能は著しく低下することが多い。
本研究では,ディープフェイク検出システムの一般化のためのアンサンブルに基づくアプローチについて検討する。
論文 参考訳(メタデータ) (2025-07-08T13:54:48Z) - Meta-rater: A Multi-dimensional Data Selection Method for Pre-training Language Models [7.61977883644433]
データ品質を評価するために,専門性,可読性,推論,清潔さの4つの側面を提案する。
学習した最適重み付けにより,これらの次元を既存の品質指標と統合する多次元データ選択手法であるMeta-raterを紹介する。
実験により、Meta-raterは1.3Bパラメータモデルの収束速度を2倍にし、下流タスク性能を3.23倍に改善し、7.2Bパラメータのモデルにスケールする利点がある。
論文 参考訳(メタデータ) (2025-04-19T06:12:33Z) - Leveraging 2D Masked Reconstruction for Domain Adaptation of 3D Pose Estimation [8.365430750061506]
RGBベースの3Dポーズ推定手法はディープラーニングの開発で成功している。
既存のほとんどの手法は、トレーニングデータとは程遠い分布のイメージをテストするためにうまく動作しない。
本稿では,3次元ポーズ推定のための教師なし領域適応フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-14T19:56:43Z) - EBES: Easy Benchmarking for Event Sequences [17.277513178760348]
イベントシーケンス(英: Event Sequences、EvS)とは、不規則なサンプリング間隔と分類的特徴と数値的特徴の混合を特徴とするシーケンシャルデータである。
EBESは、シーケンスレベルのターゲットを持つEvS分類のための包括的なベンチマークである。
9つのモダンモデルを実装したオープンソースのPyTorchライブラリとともに、標準化された評価シナリオとプロトコルを備えている。
論文 参考訳(メタデータ) (2024-10-04T13:03:43Z) - What is the Right Notion of Distance between Predict-then-Optimize Tasks? [35.842182348661076]
特徴量やラベル次元にのみ依存する従来のデータセット距離は,PtO(Predict-then-then-then)の文脈では情報性が欠如していることが示される。
下流決定の影響を組み込んだ新しいデータセット距離を提案する。
以上の結果から,この決定認識データセット距離は,PtOコンテキストにおける適応成功を効果的に捉えていることが明らかとなった。
論文 参考訳(メタデータ) (2024-09-11T04:13:17Z) - SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation On Diverse Modalities [55.87169702896249]
Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。
本稿では,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの完全かつ公平な評価を行う。
本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文 参考訳(メタデータ) (2024-07-16T12:52:29Z) - Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.77542145604758]
FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文 参考訳(メタデータ) (2023-12-13T18:28:09Z) - Towards Generalizable Multi-Camera 3D Object Detection via Perspective
Debiasing [28.874014617259935]
マルチカメラ3Dオブジェクト検出(MC3D-Det)は,鳥眼ビュー(BEV)の出現によって注目されている。
本研究では,3次元検出と2次元カメラ平面との整合性を両立させ,一貫した高精度な検出を実現する手法を提案する。
論文 参考訳(メタデータ) (2023-10-17T15:31:28Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Learning 3D Human Pose Estimation from Dozens of Datasets using a
Geometry-Aware Autoencoder to Bridge Between Skeleton Formats [80.12253291709673]
本稿では,アフィン結合型オートエンコーダ(ACAE)法を提案する。
このアプローチは、28人の人間のポーズデータセットを使って1つのモデルを監督する、極端なマルチデータセット体制にスケールします。
論文 参考訳(メタデータ) (2022-12-29T22:22:49Z) - State-of-the-art Models for Object Detection in Various Fields of
Application [0.0]
COCOミニバル、COCOテスト、Pascal VOC 2007、ADE20K、ImageNetがレビューされている。
データセットは、多様性、データの質、バイアスの最小化、品質のラベル付けなどの観点から、他と密に比較した後、手作業で取得される。
各データセットの上位モデルとその最適なユースケースをリストアップする。
論文 参考訳(メタデータ) (2022-11-01T20:25:32Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - AdaptPose: Cross-Dataset Adaptation for 3D Human Pose Estimation by
Learnable Motion Generation [24.009674750548303]
トレーニング済みの3Dポーズ推定器を新しいデータセットでテストすると、大きなパフォーマンス低下が発生する。
本稿では、ソースデータセットから合成された3次元人間の動きを生成するエンドツーエンドフレームワークであるAdaptPoseを提案する。
提案手法は, 部分的な3Dアノテーションを用いた半教師あり学習法を16%, クロスデータセット評価において14%, 従来の半教師あり学習法よりも16%優れていた。
論文 参考訳(メタデータ) (2021-12-22T00:27:52Z) - Post-hoc Models for Performance Estimation of Machine Learning Inference [22.977047604404884]
さまざまなシナリオにおいて、推論中に機械学習モデルがどれだけうまく機能するかを推定することが重要である。
性能評価をさまざまなメトリクスやシナリオに体系的に一般化する。
提案したポストホックモデルは標準信頼ベースラインを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2021-10-06T02:20:37Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - Inference Stage Optimization for Cross-scenario 3D Human Pose Estimation [97.93687743378106]
既存の3Dポーズ推定モデルは、目に見えないポーズを持つ新しいシナリオに適用する場合、パフォーマンス低下を被る。
本稿では、3次元ポーズモデルの一般化性を改善するための新しいフレームワークである推論段階最適化(ISO)を提案する。
注目すべきは、MPI-INF-3DHPで83.6%の最先端の3D PCKが得られることだ。
論文 参考訳(メタデータ) (2020-07-04T09:45:18Z) - Novel Human-Object Interaction Detection via Adversarial Domain
Generalization [103.55143362926388]
本研究では,新たな人-物間相互作用(HOI)検出の問題点を考察し,モデルの一般化能力を向上させることを目的とした。
この課題は、主に対象と述語の大きな構成空間に起因し、全ての対象と述語の組み合わせに対する十分な訓練データが欠如している。
本稿では,予測のためのオブジェクト指向不変の特徴を学習するために,対数領域の一般化の統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2020-05-22T22:02:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。