論文の概要: Inference Stage Optimization for Cross-scenario 3D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2007.02054v1
- Date: Sat, 4 Jul 2020 09:45:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 13:38:32.486183
- Title: Inference Stage Optimization for Cross-scenario 3D Human Pose Estimation
- Title(参考訳): クロススセナリオ3次元ポーズ推定のための推定段階最適化
- Authors: Jianfeng Zhang, Xuecheng Nie, Jiashi Feng
- Abstract要約: 既存の3Dポーズ推定モデルは、目に見えないポーズを持つ新しいシナリオに適用する場合、パフォーマンス低下を被る。
本稿では、3次元ポーズモデルの一般化性を改善するための新しいフレームワークである推論段階最適化(ISO)を提案する。
注目すべきは、MPI-INF-3DHPで83.6%の最先端の3D PCKが得られることだ。
- 参考スコア(独自算出の注目度): 97.93687743378106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing 3D human pose estimation models suffer performance drop when
applying to new scenarios with unseen poses due to their limited
generalizability. In this work, we propose a novel framework, Inference Stage
Optimization (ISO), for improving the generalizability of 3D pose models when
source and target data come from different pose distributions. Our main insight
is that the target data, even though not labeled, carry valuable priors about
their underlying distribution. To exploit such information, the proposed ISO
performs geometry-aware self-supervised learning (SSL) on each single target
instance and updates the 3D pose model before making prediction. In this way,
the model can mine distributional knowledge about the target scenario and
quickly adapt to it with enhanced generalization performance. In addition, to
handle sequential target data, we propose an online mode for implementing our
ISO framework via streaming the SSL, which substantially enhances its
effectiveness. We systematically analyze why and how our ISO framework works on
diverse benchmarks under cross-scenario setup. Remarkably, it yields new
state-of-the-art of 83.6% 3D PCK on MPI-INF-3DHP, improving upon the previous
best result by 9.7%. Code will be released.
- Abstract(参考訳): 既存の3次元ポーズ推定モデルは、その一般化可能性の制限により、未知のポーズを持つ新しいシナリオに適用すると、パフォーマンス低下に苦しむ。
本研究では,ソースとターゲットデータが異なるポーズ分布から来る場合の3次元ポーズモデルの一般化性を改善するための新しいフレームワークである推論段階最適化(ISO)を提案する。
主な洞察は、ターゲットデータはラベル付けされていないが、その基盤となる分布について貴重な事前情報を持っていることです。
このような情報を利用するため,提案するisoは,各対象インスタンスに対して形状認識型自己教師付き学習(ssl)を行い,予測を行う前に3次元ポーズモデルを更新する。
このように、モデルは対象シナリオに関する分布的知識をマイニングし、一般化性能を向上して迅速に適用することができる。
さらに、逐次的ターゲットデータを扱うために、SSLをストリーミングすることで、ISOフレームワークを実装するオンラインモードを提案する。
クロスセサリオ設定の下で、ISOフレームワークが様々なベンチマークでどのように動作するのかを系統的に分析する。
注目すべきは、MPI-INF-3DHPで83.6%の最先端の3D PCKが得られることだ。
コードはリリースされる。
関連論文リスト
- UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - Uncertainty-Aware Testing-Time Optimization for 3D Human Pose Estimation [68.75387874066647]
本研究では3次元ポーズ推定のための不確実性認識テスト時間最適化フレームワークを提案する。
我々のアプローチは、Human3.6Mの4.5%という大きなマージンで、過去最高の結果を上回っている。
論文 参考訳(メタデータ) (2024-02-04T04:28:02Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - Efficient Text-Guided 3D-Aware Portrait Generation with Score
Distillation Sampling on Distribution [28.526714129927093]
本研究では,DreamPortraitを提案する。DreamPortraitは,テキスト誘導型3D画像の単一フォワードパスで効率よく作成することを目的としている。
さらに,テキストと3D認識空間の対応をモデルが明示的に知覚できるように,3D対応のゲート・アテンション機構を設計する。
論文 参考訳(メタデータ) (2023-06-03T11:08:38Z) - A generic diffusion-based approach for 3D human pose prediction in the
wild [68.00961210467479]
3D人間のポーズ予測、すなわち、過去の観察されたポーズのシーケンスが与えられた後の人間の3Dポーズのシーケンスを予測することは、困難な時間課題である。
本稿では,不完全な要素(予測や観測に関係しない)をノイズとして扱える統一的な定式化法を提案し,それらを認知し,妥当なポーズを予測する条件拡散モデルを提案する。
本研究は,4つの標準データセットについて検討し,現状よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-10-11T17:59:54Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Distribution-Aware Single-Stage Models for Multi-Person 3D Pose
Estimation [29.430404703883084]
本稿では,多人数の3Dポーズ推定問題に対処する新しいDASモデルを提案する。
提案するDASモデルでは,3次元カメラ空間における人物位置と人体関節をワンパスで同時に位置決めする。
CMU Panoptic と MuPoTS-3D のベンチマークに関する総合的な実験は、提案したDASモデルの優れた効率を実証している。
論文 参考訳(メタデータ) (2022-03-15T07:30:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。