論文の概要: Camera Distortion-aware 3D Human Pose Estimation in Video with
Optimization-based Meta-Learning
- arxiv url: http://arxiv.org/abs/2111.15056v1
- Date: Tue, 30 Nov 2021 01:35:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 15:11:49.858061
- Title: Camera Distortion-aware 3D Human Pose Estimation in Video with
Optimization-based Meta-Learning
- Title(参考訳): 最適化型メタラーニングによる映像中の3次元人物ポーズ推定
- Authors: Hanbyel Cho, Yooshin Cho, Jaemyung Yu, Junmo Kim
- Abstract要約: 歪みのないデータセットでトレーニングされた既存の3次元ポーズ推定アルゴリズムは、特定のカメラ歪みのある新しいシナリオに適用した場合、パフォーマンス低下を被る。
本研究では, 歪み環境に迅速に適応できる簡易かつ効果的な3次元ポーズ推定モデルを提案する。
- 参考スコア(独自算出の注目度): 23.200130129530653
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing 3D human pose estimation algorithms trained on distortion-free
datasets suffer performance drop when applied to new scenarios with a specific
camera distortion. In this paper, we propose a simple yet effective model for
3D human pose estimation in video that can quickly adapt to any distortion
environment by utilizing MAML, a representative optimization-based
meta-learning algorithm. We consider a sequence of 2D keypoints in a particular
distortion as a single task of MAML. However, due to the absence of a
large-scale dataset in a distorted environment, we propose an efficient method
to generate synthetic distorted data from undistorted 2D keypoints. For the
evaluation, we assume two practical testing situations depending on whether a
motion capture sensor is available or not. In particular, we propose Inference
Stage Optimization using bone-length symmetry and consistency. Extensive
evaluation shows that our proposed method successfully adapts to various
degrees of distortion in the testing phase and outperforms the existing
state-of-the-art approaches. The proposed method is useful in practice because
it does not require camera calibration and additional computations in a testing
set-up.
- Abstract(参考訳): 歪みのないデータセットでトレーニングされた既存の3次元ポーズ推定アルゴリズムは、特定のカメラ歪みのある新しいシナリオに適用した場合、パフォーマンス低下を被る。
本稿では,代表的最適化に基づくメタ学習アルゴリズムであるMAMLを用いて,任意の歪み環境に迅速に適応可能な,映像中の3次元ポーズ推定のための簡易かつ効果的なモデルを提案する。
我々は,MAMLの単一タスクとして,特定の歪みにおける2次元キーポイントのシーケンスを考える。
しかし,歪みのある環境では大規模データセットが存在しないため,歪みのない2次元キーポイントから合成歪データを生成する効率的な手法を提案する。
本評価では,モーションキャプチャセンサが利用可能か否かに応じて,2つの実測条件を仮定する。
特に,骨長対称性と一貫性を用いた推定段階最適化を提案する。
その結果,提案手法は試験段階における様々な歪みに適応し,既存の最先端手法よりも優れていた。
提案手法は,カメラキャリブレーションや追加計算を必要としないため,実際に有用である。
関連論文リスト
- Single-image camera calibration with model-free distortion correction [0.0]
本稿では,センサ全体をカバーする平面スペックルパターンの単一画像から,キャリブレーションパラメータの完全な集合を推定する方法を提案する。
デジタル画像相関を用いて校正対象の画像点と物理点との対応を求める。
プロシージャの最後には、画像全体にわたって、密度が高く均一なモデルフリーな歪みマップが得られる。
論文 参考訳(メタデータ) (2024-03-02T16:51:35Z) - Uncertainty-Aware Testing-Time Optimization for 3D Human Pose Estimation [68.75387874066647]
本研究では3次元ポーズ推定のための不確実性認識テスト時間最適化フレームワークを提案する。
我々のアプローチは、Human3.6Mの4.5%という大きなマージンで、過去最高の結果を上回っている。
論文 参考訳(メタデータ) (2024-02-04T04:28:02Z) - D3PRefiner: A Diffusion-based Denoise Method for 3D Human Pose
Refinement [3.514184876338779]
拡散型3次元ポース・リファイナは既存の3次元ポーズ推定器の出力を改良するために提案される。
現在の拡散モデルのアーキテクチャを利用して、ノイズの多い3Dポーズの分布を3Dポーズに変換する。
実験により,提案アーキテクチャは,現在の3次元ポーズ推定器の性能を大幅に向上させることができることを示した。
論文 参考訳(メタデータ) (2024-01-08T14:21:02Z) - Multi-View Object Pose Refinement With Differentiable Renderer [22.040014384283378]
本稿では,合成データの学習方法の改善に焦点をあてた,新しい多視点6 DoFオブジェクトポーズ改善手法を提案する。
これはDPOD検出器に基づいており、各フレーム内のモデル頂点と画像画素との間の密度の高い2D-3D対応を生成する。
合成および実データに基づいて訓練された最先端の手法と比較して優れた性能を報告した。
論文 参考訳(メタデータ) (2022-07-06T17:02:22Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust
Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。
この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。
各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文 参考訳(メタデータ) (2022-03-24T06:24:55Z) - Adversarial Parametric Pose Prior [106.12437086990853]
我々は、SMPLパラメータを現実的なポーズを生成する値に制限する事前学習を行う。
得られた先行学習は実データ分布の多様性をカバーし、2次元キーポイントからの3次元再構成の最適化を容易にし、画像からの回帰に使用する場合のポーズ推定精度を向上することを示す。
論文 参考訳(メタデータ) (2021-12-08T10:05:32Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Wide-angle Image Rectification: A Survey [86.36118799330802]
広角画像は、基礎となるピンホールカメラモデルに反する歪みを含む。
これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。
本稿では、異なるアプローチで使用されるカメラモデルについて、詳細な説明と議論を行う。
次に,従来の幾何学に基づく画像修正手法と深層学習法の両方について検討する。
論文 参考訳(メタデータ) (2020-10-30T17:28:40Z) - Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。
主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。
本稿では,D2S(Deep-to-scale)投影法を提案する。
論文 参考訳(メタデータ) (2020-10-27T03:31:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。