Fugu-MT 論文翻訳(概要): Camera Distortion-aware 3D Human Pose Estimation in Video with Optimization-based Meta-Learning

論文の概要: Camera Distortion-aware 3D Human Pose Estimation in Video with Optimization-based Meta-Learning

arxiv url: http://arxiv.org/abs/2111.15056v1
Date: Tue, 30 Nov 2021 01:35:04 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-01 15:11:49.858061
Title: Camera Distortion-aware 3D Human Pose Estimation in Video with Optimization-based Meta-Learning
Title（参考訳）: 最適化型メタラーニングによる映像中の3次元人物ポーズ推定
Authors: Hanbyel Cho, Yooshin Cho, Jaemyung Yu, Junmo Kim
Abstract要約: 歪みのないデータセットでトレーニングされた既存の3次元ポーズ推定アルゴリズムは、特定のカメラ歪みのある新しいシナリオに適用した場合、パフォーマンス低下を被る。本研究では, 歪み環境に迅速に適応できる簡易かつ効果的な3次元ポーズ推定モデルを提案する。
参考スコア（独自算出の注目度）: 23.200130129530653
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Existing 3D human pose estimation algorithms trained on distortion-free datasets suffer performance drop when applied to new scenarios with a specific camera distortion. In this paper, we propose a simple yet effective model for 3D human pose estimation in video that can quickly adapt to any distortion environment by utilizing MAML, a representative optimization-based meta-learning algorithm. We consider a sequence of 2D keypoints in a particular distortion as a single task of MAML. However, due to the absence of a large-scale dataset in a distorted environment, we propose an efficient method to generate synthetic distorted data from undistorted 2D keypoints. For the evaluation, we assume two practical testing situations depending on whether a motion capture sensor is available or not. In particular, we propose Inference Stage Optimization using bone-length symmetry and consistency. Extensive evaluation shows that our proposed method successfully adapts to various degrees of distortion in the testing phase and outperforms the existing state-of-the-art approaches. The proposed method is useful in practice because it does not require camera calibration and additional computations in a testing set-up.
Abstract（参考訳）: 歪みのないデータセットでトレーニングされた既存の3次元ポーズ推定アルゴリズムは、特定のカメラ歪みのある新しいシナリオに適用した場合、パフォーマンス低下を被る。本稿では,代表的最適化に基づくメタ学習アルゴリズムであるMAMLを用いて,任意の歪み環境に迅速に適応可能な,映像中の3次元ポーズ推定のための簡易かつ効果的なモデルを提案する。我々は,MAMLの単一タスクとして,特定の歪みにおける2次元キーポイントのシーケンスを考える。しかし,歪みのある環境では大規模データセットが存在しないため,歪みのない2次元キーポイントから合成歪データを生成する効率的な手法を提案する。本評価では,モーションキャプチャセンサが利用可能か否かに応じて,2つの実測条件を仮定する。特に,骨長対称性と一貫性を用いた推定段階最適化を提案する。その結果,提案手法は試験段階における様々な歪みに適応し,既存の最先端手法よりも優れていた。提案手法は,カメラキャリブレーションや追加計算を必要としないため,実際に有用である。

関連論文リスト

Geometric Transformation Uncertainty for Improving 3D Fetal Brain Pose Prediction from Freehand 2D Ultrasound Videos [0.8579241568505183]
2次元胎児脳画像における3次元面の自動位置決めのための不確実性を考慮した深層学習モデルを提案する。提案手法であるQAERTSは、現状や不確実性に基づくアプローチよりも優れたポーズ推定精度を示す。
論文参考訳（メタデータ） (2024-05-21T22:42:08Z)
UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文参考訳（メタデータ） (2024-04-23T00:18:00Z)
Personalized 3D Human Pose and Shape Refinement [19.082329060985455]
回帰に基づく手法は3次元人間のポーズと形状推定の分野を支配してきた。本稿では,初期人間のモデル推定値と対応する画像との密接な対応性を構築することを提案する。提案手法は画像モデルアライメントの改善だけでなく,3次元精度の向上にも寄与する。
論文参考訳（メタデータ） (2024-03-18T10:13:53Z)
Uncertainty-Aware Testing-Time Optimization for 3D Human Pose Estimation [68.75387874066647]
本研究では3次元ポーズ推定のための不確実性認識テスト時間最適化フレームワークを提案する。我々のアプローチは、Human3.6Mの4.5%という大きなマージンで、過去最高の結果を上回っている。
論文参考訳（メタデータ） (2024-02-04T04:28:02Z)
D3PRefiner: A Diffusion-based Denoise Method for 3D Human Pose Refinement [3.514184876338779]
拡散型3次元ポース・リファイナは既存の3次元ポーズ推定器の出力を改良するために提案される。現在の拡散モデルのアーキテクチャを利用して、ノイズの多い3Dポーズの分布を3Dポーズに変換する。実験により,提案アーキテクチャは,現在の3次元ポーズ推定器の性能を大幅に向上させることができることを示した。
論文参考訳（メタデータ） (2024-01-08T14:21:02Z)
iComMa: Inverting 3D Gaussian Splatting for Camera Pose Estimation via Comparing and Matching [14.737266480464156]
コンピュータビジョンにおける6次元カメラのポーズ推定問題に対処するため,iComMaという手法を提案する。 3次元ガウススプラッティング(3DGS)の反転による高精度カメラポーズ推定法を提案する。
論文参考訳（メタデータ） (2023-12-14T15:31:33Z)
Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文参考訳（メタデータ） (2022-03-29T07:14:58Z)
RNNPose: Recurrent 6-DoF Object Pose Refinement with Robust Correspondence Field Estimation and Pose Optimization [46.144194562841435]
本稿では、オブジェクトポーズ改善のためのリカレントニューラルネットワーク(RNN)に基づくフレームワークを提案する。この問題は、推定対応フィールドに基づいて非線形最小二乗問題として定式化される。各イテレーションにおいて、対応フィールド推定とポーズ精錬を代替して行い、正確なオブジェクトポーズを復元する。
論文参考訳（メタデータ） (2022-03-24T06:24:55Z)
Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文参考訳（メタデータ） (2021-07-08T15:19:36Z)
Wide-angle Image Rectification: A Survey [86.36118799330802]
広角画像は、基礎となるピンホールカメラモデルに反する歪みを含む。これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。本稿では、異なるアプローチで使用されるカメラモデルについて、詳細な説明と議論を行う。次に,従来の幾何学に基づく画像修正手法と深層学習法の両方について検討する。
論文参考訳（メタデータ） (2020-10-30T17:28:40Z)
Synthetic Training for Monocular Human Mesh Recovery [100.38109761268639]
本稿では,RGB画像と大規模に異なる複数の身体部位の3次元メッシュを推定することを目的とする。主な課題は、2D画像のすべての身体部分の3Dアノテーションを完備するトレーニングデータがないことである。本稿では,D2S(Deep-to-scale)投影法を提案する。
論文参考訳（メタデータ） (2020-10-27T03:31:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。