論文の概要: UV R-CNN: Stable and Efficient Dense Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2211.02337v1
- Date: Fri, 4 Nov 2022 09:29:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 16:53:59.711882
- Title: UV R-CNN: Stable and Efficient Dense Human Pose Estimation
- Title(参考訳): UV R-CNN: 安定かつ高効率な人文推定
- Authors: Wenhe Jia, Yilin Zhou, Xuhan Zhu, Mengjie Hu, Chun Liu, Qing Song
- Abstract要約: デンスポーズ推定は、ケースレベルの人間分析のための密集した3次元予測タスクである。
トレーニングの進捗を安定させるためにDense Points Losという新しいポイント回帰損失関数を導入し、マルチタスクの損失を処理するための新しいバランスの取れた損失重み付け戦略を提案する。
他のタスクからの補助的な監督や外部知識がなければ、UV R-CNNは密集したポーズモデルトレーニングの進捗において、多くの複雑な問題に対処できる。
- 参考スコア(独自算出の注目度): 5.268093876796865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dense pose estimation is a dense 3D prediction task for instance-level human
analysis, aiming to map human pixels from an RGB image to a 3D surface of the
human body. Due to a large amount of surface point regression, the training
process appears to be easy to collapse compared to other region-based human
instance analyzing tasks. By analyzing the loss formulation of the existing
dense pose estimation model, we introduce a novel point regression loss
function, named Dense Points} loss to stable the training progress, and a new
balanced loss weighting strategy to handle the multi-task losses. With the
above novelties, we propose a brand new architecture, named UV R-CNN. Without
auxiliary supervision and external knowledge from other tasks, UV R-CNN can
handle many complicated issues in dense pose model training progress, achieving
65.0% $AP_{gps}$ and 66.1% $AP_{gpsm}$ on the DensePose-COCO validation subset
with ResNet-50-FPN feature extractor, competitive among the state-of-the-art
dense human pose estimation methods.
- Abstract(参考訳): 高密度ポーズ推定は、rgb画像から人体の3d面に人間のピクセルをマッピングすることを目的とした、インスタンスレベルの人間分析のための高密度な3d予測タスクである。
表面位置回帰が多すぎるため、他の領域ベースのヒューマンインスタンス分析タスクと比較して、トレーニングプロセスは崩壊しやすいように思われる。
既存の高密度ポーズ推定モデルの損失定式化を解析することにより、トレーニングの進捗を安定させるためにDense Points}損失という新しいポイント回帰損失関数を導入し、マルチタスクの損失を処理するための新たなバランス付き損失重み付け戦略を提案する。
以上より,UV R-CNNという新しいアーキテクチャを提案する。
他のタスクからの補助的な監督や外部知識がなければ、UV R-CNNは65.0%$AP_{gps}$と66.1%$AP_{gpsm}$をResNet-50-FPN機能抽出器でDensePose-COの検証サブセットで達成し、最先端のヒトのポーズ推定方法と競合する多くの複雑な問題に対処できる。
関連論文リスト
- 3D Human Pose Analysis via Diffusion Synthesis [65.268245109828]
PADSは、逆問題フレームワーク内での一般的な3次元ポーズ解析に取り組むための、初めての拡散ベースのフレームワークである。
その性能は異なるベンチマークで検証され、パイプラインの適応性と堅牢性を示している。
論文 参考訳(メタデータ) (2024-01-17T02:59:34Z) - Geometric Awareness in Neural Fields for 3D Human Registration [40.04624169710299]
3Dヒューマンポイントクラウドへのテンプレートのアライメントは、アニメーションや再構築、教師付き学習パイプラインの有効化といったタスクにおいて、長年の課題である。
近年のデータ駆動方式は予測された表面対応を利用するが、様々なポーズや分布に対して頑健ではない。
本研究では, 対象表面上の局所的なSMPL頂点への方向を予測する新しいニューラルネットワークモデルであるLoVDと, テスト時に, バックボーンを洗練し, ターゲット形状を利用する最初の自己教師型タスクであるINTの2つの解を提案する。
論文 参考訳(メタデータ) (2023-12-21T16:54:09Z) - VQ-HPS: Human Pose and Shape Estimation in a Vector-Quantized Latent
Space [46.52821745179904]
RGB画像からの人間の姿勢と形状の推定は、パラメトリックと非パラメトリックの2つの主要なグループに大別できる。
我々は、HPSEを分類タスクとして、人間のメッシュの低次元離散潜在表現を含むユニークな方法を提案する。
第一に、低次元の離散表現を予測することは、人為的ポーズと形状の空間に我々の予測を閉じ込める。第二に、問題を分類タスクとしてフレーミングすることで、ニューラルネットワークに固有の離散パワーを活用できる。
論文 参考訳(メタデータ) (2023-12-13T17:08:38Z) - Bottom-Up 2D Pose Estimation via Dual Anatomical Centers for Small-Scale
Persons [75.86463396561744]
マルチパーソン2Dポーズ推定では、ボトムアップ手法は同時にすべての人のポーズを予測する。
本手法は,バウンディングボックス精度を38.4%改善し,バウンディングボックスリコールを39.1%改善した。
ヒトのポーズAP評価では,COCOテストデフセット上で新しいSOTA(71.0 AP)を単一スケールテストで達成する。
論文 参考訳(メタデータ) (2022-08-25T10:09:10Z) - Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2022-07-04T16:35:58Z) - KTN: Knowledge Transfer Network for Learning Multi-person 2D-3D
Correspondences [77.56222946832237]
画像中の複数の人物の密着度を検出するための新しい枠組みを提案する。
提案手法は知識伝達ネットワーク(KTN)の2つの問題に対処する。
特徴解像度を同時に維持し、背景画素を抑圧し、この戦略は精度を大幅に向上させる。
論文 参考訳(メタデータ) (2022-06-21T03:11:37Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Phase Transitions, Distance Functions, and Implicit Neural
Representations [26.633795221150475]
Inlicit Neural Representations (INRs) は幾何学的深層学習と3次元視覚において多くの下流の応用に役立っている。
ログ変換は距離関数に収束する一方、適切な占有関数に収束する密度関数を学習するINRの訓練における損失を提案する。
論文 参考訳(メタデータ) (2021-06-14T18:13:45Z) - Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文 参考訳(メタデータ) (2020-08-16T13:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。