論文の概要: UV R-CNN: Stable and Efficient Dense Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2211.02337v1
- Date: Fri, 4 Nov 2022 09:29:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 16:53:59.711882
- Title: UV R-CNN: Stable and Efficient Dense Human Pose Estimation
- Title(参考訳): UV R-CNN: 安定かつ高効率な人文推定
- Authors: Wenhe Jia, Yilin Zhou, Xuhan Zhu, Mengjie Hu, Chun Liu, Qing Song
- Abstract要約: デンスポーズ推定は、ケースレベルの人間分析のための密集した3次元予測タスクである。
トレーニングの進捗を安定させるためにDense Points Losという新しいポイント回帰損失関数を導入し、マルチタスクの損失を処理するための新しいバランスの取れた損失重み付け戦略を提案する。
他のタスクからの補助的な監督や外部知識がなければ、UV R-CNNは密集したポーズモデルトレーニングの進捗において、多くの複雑な問題に対処できる。
- 参考スコア(独自算出の注目度): 5.268093876796865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dense pose estimation is a dense 3D prediction task for instance-level human
analysis, aiming to map human pixels from an RGB image to a 3D surface of the
human body. Due to a large amount of surface point regression, the training
process appears to be easy to collapse compared to other region-based human
instance analyzing tasks. By analyzing the loss formulation of the existing
dense pose estimation model, we introduce a novel point regression loss
function, named Dense Points} loss to stable the training progress, and a new
balanced loss weighting strategy to handle the multi-task losses. With the
above novelties, we propose a brand new architecture, named UV R-CNN. Without
auxiliary supervision and external knowledge from other tasks, UV R-CNN can
handle many complicated issues in dense pose model training progress, achieving
65.0% $AP_{gps}$ and 66.1% $AP_{gpsm}$ on the DensePose-COCO validation subset
with ResNet-50-FPN feature extractor, competitive among the state-of-the-art
dense human pose estimation methods.
- Abstract(参考訳): 高密度ポーズ推定は、rgb画像から人体の3d面に人間のピクセルをマッピングすることを目的とした、インスタンスレベルの人間分析のための高密度な3d予測タスクである。
表面位置回帰が多すぎるため、他の領域ベースのヒューマンインスタンス分析タスクと比較して、トレーニングプロセスは崩壊しやすいように思われる。
既存の高密度ポーズ推定モデルの損失定式化を解析することにより、トレーニングの進捗を安定させるためにDense Points}損失という新しいポイント回帰損失関数を導入し、マルチタスクの損失を処理するための新たなバランス付き損失重み付け戦略を提案する。
以上より,UV R-CNNという新しいアーキテクチャを提案する。
他のタスクからの補助的な監督や外部知識がなければ、UV R-CNNは65.0%$AP_{gps}$と66.1%$AP_{gpsm}$をResNet-50-FPN機能抽出器でDensePose-COの検証サブセットで達成し、最先端のヒトのポーズ推定方法と競合する多くの複雑な問題に対処できる。
関連論文リスト
- Deep Loss Convexification for Learning Iterative Models [11.36644967267829]
点雲登録のための反復的最近点(ICP)のような反復的手法は、しばしば悪い局所最適性に悩まされる。
我々は,各地真実の周囲に凸景観を形成する学習を提案する。
論文 参考訳(メタデータ) (2024-11-16T01:13:04Z) - AiOS: All-in-One-Stage Expressive Human Pose and Shape Estimation [55.179287851188036]
人間のポーズと形状の復元のための新しいオールインワンステージフレームワークであるAiOSを、追加の人間検出ステップなしで導入する。
まず、画像中の人間の位置を探索し、各インスタンスのグローバルな機能をエンコードするために、人間のトークンを使用します。
そして、画像中の人間の関節を探索し、きめ細かい局所的特徴を符号化するジョイント関連トークンを導入する。
論文 参考訳(メタデータ) (2024-03-26T17:59:23Z) - DOR3D-Net: Dense Ordinal Regression Network for 3D Hand Pose Estimation [6.327974053228352]
我々は高次回帰問題として3次元手ポーズ推定を再定式化する。
我々はDOR3D-Net(Dense Ordinal Regression 3D Pose Network)を提案する。
我々の設計はSOTA法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-03-20T08:47:51Z) - 3D Human Pose Analysis via Diffusion Synthesis [65.268245109828]
PADSは、逆問題フレームワーク内での一般的な3次元ポーズ解析に取り組むための、初めての拡散ベースのフレームワークである。
その性能は異なるベンチマークで検証され、パイプラインの適応性と堅牢性を示している。
論文 参考訳(メタデータ) (2024-01-17T02:59:34Z) - Bottom-Up 2D Pose Estimation via Dual Anatomical Centers for Small-Scale
Persons [75.86463396561744]
マルチパーソン2Dポーズ推定では、ボトムアップ手法は同時にすべての人のポーズを予測する。
本手法は,バウンディングボックス精度を38.4%改善し,バウンディングボックスリコールを39.1%改善した。
ヒトのポーズAP評価では,COCOテストデフセット上で新しいSOTA(71.0 AP)を単一スケールテストで達成する。
論文 参考訳(メタデータ) (2022-08-25T10:09:10Z) - Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2022-07-04T16:35:58Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Phase Transitions, Distance Functions, and Implicit Neural
Representations [26.633795221150475]
Inlicit Neural Representations (INRs) は幾何学的深層学習と3次元視覚において多くの下流の応用に役立っている。
ログ変換は距離関数に収束する一方、適切な占有関数に収束する密度関数を学習するINRの訓練における損失を提案する。
論文 参考訳(メタデータ) (2021-06-14T18:13:45Z) - Neural Descent for Visual 3D Human Pose and Shape [67.01050349629053]
入力RGB画像から3次元のポーズと形状を復元するディープニューラルネットワーク手法を提案する。
我々は最近導入された表現力のあるボディ統計モデルGHUMに頼っている。
我々の方法論の中心は、HUmanNeural Descent (HUND)と呼ばれるアプローチの学習と最適化である。
論文 参考訳(メタデータ) (2020-08-16T13:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。