論文の概要: AdaFuse: Adaptive Multiview Fusion for Accurate Human Pose Estimation in
the Wild
- arxiv url: http://arxiv.org/abs/2010.13302v1
- Date: Mon, 26 Oct 2020 03:19:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 19:05:02.800726
- Title: AdaFuse: Adaptive Multiview Fusion for Accurate Human Pose Estimation in
the Wild
- Title(参考訳): adafuse:野生の正確なポーズ推定のための適応型マルチビュー融合
- Authors: Zhe Zhang, Chunyu Wang, Weichao Qiu, Wenhu Qin, Wenjun Zeng
- Abstract要約: 本稿では,アダプティブなマルチビュー融合手法であるAdaFuseについて述べる。
我々は、Human3.6M、Total Capture、CMU Panopticの3つの公開データセットに対するアプローチを広く評価した。
また,大規模合成データセットOcclusion-Personを作成し,咬合関節の数値評価を行う。
- 参考スコア(独自算出の注目度): 77.43884383743872
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Occlusion is probably the biggest challenge for human pose estimation in the
wild. Typical solutions often rely on intrusive sensors such as IMUs to detect
occluded joints. To make the task truly unconstrained, we present AdaFuse, an
adaptive multiview fusion method, which can enhance the features in occluded
views by leveraging those in visible views. The core of AdaFuse is to determine
the point-point correspondence between two views which we solve effectively by
exploring the sparsity of the heatmap representation. We also learn an adaptive
fusion weight for each camera view to reflect its feature quality in order to
reduce the chance that good features are undesirably corrupted by ``bad''
views. The fusion model is trained end-to-end with the pose estimation network,
and can be directly applied to new camera configurations without additional
adaptation. We extensively evaluate the approach on three public datasets
including Human3.6M, Total Capture and CMU Panoptic. It outperforms the
state-of-the-arts on all of them. We also create a large scale synthetic
dataset Occlusion-Person, which allows us to perform numerical evaluation on
the occluded joints, as it provides occlusion labels for every joint in the
images. The dataset and code are released at
https://github.com/zhezh/adafuse-3d-human-pose.
- Abstract(参考訳): 咬合は、野生の人間のポーズ推定にとっておそらく最大の課題である。
典型的な解法は、閉塞された関節を検出するために、IMUのような侵入センサーに依存することが多い。
タスクを真に無拘束にするために,適応型マルチビュー融合手法であるadafuseを提案する。
AdaFuseの中核は、ヒートマップ表現の空間性を探究することによって、効果的に解決する2つのビュー間のポイント対応を決定することである。
さらに,各カメラビューに対する適応的な融合重みを学習し,その機能品質を反映して,‘bad’ビューによって,優れた機能が望ましくないほど損なわれる可能性を低減する。
融合モデルはポーズ推定ネットワークでエンドツーエンドに訓練され、追加の適応なしに新しいカメラ構成に直接適用することができる。
我々は、Human3.6M、Total Capture、CMU Panopticの3つの公開データセットに対するアプローチを広く評価した。
それらすべてにおいて最先端の技術を上回っている。
また、画像中のすべての関節に対して閉塞ラベルを提供するため、閉塞関節の数値評価を可能にする大規模な合成データセットOcclusion-Personを作成する。
データセットとコードはhttps://github.com/zhezh/adafuse-3d-human-poseでリリースされる。
関連論文リスト
- Enhancing 3D Human Pose Estimation Amidst Severe Occlusion with Dual Transformer Fusion [13.938406073551844]
本稿では,DTF(Dual Transformer Fusion)アルゴリズムを提案する。
正確な3Dヒューマンポース推定を実現するために,本手法では,まず2つの中間ビューを生成する革新的なDTFアーキテクチャを利用する。
このアプローチは、両方のデータセットで既存の最先端メソッドよりも優れており、大幅に改善されています。
論文 参考訳(メタデータ) (2024-10-06T18:15:27Z) - Occ$^2$Net: Robust Image Matching Based on 3D Occupancy Estimation for
Occluded Regions [14.217367037250296]
Occ$2$Netは、3D占有率を用いて閉塞関係をモデル化し、閉塞領域の一致点を推測する画像マッチング手法である。
本手法は実世界とシミュレーションデータセットの両方で評価し,いくつかの指標における最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-08-14T13:09:41Z) - AdaptivePose++: A Powerful Single-Stage Network for Multi-Person Pose
Regression [66.39539141222524]
そこで本研究では,ヒトの部位を適応点として表現し,微細な身体表現法を提案する。
提案するボディ表現では,AdaptivePoseと呼ばれる,コンパクトなシングルステージ多人数ポーズ回帰ネットワークを提供する。
本稿では,AdaptivePoseの有効性を検証するために,2D/3D多人数ポーズ推定タスクにAdaptivePoseを用いる。
論文 参考訳(メタデータ) (2022-10-08T12:54:20Z) - FusePose: IMU-Vision Sensor Fusion in Kinematic Space for Parametric
Human Pose Estimation [12.821740951249552]
パラメトリック・ヒューマン・キネマティック・モデルを用いてemphFusePoseというフレームワークを提案する。
IMUや視覚データの異なる情報を収集し、NaiveFuse、KineFuse、AdaDeepFuseの3つの特徴的なセンサー融合手法を導入する。
3次元人のポーズ推定の性能は、ベースライン結果よりも向上する。
論文 参考訳(メタデータ) (2022-08-25T09:35:27Z) - Explicit Occlusion Reasoning for Multi-person 3D Human Pose Estimation [33.86986028882488]
咬合は, 咬合者の形状, 外観, 位置の変動が大きいため, 単眼多面体3次元ポーズ推定において大きな脅威となる。
既存のメソッドは、ポーズ先/制約、データ拡張、暗黙の推論でオクルージョンを処理しようとする。
本研究では、ボトムアップ型多人数ポーズ推定を大幅に改善する、このプロセスを明示的にモデル化する手法を開発した。
論文 参考訳(メタデータ) (2022-07-29T22:12:50Z) - Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Occlusion-Invariant Rotation-Equivariant Semi-Supervised Depth Based
Cross-View Gait Pose Estimation [40.50555832966361]
閉塞不変な半教師あり学習フレームワークを用いたクロスビュー一般化のための新しい手法を提案する。
本モデルは,1つの視点からの実世界データと,複数の視点からの非競合合成データを用いて訓練した。
他の目に見えないすべてのビューから、現実世界のデータをうまく一般化することができる。
論文 参考訳(メタデータ) (2021-09-03T09:39:05Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。