論文の概要: Occluded Human Pose Estimation based on Limb Joint Augmentation
- arxiv url: http://arxiv.org/abs/2410.09885v1
- Date: Sun, 13 Oct 2024 15:48:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-30 04:23:08.566589
- Title: Occluded Human Pose Estimation based on Limb Joint Augmentation
- Title(参考訳): 肢関節拡張に基づく付加的人体電位推定
- Authors: Gangtao Han, Chunxiao Song, Song Wang, Hao Wang, Enqing Chen, Guanghui Wang,
- Abstract要約: そこで本研究では,人体におけるポーズ推定モデルの一般化能力を高めるために,手足関節拡張に基づく閉鎖型ポーズ推定フレームワークを提案する。
モデルの局所化能力を高めるために,手足グラフに基づく動的構造損失関数を構築し,閉塞した関節の分布を探索する。
- 参考スコア(独自算出の注目度): 14.36131862057872
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Human pose estimation aims at locating the specific joints of humans from the images or videos. While existing deep learning-based methods have achieved high positioning accuracy, they often struggle with generalization in occlusion scenarios. In this paper, we propose an occluded human pose estimation framework based on limb joint augmentation to enhance the generalization ability of the pose estimation model on the occluded human bodies. Specifically, the occlusion blocks are at first employed to randomly cover the limb joints of the human bodies from the training images, imitating the scene where the objects or other people partially occlude the human body. Trained by the augmented samples, the pose estimation model is encouraged to accurately locate the occluded keypoints based on the visible ones. To further enhance the localization ability of the model, this paper constructs a dynamic structure loss function based on limb graphs to explore the distribution of occluded joints by evaluating the dependence between adjacent joints. Extensive experimental evaluations on two occluded datasets, OCHuman and CrowdPose, demonstrate significant performance improvements without additional computation cost during inference.
- Abstract(参考訳): 人間のポーズ推定は、画像やビデオから人間の特定の関節を見つけることを目的としている。
既存のディープラーニングベースの手法は高い位置決め精度を達成しているが、隠蔽シナリオの一般化に苦慮することが多い。
本稿では,手足関節拡張に基づく閉鎖型ポーズ推定フレームワークを提案し,閉塞型人体におけるポーズ推定モデルの一般化能力を高める。
具体的には、オクルージョンブロックは、まず、トレーニング画像から人間の手足関節をランダムにカバーするために使用され、対象物や他の人が部分的に人体を閉塞する場面を模倣する。
追加サンプルによって訓練され、ポーズ推定モデルは、目に見えるものに基づいて隠蔽されたキーポイントを正確に見つけることを推奨する。
モデルの局所化能力をさらに高めるため,本論文では,手足グラフに基づく動的構造損失関数を構築し,隣り合う関節間の依存性を評価することにより,閉塞した関節の分布を探索する。
OCHumanとCrowdPoseの2つの排他的データセットに対する大規模な実験的評価は、推論中に計算コストを増大させることなく、大幅なパフォーマンス向上を示す。
関連論文リスト
- AiOS: All-in-One-Stage Expressive Human Pose and Shape Estimation [55.179287851188036]
人間のポーズと形状の復元のための新しいオールインワンステージフレームワークであるAiOSを、追加の人間検出ステップなしで導入する。
まず、画像中の人間の位置を探索し、各インスタンスのグローバルな機能をエンコードするために、人間のトークンを使用します。
そして、画像中の人間の関節を探索し、きめ細かい局所的特徴を符号化するジョイント関連トークンを導入する。
論文 参考訳(メタデータ) (2024-03-26T17:59:23Z) - A comprehensive framework for occluded human pose estimation [10.92234109536279]
咬合は人間のポーズ推定において重要な課題である。
そこで我々は,DAG (Data, Attention, Graph) を提案する。
また、FGMP-GCN (Feature-Guided Multi-Hop GCN) を提示し、身体構造に関する事前知識を十分に探求し、ポーズ推定結果を改善する。
論文 参考訳(メタデータ) (2023-12-30T06:55:30Z) - Anatomy-guided domain adaptation for 3D in-bed human pose estimation [62.3463429269385]
3次元人間のポーズ推定は臨床モニタリングシステムにおいて重要な要素である。
ラベル付きソースからシフトしたラベル付きターゲットドメインにモデルを適応させる新しいドメイン適応方式を提案する。
我々の手法は、様々な最先端のドメイン適応法より一貫して優れています。
論文 参考訳(メタデータ) (2022-11-22T11:34:51Z) - Explicit Occlusion Reasoning for Multi-person 3D Human Pose Estimation [33.86986028882488]
咬合は, 咬合者の形状, 外観, 位置の変動が大きいため, 単眼多面体3次元ポーズ推定において大きな脅威となる。
既存のメソッドは、ポーズ先/制約、データ拡張、暗黙の推論でオクルージョンを処理しようとする。
本研究では、ボトムアップ型多人数ポーズ推定を大幅に改善する、このプロセスを明示的にモデル化する手法を開発した。
論文 参考訳(メタデータ) (2022-07-29T22:12:50Z) - Self-Constrained Inference Optimization on Structural Groups for Human
Pose Estimation [19.630070553319506]
ヒトのポーズ推定の精度とロバスト性を改善するために群構造相関を探索することができる。
我々は,学習中のキーポイント間の構造的相関を特徴付け,学習するための,自己制約付き予測検証ネットワークを開発した。
推論の段階では,検証ネットワークからのフィードバック情報により,ポーズ予測のさらなる最適化を行うことができる。
論文 参考訳(メタデータ) (2022-07-06T03:53:02Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Quantification of Occlusion Handling Capability of a 3D Human Pose
Estimation Framework [11.509692423756448]
提案手法は,関節の欠如を入力とした2次元骨格を用いて,より正確な3次元ポーズを推定する。
本実験は, 欠損関節に対する枠組みの有効性を実証するものである。
論文 参考訳(メタデータ) (2022-03-08T14:35:46Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - Anatomy-aware 3D Human Pose Estimation with Bone-based Pose
Decomposition [92.99291528676021]
3次元関節位置を直接回帰するのではなく,骨方向予測と骨長予測に分解する。
私たちのモチベーションは、人間の骨格の骨の長さが時間とともに一定であることにあります。
我々の完全なモデルは、Human3.6MとMPI-INF-3DHPデータセットにおいて、以前の最高の結果よりも優れています。
論文 参考訳(メタデータ) (2020-02-24T15:49:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。