論文の概要: Peeking into occluded joints: A novel framework for crowd pose
estimation
- arxiv url: http://arxiv.org/abs/2003.10506v3
- Date: Tue, 31 Mar 2020 02:01:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 00:35:21.696395
- Title: Peeking into occluded joints: A novel framework for crowd pose
estimation
- Title(参考訳): 閉ざされた関節を覗く:群衆のポーズ推定のための新しい枠組み
- Authors: Lingteng Qiu, Xuanye Zhang, Yanran Li, Guanbin Li, Xiaojun Wu, Zixiang
Xiong, Xiaoguang Han and Shuguang Cui
- Abstract要約: OPEC-NetはイメージガイドされたプログレッシブGCNモジュールで、推論の観点から見えない関節を推定する。
OCPoseは、隣接するインスタンス間の平均IoUに対して、最も複雑なOccluded Poseデータセットである。
- 参考スコア(独自算出の注目度): 88.56203133287865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although occlusion widely exists in nature and remains a fundamental
challenge for pose estimation, existing heatmap-based approaches suffer serious
degradation on occlusions. Their intrinsic problem is that they directly
localize the joints based on visual information; however, the invisible joints
are lack of that. In contrast to localization, our framework estimates the
invisible joints from an inference perspective by proposing an Image-Guided
Progressive GCN module which provides a comprehensive understanding of both
image context and pose structure. Moreover, existing benchmarks contain limited
occlusions for evaluation. Therefore, we thoroughly pursue this problem and
propose a novel OPEC-Net framework together with a new Occluded Pose (OCPose)
dataset with 9k annotated images. Extensive quantitative and qualitative
evaluations on benchmarks demonstrate that OPEC-Net achieves significant
improvements over recent leading works. Notably, our OCPose is the most complex
occlusion dataset with respect to average IoU between adjacent instances.
Source code and OCPose will be publicly available.
- Abstract(参考訳): 咬合は自然界に広く存在し、姿勢推定の基本的な課題となっているが、既存のヒートマップに基づくアプローチは咬合の深刻な劣化を招いている。
彼らの本質的な問題は、視覚情報に基づいてジョイントを直接ローカライズすることだが、目に見えないジョイントにはそれが欠けている。
ローカライゼーションとは対照的に,画像のコンテキストとポーズ構造の両方を包括的に理解するImage-Guided Progressive GCNモジュールを提案することにより,推論の観点から見えない関節を推定する。
さらに、既存のベンチマークには、評価のための限定的なオクルージョンが含まれている。
そこで我々はこの問題を徹底的に追求し,9k の注釈付き画像を用いた新しい Occluded Pose (OCPose) データセットとともに,新しい OPEC-Net フレームワークを提案する。
ベンチマークの広範な量的・質的評価は、opec-netが最近の先行研究よりも大きな改善を達成していることを示している。
特に,OCPoseは,隣接インスタンス間の平均IoUに対して,最も複雑な閉塞データセットである。
ソースコードとocposeは公開される予定だ。
関連論文リスト
- UNOPose: Unseen Object Pose Estimation with an Unposed RGB-D Reference Image [86.7128543480229]
単参照型オブジェクトポーズ推定のための新しいアプローチとベンチマークをUNOPoseと呼ぶ。
粗大なパラダイムに基づいて、UNOPoseはSE(3)不変の参照フレームを構築し、オブジェクト表現を標準化する。
重なり合う領域内に存在すると予測される確率に基づいて、各対応の重みを補正する。
論文 参考訳(メタデータ) (2024-11-25T05:36:00Z) - Dynamic Feature Pruning and Consolidation for Occluded Person
Re-Identification [21.006680330530852]
本研究では, 明示的な人間の構造解析を回避するために, 機能解析・統合(FPC)フレームワークを提案する。
フレームワークは主にスパースエンコーダ、マルチビュー機能mathcingモジュール、フィーチャーコンソリデーションデコーダで構成されている。
提案手法は,Occluded-Dukeデータセットにおいて,少なくとも8.6% mAPと6.0% Rank-1の精度で最新結果より優れる。
論文 参考訳(メタデータ) (2022-11-27T06:18:40Z) - Generalised Co-Salient Object Detection [50.876864826216924]
本稿では,従来のCo-Salient Object Detection(CoSOD)設定における仮定を緩和する新しい設定を提案する。
我々はこの新たな設定を一般共分散オブジェクト検出(GCoSOD)と呼ぶ。
本稿では,コサリエントオブジェクトのイメージ間欠如の認識をCoSODモデルに再現する,新しいランダムサンプリングに基づく一般CoSODトレーニング(Generalized CoSOD Training, GCT)手法を提案する。
論文 参考訳(メタデータ) (2022-08-20T12:23:32Z) - Temporal Feature Alignment and Mutual Information Maximization for
Video-Based Human Pose Estimation [38.571715193347366]
マルチフレーム人間のポーズ推定のための新しい階層的アライメントフレームワークを提案する。
ベンチマークデータセットのPoseTrack 2017では、マルチフレームPerson Pose Estimation Challengeの1位にランクインし、ベンチマークのSub-JHMDBとPose-Track 2018では最先端のパフォーマンスを得ています。
論文 参考訳(メタデータ) (2022-03-29T04:29:16Z) - Railroad is not a Train: Saliency as Pseudo-pixel Supervision for Weakly
Supervised Semantic Segmentation [16.560870740946275]
EPS (Explicit Pseudo-Pixel Supervision) は2つの弱い監督と組み合わせることでピクセルレベルのフィードバックから学習する。
両情報間の補完関係を完全に活用するための共同学習戦略を考案する。
提案手法は, 正確なオブジェクト境界を求め, 共起画素を破棄することにより, 擬似マスクの品質を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-05-19T07:31:11Z) - Learning to Estimate Hidden Motions with Global Motion Aggregation [71.12650817490318]
閉塞は、局所的な証拠に依存する光学フローアルゴリズムに重大な課題をもたらす。
最初の画像でピクセル間の長距離依存性を見つけるために,グローバルモーションアグリゲーションモジュールを導入する。
遮蔽領域における光流量推定が非遮蔽領域における性能を損なうことなく大幅に改善できることを実証した。
論文 参考訳(メタデータ) (2021-04-06T10:32:03Z) - AdaFuse: Adaptive Multiview Fusion for Accurate Human Pose Estimation in
the Wild [77.43884383743872]
本稿では,アダプティブなマルチビュー融合手法であるAdaFuseについて述べる。
我々は、Human3.6M、Total Capture、CMU Panopticの3つの公開データセットに対するアプローチを広く評価した。
また,大規模合成データセットOcclusion-Personを作成し,咬合関節の数値評価を行う。
論文 参考訳(メタデータ) (2020-10-26T03:19:46Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。