論文の概要: An End-to-End Framework for Unsupervised Pose Estimation of Occluded
Pedestrians
- arxiv url: http://arxiv.org/abs/2002.06429v1
- Date: Sat, 15 Feb 2020 19:00:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 23:22:07.373320
- Title: An End-to-End Framework for Unsupervised Pose Estimation of Occluded
Pedestrians
- Title(参考訳): 集積歩行者の教師なしポス推定のためのエンドツーエンドフレームワーク
- Authors: Sudip Das, Perla Sai Raj Kishore, Ujjwal Bhattacharya
- Abstract要約: 本稿では,歩行者のポーズ推定全体に向けたエンドツーエンドトレーニングのための新しい枠組みを提案する。
我々は、ポーズ推定データセットであるMS-COCOを利用し、教師なしのインスタンスレベルのドメイン適応を用いて、閉塞した歩行者のポーズ全体を推定する。
- 参考スコア(独自算出の注目度): 2.6491437065671724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pose estimation in the wild is a challenging problem, particularly in
situations of (i) occlusions of varying degrees and (ii) crowded outdoor
scenes. Most of the existing studies of pose estimation did not report the
performance in similar situations. Moreover, pose annotations for occluded
parts of human figures have not been provided in any of the relevant standard
datasets which in turn creates further difficulties to the required studies for
pose estimation of the entire figure of occluded humans. Well known pedestrian
detection datasets such as CityPersons contains samples of outdoor scenes but
it does not include pose annotations. Here, we propose a novel multi-task
framework for end-to-end training towards the entire pose estimation of
pedestrians including in situations of any kind of occlusion. To tackle this
problem for training the network, we make use of a pose estimation dataset,
MS-COCO, and employ unsupervised adversarial instance-level domain adaptation
for estimating the entire pose of occluded pedestrians. The experimental
studies show that the proposed framework outperforms the SOTA results for pose
estimation, instance segmentation and pedestrian detection in cases of heavy
occlusions (HO) and reasonable + heavy occlusions (R + HO) on the two benchmark
datasets.
- Abstract(参考訳): 野生でのポーズ推定は、特に状況において、難しい問題である
(i)様々の閉塞、及び
(ii)屋外の混み合った場面。
ポーズ推定の既存の研究のほとんどは、同様の状況下でのパフォーマンスを報告しなかった。
また、関連する標準データセットには、人物のオクルード部分に対するポーズアノテーションが提供されていないため、オクルードされた人物全体のポーズ推定に必要な研究がさらに困難になる。
CityPersonsのようなよく知られた歩行者検出データセットには屋外シーンのサンプルが含まれているが、ポーズアノテーションは含まない。
そこで,本稿では,歩行者の姿勢推定全体に対するエンド・ツー・エンド・トレーニングのための新しいマルチタスク・フレームワークを提案する。
ネットワークのトレーニングにおけるこの問題に取り組むために,ポーズ推定データセットms-cocoを用いて,非教師なしのインスタンスレベルドメイン適応法を用いて歩行者の姿勢全体を推定する。
実験により,提案手法は,2つのベンチマークデータセット上での重閉塞 (HO) と有理+重閉塞 (R + HO) の場合のポーズ推定,事例分割,歩行者検出において,SOTAの結果よりも優れていた。
関連論文リスト
- Semi-Supervised Unconstrained Head Pose Estimation in the Wild [60.08319512840091]
本研究では,最初の半教師なしヘッドポーズ推定手法であるSemiUHPEを提案する。
本手法は,野生頭部のアスペクト比不変収穫が,それまでのランドマークベースのアフィンアライメントよりも優れているという観測に基づいている。
実験とアブレーション研究は、SemiUHPEが既存の手法を公開ベンチマークで大きく上回っていることを示している。
論文 参考訳(メタデータ) (2024-04-03T08:01:00Z) - A comprehensive framework for occluded human pose estimation [10.92234109536279]
咬合は人間のポーズ推定において重要な課題である。
そこで我々は,DAG (Data, Attention, Graph) を提案する。
また、FGMP-GCN (Feature-Guided Multi-Hop GCN) を提示し、身体構造に関する事前知識を十分に探求し、ポーズ推定結果を改善する。
論文 参考訳(メタデータ) (2023-12-30T06:55:30Z) - Deep Multi-Task Networks For Occluded Pedestrian Pose Estimation [6.7841188753203046]
本稿では, 歩行者の特徴を抽出する枠組みを提案する。
エンコーダは、教師なしインスタンスレベルのドメイン適応法を用いて、特定の特徴のポーズを学ぶ。
提案フレームワークは,ポーズ推定,歩行者検出,事例分割といった最先端性能を改善した。
論文 参考訳(メタデータ) (2022-06-15T13:09:24Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - CPPF: Towards Robust Category-Level 9D Pose Estimation in the Wild [45.93626858034774]
カテゴリーレベルのPPF投票法は、野生における正確で堅牢で一般化可能な9Dポーズ推定を実現する。
ノイズの多い点対のサンプルを排除し、個体群から最終的な予測を生成するために、新しい粗大な投票アルゴリズムを提案する。
我々の手法は実世界のトレーニングデータと同等である。
論文 参考訳(メタデータ) (2022-03-07T01:36:22Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - GraspNet: A Large-Scale Clustered and Densely Annotated Dataset for
Object Grasping [49.777649953381676]
我々は,統合評価システムを用いた大規模グリップポーズ検出データセットに貢献する。
データセットには87,040枚のRGBD画像と3億7000万枚以上のグリップポーズが含まれている。
論文 参考訳(メタデータ) (2019-12-31T18:15:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。