論文の概要: A Coarse-to-Fine Human Pose Estimation Method based on Two-stage Distillation and Progressive Graph Neural Network
- arxiv url: http://arxiv.org/abs/2508.11212v1
- Date: Fri, 15 Aug 2025 04:41:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.747388
- Title: A Coarse-to-Fine Human Pose Estimation Method based on Two-stage Distillation and Progressive Graph Neural Network
- Title(参考訳): 2段階蒸留とプログレッシブ・グラフ・ニューラルネットを用いた粗大な人間行動推定法
- Authors: Zhangjian Ji, Wenjin Zhang, Shaotong Qiao, Kai Feng, Yuhua Qian,
- Abstract要約: 人間のポーズ推定のための粗大な2段階の知識蒸留フレームワークを提案する。
第1段蒸留では,ヒト関節の構造情報をマイニングするために,ヒト関節の構造損失を導入する。
第2段階蒸留では、画像誘導プログレッシブグラフ畳み込みネットワーク(IGP-GCN)を用いて、最初の人間のポーズを洗練する。
- 参考スコア(独自算出の注目度): 13.555932146811658
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Human pose estimation has been widely applied in the human-centric understanding and generation, but most existing state-of-the-art human pose estimation methods require heavy computational resources for accurate predictions. In order to obtain an accurate, robust yet lightweight human pose estimator, one feasible way is to transfer pose knowledge from a powerful teacher model to a less-parameterized student model by knowledge distillation. However, the traditional knowledge distillation framework does not fully explore the contextual information among human joints. Thus, in this paper, we propose a novel coarse-to-fine two-stage knowledge distillation framework for human pose estimation. In the first-stage distillation, we introduce the human joints structure loss to mine the structural information among human joints so as to transfer high-level semantic knowledge from the teacher model to the student model. In the second-stage distillation, we utilize an Image-Guided Progressive Graph Convolutional Network (IGP-GCN) to refine the initial human pose obtained from the first-stage distillation and supervise the training of the IGP-GCN in the progressive way by the final output pose of teacher model. The extensive experiments on the benchmark dataset: COCO keypoint and CrowdPose datasets, show that our proposed method performs favorably against lots of the existing state-of-the-art human pose estimation methods, especially for the more complex CrowdPose dataset, the performance improvement of our model is more significant.
- Abstract(参考訳): 人間のポーズ推定は、人間中心の理解と生成に広く応用されてきたが、既存の最先端の人間のポーズ推定手法では、正確な予測のために大量の計算資源を必要とする。
正確で頑丈で軽量な人間のポーズ推定器を得るためには、強力な教師モデルから知識の蒸留により、よりパラメータの低い学生モデルにポーズの知識を移すことが考えられる。
しかし、従来の知識蒸留の枠組みは、人間の関節間の文脈情報を十分に探求するものではない。
そこで本研究では,人間のポーズ推定のための粗大な2段階の知識蒸留フレームワークを提案する。
第1段蒸留では,教師モデルから学生モデルへ高レベルの意味知識を伝達するために,人間の関節の構造情報をマイニングするために,人間の関節構造損失を導入する。
第2段蒸留では、IGP-GCN(Image-Guided Progressive Graph Convolutional Network)を用いて、第1段蒸留から得られた最初の人間のポーズを洗練し、教師モデルの最終的な出力ポーズによって段階的にIGP-GCNのトレーニングを監督する。
ベンチマークデータセットに関する広範な実験:COCOキーポイントとCrowdPoseデータセットは、提案手法が既存の最先端の人間のポーズ推定手法、特により複雑なCrowdPoseデータセットに対して好適に動作することを示す。
関連論文リスト
- A New Teacher-Reviewer-Student Framework for Semi-supervised 2D Human Pose Estimation [33.01458098153753]
新しく設計された教師-視聴者-学生の枠組みを利用して,新しい半教師付き2次元ポーズ推定手法を提案する。
具体的には、まず、人類がフレームワークを設計するための統合のための以前の知識を常にレビューする現象を模倣する。
第2に、バックボーンの異なるステージからの出力を利用して、ヒートマップを推定し、ネットワークトレーニングをガイドするマルチレベル特徴学習戦略を導入する。
論文 参考訳(メタデータ) (2025-01-16T14:40:02Z) - Denoising and Selecting Pseudo-Heatmaps for Semi-Supervised Human Pose
Estimation [38.97427474379367]
ラベルのないデータから学習するターゲットとして,信頼度の高い擬似熱マップを生成するための認知スキームを導入する。
評価された学生間の不確実性によって導かれる擬似熱マップから学習対象を選択する。
提案手法は,従来の半教師付きポーズ推定装置よりも優れていた。
論文 参考訳(メタデータ) (2023-09-29T19:17:30Z) - Effective Whole-body Pose Estimation with Two-stages Distillation [52.92064408970796]
全体ポーズ推定は、画像内の人体、手、顔、足のキーポイントをローカライズする。
textbfWhole-body textbfPose 推定器の2段階ポーズ textbfDistillation を提案し,その有効性と効率性について検討した。
論文 参考訳(メタデータ) (2023-07-29T03:49:28Z) - Rethinking pose estimation in crowds: overcoming the detection
information-bottleneck and ambiguity [46.10812760258666]
個人間の頻繁な相互作用は、ポーズ推定アルゴリズムの基本的な課題である。
ボトムアップ条件付きトップダウンポーズ推定と呼ばれる新しいパイプラインを提案する。
動物と人間のポーズ推定ベンチマークにおけるアプローチの性能と効率を実証する。
論文 参考訳(メタデータ) (2023-06-13T16:14:40Z) - TWINS: A Fine-Tuning Framework for Improved Transferability of
Adversarial Robustness and Generalization [89.54947228958494]
本稿では,様々な分類タスクにおいて,逆向きに事前訓練されたモデルの微調整に焦点を当てる。
本稿では,TWINS(Two-WIng NormliSation)ファインチューニングフレームワークを提案する。
TWINSは、一般化とロバスト性の両方の観点から、幅広い画像分類データセットに有効であることが示されている。
論文 参考訳(メタデータ) (2023-03-20T14:12:55Z) - Bottom-Up 2D Pose Estimation via Dual Anatomical Centers for Small-Scale
Persons [75.86463396561744]
マルチパーソン2Dポーズ推定では、ボトムアップ手法は同時にすべての人のポーズを予測する。
本手法は,バウンディングボックス精度を38.4%改善し,バウンディングボックスリコールを39.1%改善した。
ヒトのポーズAP評価では,COCOテストデフセット上で新しいSOTA(71.0 AP)を単一スケールテストで達成する。
論文 参考訳(メタデータ) (2022-08-25T10:09:10Z) - Low-resolution Human Pose Estimation [49.531572116079026]
低分解能ポーズ推定のための信頼意識学習(CAL)手法を提案する。
CALは、既存のオフセット学習手法の2つの基本的な制限に対処する: 一貫性のないトレーニングとテスト、分離されたヒートマップとオフセット学習。
提案手法は,低分解能人間のポーズ推定における最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-09-19T09:13:57Z) - Online Knowledge Distillation for Efficient Pose Estimation [37.81478634850458]
一段階的に人間の詩構造知識を蒸留し,新しいオンライン知識蒸留フレームワークについて検討する。
OKDHPは単一のマルチブランチネットワークをトレーニングし、予測されたヒートマップをそれぞれ取得する。
画素ワイドのKullback-Leibler分散を利用して、対象ヒートマップと予測値との差を最小限に抑える。
論文 参考訳(メタデータ) (2021-08-04T14:49:44Z) - Data-Efficient Ranking Distillation for Image Retrieval [15.88955427198763]
近年のアプローチでは、より深く重いアーキテクチャからより小さなネットワークへ知識を伝達するために、知識蒸留を用いてこの問題に対処している。
本稿では,計量学習問題に対する知識蒸留について述べる。
従来の手法とは違って,提案手法では,教師モデルに対する限定的なクエリ,最終出力表現へのアクセスを伴うブラックボックス教師モデル,および第3に,基本トラストラベルのないオリジナルトレーニングデータのごく一部に対処する。
論文 参考訳(メタデータ) (2020-07-10T10:59:16Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。