論文の概要: A New Teacher-Reviewer-Student Framework for Semi-supervised 2D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2501.09565v1
- Date: Thu, 16 Jan 2025 14:40:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-17 15:10:06.269222
- Title: A New Teacher-Reviewer-Student Framework for Semi-supervised 2D Human Pose Estimation
- Title(参考訳): 半教師付き2次元人文推定のための教師・視聴者・学生のための新しいフレームワーク
- Authors: Wulian Yun, Mengshi Qi, Fei Peng, Huadong Ma,
- Abstract要約: 新しく設計された教師-視聴者-学生の枠組みを利用して,新しい半教師付き2次元ポーズ推定手法を提案する。
具体的には、まず、人類がフレームワークを設計するための統合のための以前の知識を常にレビューする現象を模倣する。
第2に、バックボーンの異なるステージからの出力を利用して、ヒートマップを推定し、ネットワークトレーニングをガイドするマルチレベル特徴学習戦略を導入する。
- 参考スコア(独自算出の注目度): 33.01458098153753
- License:
- Abstract: Conventional 2D human pose estimation methods typically require extensive labeled annotations, which are both labor-intensive and expensive. In contrast, semi-supervised 2D human pose estimation can alleviate the above problems by leveraging a large amount of unlabeled data along with a small portion of labeled data. Existing semi-supervised 2D human pose estimation methods update the network through backpropagation, ignoring crucial historical information from the previous training process. Therefore, we propose a novel semi-supervised 2D human pose estimation method by utilizing a newly designed Teacher-Reviewer-Student framework. Specifically, we first mimic the phenomenon that human beings constantly review previous knowledge for consolidation to design our framework, in which the teacher predicts results to guide the student's learning and the reviewer stores important historical parameters to provide additional supervision signals. Secondly, we introduce a Multi-level Feature Learning strategy, which utilizes the outputs from different stages of the backbone to estimate the heatmap to guide network training, enriching the supervisory information while effectively capturing keypoint relationships. Finally, we design a data augmentation strategy, i.e., Keypoint-Mix, to perturb pose information by mixing different keypoints, thus enhancing the network's ability to discern keypoints. Extensive experiments on publicly available datasets, demonstrate our method achieves significant improvements compared to the existing methods.
- Abstract(参考訳): 従来の2次元ポーズ推定手法では、労働集約的かつ高価である広範囲なラベル付きアノテーションが必要である。
対照的に、半教師付き2次元ポーズ推定は、ラベル付きデータの少ない部分とともに大量のラベル付きデータを活用することにより、上記の問題を緩和することができる。
既存の半教師付き2次元ポーズ推定手法では、過去のトレーニングプロセスから重要な歴史的情報を無視して、バックプロパゲーションを通じてネットワークを更新する。
そこで本研究では,新たに設計したTeacher-Reviewer-Studentフレームワークを用いて,半教師付き2次元ポーズ推定手法を提案する。
具体的には、まず、教師が生徒の学習を指導するために結果を予測し、レビュアーは重要な歴史的パラメータを蓄積し、追加の監視信号を提供するという、統合のための以前の知識を常にレビューし、我々の枠組みを設計する現象を模倣する。
第2に、バックボーンの異なる段階からの出力を利用して、ヒートマップを推定し、ネットワークトレーニングをガイドし、キーポイント関係を効果的に捉えながら、監視情報を充実させるマルチレベル特徴学習戦略を導入する。
最後に、異なるキーポイントを混合することで情報を摂動させ、キーポイントを識別するネットワークの能力を高めるために、キーポイント・ミクスと呼ばれるデータ拡張戦略を設計する。
公開データセットに対する大規模な実験により,本手法は既存手法と比較して大幅な改善が得られた。
関連論文リスト
- Semi-supervised 2D Human Pose Estimation via Adaptive Keypoint Masking [2.297586471170049]
本稿では,サンプル中の情報を完全にマイニングし,より優れた推定性能が得られる適応型キーポイントマスキング法を提案する。
提案手法の有効性をCOCOとMPIIで検証し,最先端の半教師によるポーズ推定をそれぞれ5.2%と0.3%で上回った。
論文 参考訳(メタデータ) (2024-04-23T08:41:50Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object
Detection [55.210991151015534]
本稿では, DPKE という新しい2次元知識豊か化手法を提案する。
我々のDPKEは、データパースペクティブと機能パースペクティブという2つの観点から、限られたトレーニングデータ、特にラベルなしデータの知識を豊かにしています。
論文 参考訳(メタデータ) (2024-01-10T08:56:07Z) - Semi-Supervised 2D Human Pose Estimation Driven by Position
Inconsistency Pseudo Label Correction Module [74.80776648785897]
i) 大規模モデルと軽量モデルの間で対話的なトレーニングを行う場合, 大規模モデルのガイドに擬似的な軽量モデルラベルを用いる。
位置整合性擬似ラベル補正モジュール(SSPCM)により駆動される半教師付き2次元ポーズ推定フレームワークを提案する。
学生モデルの性能向上のために,擬似キーポイント認識に基づく半教師付きカットオクルードを用いて,より硬く効果的なサンプルを生成する。
論文 参考訳(メタデータ) (2023-03-08T02:57:05Z) - 2D Human Pose Estimation: A Survey [16.56050212383859]
人間のポーズ推定は、入力データ中の人間の解剖学的キーポイントまたは身体部分のローカライズを目的としている。
ディープラーニング技術は、データから直接特徴表現を学習することを可能にする。
本稿では,近年の2次元ポーズ推定手法の成果を振り返り,包括的調査を行う。
論文 参考訳(メタデータ) (2022-04-15T08:09:43Z) - A survey of top-down approaches for human pose estimation [0.0]
Deep Learningで実装された最先端の手法は、人間のポーズ推定の分野で顕著な成果をもたらした。
本稿では,人々のポーズを認識するための深層学習手法に基づく2次元画像の広範なレビューを新参者に提供することを目的とする。
論文 参考訳(メタデータ) (2022-02-05T23:27:46Z) - Deep Learning-Based Human Pose Estimation: A Survey [66.01917727294163]
人間のポーズ推定は、過去10年間に注目を集めてきた。
ヒューマン・コンピュータ・インタラクション、モーション・アナリティクス、拡張現実、バーチャル・リアリティーなど幅広い用途で利用されている。
最近のディープラーニングベースのソリューションは、人間のポーズ推定において高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-12-24T18:49:06Z) - Self-supervision on Unlabelled OR Data for Multi-person 2D/3D Human Pose
Estimation [2.8802646903517957]
2D/3D人間のポーズ推定は手術室のための新しいインテリジェントなツールを開発するために必要である。
本稿では,教師/学生のフレームワークにおける知識蒸留を用いて,大規模な非注釈データセットに存在する知識を活用することを提案する。
この効果的なセルフスーパービジョン戦略を用いてトレーニングされた容易にデプロイ可能なネットワークは、公開MVORデータセットの拡張であるemphMVOR+の教師ネットワークと同等に実行される。
論文 参考訳(メタデータ) (2020-07-16T14:28:22Z) - Dual-Teacher: Integrating Intra-domain and Inter-domain Teachers for
Annotation-efficient Cardiac Segmentation [65.81546955181781]
本稿では,新しい半教師付きドメイン適応手法,すなわちDual-Teacherを提案する。
学生モデルは、2つの教師モデルによってラベル付けされていない対象データとラベル付けされた情報源データの知識を学習する。
提案手法では, ラベルなしデータとモダリティ間データとを並列に利用でき, 性能が向上することを示した。
論文 参考訳(メタデータ) (2020-07-13T10:00:44Z) - Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the
Wild [101.70320427145388]
本稿では、3Dアノテーションを必要としない弱教師付きアプローチを提案し、ラベルのないマルチビューデータから3Dポーズを推定する。
提案手法を2つの大規模データセット上で評価する。
論文 参考訳(メタデータ) (2020-03-17T08:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。