論文の概要: Learning Structure-Guided Diffusion Model for 2D Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2306.17074v1
- Date: Thu, 29 Jun 2023 16:24:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-30 12:41:06.277726
- Title: Learning Structure-Guided Diffusion Model for 2D Human Pose Estimation
- Title(参考訳): 2次元人文推定のための構造誘導拡散モデル
- Authors: Zhongwei Qiu, Qiansheng Yang, Jian Wang, Xiyu Wang, Chang Xu, Dongmei
Fu, Kun Yao, Junyu Han, Errui Ding, Jingdong Wang
- Abstract要約: ニューラルネットワークを用いてキーポイントのヒートマップを学習するための新しいスキームである textbfDiffusionPose を提案する。
トレーニング中、キーポイントはノイズを加えることでランダム分布に拡散され、拡散モデルはノイズ付きヒートマップから地中構造熱マップを復元する。
実験では、広く使用されているCOCO、CrowdPose、AI Challengeデータセット上で1.6、1.2、1.2mAPの改善による、私たちのスキームの長所が示されている。
- 参考スコア(独自算出の注目度): 71.24808323646167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the mainstream schemes for 2D human pose estimation (HPE) is learning
keypoints heatmaps by a neural network. Existing methods typically improve the
quality of heatmaps by customized architectures, such as high-resolution
representation and vision Transformers. In this paper, we propose
\textbf{DiffusionPose}, a new scheme that formulates 2D HPE as a keypoints
heatmaps generation problem from noised heatmaps. During training, the
keypoints are diffused to random distribution by adding noises and the
diffusion model learns to recover ground-truth heatmaps from noised heatmaps
with respect to conditions constructed by image feature. During inference, the
diffusion model generates heatmaps from initialized heatmaps in a progressive
denoising way. Moreover, we further explore improving the performance of
DiffusionPose with conditions from human structural information. Extensive
experiments show the prowess of our DiffusionPose, with improvements of 1.6,
1.2, and 1.2 mAP on widely-used COCO, CrowdPose, and AI Challenge datasets,
respectively.
- Abstract(参考訳): 2次元人間のポーズ推定(HPE)の主要なスキームの1つは、ニューラルネットワークによるキーポイントのヒートマップの学習である。
既存の手法は通常、高分解能表現や視覚トランスフォーマーのようなカスタマイズされたアーキテクチャによってヒートマップの品質を向上させる。
本稿では、2次元 HPE をキーポイントとして定式化する新しい手法である \textbf{DiffusionPose} を提案する。
トレーニング中、キーポイントは雑音を加えることによってランダム分布に拡散され、拡散モデルは、画像特徴によって構築された条件に関して、ノイズ付きヒートマップから地中構造熱マップを復元する。
推定中、拡散モデルは初期化ヒートマップから漸進的発振方法でヒートマップを生成する。
さらに, 人体構造情報から, 拡散スポットの性能向上について検討する。
大規模な実験では、広く使用されているCOCO、CrowdPose、AI Challengeデータセットで1.6、1.2、1.2mAPが改善されたDiffusionPoseの長所が示されています。
関連論文リスト
- Salt & Pepper Heatmaps: Diffusion-informed Landmark Detection Strategy [6.276791657895805]
解剖学的ランドマーク検出(Anatomical Landmark Detection)は、臨床測定のための画像の重要な領域を特定するプロセスである。
機械学習モデルは、ヒートマップで表される確率領域としてランドマークの軌跡を予測する。
我々は,自動解剖学的ランドマーク検出を高精度な生成モデルタスクとして再構成し,数ドットのヒートマップを生成する。
論文 参考訳(メタデータ) (2024-07-12T11:50:39Z) - DiffPose: SpatioTemporal Diffusion Model for Video-Based Human Pose
Estimation [16.32910684198013]
本稿では、条件付きヒートマップ生成問題として、ビデオに基づく人間のポーズ推定を定式化する新しい拡散アーキテクチャDiffPoseを提案する。
ポーズ推定タスクにおけるDiffPoseの特徴として,(i)複数のポーズ推定を組み合わせて予測精度を向上させる能力,(ii)モデルを再訓練することなく特徴改善のための反復的なステップ数を調整する能力,の2点を挙げる。
論文 参考訳(メタデータ) (2023-07-31T14:00:23Z) - DistilPose: Tokenized Pose Regression with Heatmap Distillation [81.21273854769765]
本研究では,熱マップに基づく手法と回帰に基づく手法のギャップを埋める,DistilPoseと呼ばれる新しいポーズ推定フレームワークを提案する。
DistilPoseは、教師モデル(ヒートマップベース)から生徒モデル(レグレッションベース)への知識伝達を、Token-distilling (TDE) と Simulated Heatmaps を通じて最大化する。
論文 参考訳(メタデータ) (2023-03-04T16:56:29Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Bottom-Up Human Pose Estimation by Ranking Heatmap-Guided Adaptive
Keypoint Estimates [76.51095823248104]
キーポイント検出とグループ化(キーポイント回帰)性能を改善するために,これまでにほとんど,あるいはまったく研究されていないいくつかのスキームを提案する。
まず,画素単位のキーポイントレグレッションに対して,キーポイントのリグレッションを改善するために分離する代わりに,キーポイントのヒートマップを利用する。
第2に、スケールと向きの分散を扱うための適応表現を学習するために、画素単位の空間変換器ネットワークを採用する。
第3に,真のポーズとなる確率の高い推定ポーズを促進するために,結合形状と熱値評価手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T01:14:59Z) - A Transfer Learning approach to Heatmap Regression for Action Unit
intensity estimation [50.261472059743845]
アクション・ユニット(英: Action Units、AUs)は、幾何学に基づく原子性顔面筋運動である。
本稿では,その位置と強度を共同で推定する新しいAUモデリング問題を提案する。
ヒートマップは、所定の空間的位置でAUが発生するか否かをモデル化する。
論文 参考訳(メタデータ) (2020-04-14T16:51:13Z) - Attentive One-Dimensional Heatmap Regression for Facial Landmark
Detection and Tracking [73.35078496883125]
顔のランドマークの局所化のための新しい1次元熱マップ回帰法を提案する。
まず、x座標とy座標の辺分布を表すために、1次元熱マップの2つの群を予測する。
第2に、x と y 座標に存在する固有の空間パターンをモデル化するコアテンション機構が採用されている。
第3に、1次元熱マップ構造に基づいて、画像上のランドマーク検出のための空間パターンを検出する顔ランドマーク検出器を提案する。
論文 参考訳(メタデータ) (2020-04-05T06:51:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。