論文の概要: MirrorNet: A Deep Bayesian Approach to Reflective 2D Pose Estimation
from Human Images
- arxiv url: http://arxiv.org/abs/2004.03811v1
- Date: Wed, 8 Apr 2020 05:02:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 09:03:42.382024
- Title: MirrorNet: A Deep Bayesian Approach to Reflective 2D Pose Estimation
from Human Images
- Title(参考訳): MirrorNet:人間の画像から2次元空間を反射的に推定するディープベイズ的アプローチ
- Authors: Takayuki Nakatsuka, Kazuyoshi Yoshii, Yuki Koyama, Satoru Fukayama,
Masataka Goto, and Shigeo Morishima
- Abstract要約: 標準的な教師ありアプローチの大きな問題は、しばしば解剖学的に不可解なポーズをもたらすことである。
ポーズアノテーションを使わずに画像を効果的に活用できる半教師付き手法を提案する。
実験の結果,提案した反射型アーキテクチャが解剖学的に妥当なポーズを推定できることが示唆された。
- 参考スコア(独自算出の注目度): 42.27703025887059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a statistical approach to 2D pose estimation from human
images. The main problems with the standard supervised approach, which is based
on a deep recognition (image-to-pose) model, are that it often yields
anatomically implausible poses, and its performance is limited by the amount of
paired data. To solve these problems, we propose a semi-supervised method that
can make effective use of images with and without pose annotations.
Specifically, we formulate a hierarchical generative model of poses and images
by integrating a deep generative model of poses from pose features with that of
images from poses and image features. We then introduce a deep recognition
model that infers poses from images. Given images as observed data, these
models can be trained jointly in a hierarchical variational autoencoding
(image-to-pose-to-feature-to-pose-to-image) manner. The results of experiments
show that the proposed reflective architecture makes estimated poses
anatomically plausible, and the performance of pose estimation improved by
integrating the recognition and generative models and also by feeding
non-annotated images.
- Abstract(参考訳): 本稿では,人間の画像から2次元ポーズ推定を行う統計的手法を提案する。
深層認識(画像から目的)モデルに基づく標準的な教師付きアプローチの主な問題は、しばしば解剖学的に不可解なポーズを生じさせ、そのパフォーマンスがペアデータの量によって制限されることである。
これらの問題を解決するために,アノテーションを付加せずに画像の有効利用が可能な半教師付き手法を提案する。
具体的には,ポーズ特徴の深層生成モデルとポーズと画像特徴のイメージとの融合により,ポーズと画像の階層的生成モデルを作成する。
次に,画像からポーズを推定する深い認識モデルを提案する。
観察されたデータとして画像が与えられた場合、これらのモデルは階層的変動オートエンコーディング(像から像への像)の方法で共同で訓練することができる。
実験の結果,提案する反射型アーキテクチャによって推定されたポーズは解剖学的に推定可能となり,認識モデルと生成モデルの統合によりポーズ推定の性能が向上した。
関連論文リスト
- Towards Robust and Expressive Whole-body Human Pose and Shape Estimation [51.457517178632756]
全体のポーズと形状の推定は、単眼画像から人体全体の異なる振る舞いを共同で予測することを目的としている。
既存の手法では、既存のシナリオの複雑さの下で、しばしば劣化したパフォーマンスを示す。
全身のポーズと形状推定の堅牢性を高める新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-12-14T08:17:42Z) - Understanding Pose and Appearance Disentanglement in 3D Human Pose
Estimation [72.50214227616728]
ポーズ情報から外見情報を引き離すために,自己教師型で画像表現を学習する手法がいくつか提案されている。
我々は,多種多様な画像合成実験を通じて,自己教師ネットワークの観点から,ゆがみについて検討する。
我々は,対象の自然な外見変化を生起することに焦点を当てた敵対的戦略を設計し,その反対に,絡み合ったネットワークが堅牢であることを期待している。
論文 参考訳(メタデータ) (2023-09-20T22:22:21Z) - DiffPose: SpatioTemporal Diffusion Model for Video-Based Human Pose
Estimation [16.32910684198013]
本稿では、条件付きヒートマップ生成問題として、ビデオに基づく人間のポーズ推定を定式化する新しい拡散アーキテクチャDiffPoseを提案する。
ポーズ推定タスクにおけるDiffPoseの特徴として,(i)複数のポーズ推定を組み合わせて予測精度を向上させる能力,(ii)モデルを再訓練することなく特徴改善のための反復的なステップ数を調整する能力,の2点を挙げる。
論文 参考訳(メタデータ) (2023-07-31T14:00:23Z) - ID-Pose: Sparse-view Camera Pose Estimation by Inverting Diffusion
Models [43.86792681109704]
本稿では,2つの入力画像が与えられた相対的なポーズを推定するために,デノナイズ拡散過程を逆転するID-Poseを提案する。
我々は2つ以上の画像を扱うためにID-Poseを拡張し、三角関係から複数の画像対で各ポーズを推定する。
その結果,ID-Poseは最先端手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2023-06-29T17:41:41Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - Deep Dual Consecutive Network for Human Pose Estimation [44.41818683253614]
キーポイント検出を容易にするために,ビデオフレーム間の時間的キューを豊富に活用した,新しいマルチフレーム人間ポーズ推定フレームワークを提案する。
本手法は、PoseTrack 2017およびPoseTrack 2018の大規模ベンチマークデータセットにおけるマルチフレームパーソンポースチャレンジチャレンジで1位にランクインします。
論文 参考訳(メタデータ) (2021-03-12T13:11:27Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z) - Introducing Pose Consistency and Warp-Alignment for Self-Supervised 6D
Object Pose Estimation in Color Images [38.9238085806793]
オブジェクトの6Dポーズを推定する最も成功したアプローチは、現実世界の画像で注釈付きのポーズで学習を監督することによって、ニューラルネットワークを訓練する。
既存のニューラルネットワークベースのアプローチの上に適用可能な2段階の6Dオブジェクトポーズ推定フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-27T11:53:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。