論文の概要: Occlusion-Invariant Rotation-Equivariant Semi-Supervised Depth Based
Cross-View Gait Pose Estimation
- arxiv url: http://arxiv.org/abs/2109.01397v1
- Date: Fri, 3 Sep 2021 09:39:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-06 13:57:28.793528
- Title: Occlusion-Invariant Rotation-Equivariant Semi-Supervised Depth Based
Cross-View Gait Pose Estimation
- Title(参考訳): Occlusion-Invariant Rotation-Equivariant Semi-Supervised Depth Based Cross-View Gait Pose Estimation
- Authors: Xiao Gu, Jianxin Yang, Hanxiao Zhang, Jianing Qiu, Frank Po Wen Lo,
Yao Guo, Guang-Zhong Yang, Benny Lo
- Abstract要約: 閉塞不変な半教師あり学習フレームワークを用いたクロスビュー一般化のための新しい手法を提案する。
本モデルは,1つの視点からの実世界データと,複数の視点からの非競合合成データを用いて訓練した。
他の目に見えないすべてのビューから、現実世界のデータをうまく一般化することができる。
- 参考スコア(独自算出の注目度): 40.50555832966361
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate estimation of three-dimensional human skeletons from depth images
can provide important metrics for healthcare applications, especially for
biomechanical gait analysis. However, there exist inherent problems associated
with depth images captured from a single view. The collected data is greatly
affected by occlusions where only partial surface data can be recorded.
Furthermore, depth images of human body exhibit heterogeneous characteristics
with viewpoint changes, and the estimated poses under local coordinate systems
are expected to go through equivariant rotations. Most existing pose estimation
models are sensitive to both issues. To address this, we propose a novel
approach for cross-view generalization with an occlusion-invariant
semi-supervised learning framework built upon a novel rotation-equivariant
backbone. Our model was trained with real-world data from a single view and
unlabelled synthetic data from multiple views. It can generalize well on the
real-world data from all the other unseen views. Our approach has shown
superior performance on gait analysis on our ICL-Gait dataset compared to other
state-of-the-arts and it can produce more convincing keypoints on ITOP dataset,
than its provided "ground truth".
- Abstract(参考訳): 深度画像からの3次元人体骨格の正確な推定は、医療、特に生体力学的歩行分析に重要な指標となる。
しかし、一つの視点から撮影した奥行き画像に固有の問題がある。
収集されたデータは、部分的な表面データしか記録できない閉塞によって大きく影響を受ける。
さらに、人体の深度画像は視点変化に伴う異種特性を示し、局所座標系における推定ポーズは等変回転を経ると予想される。
既存のポーズ推定モデルはどちらの問題にも敏感である。
そこで本研究では,新しい回転同変バックボーン上に構築されたオクルージョン不変な半教師あり学習フレームワークを用いたクロスビュー一般化手法を提案する。
本モデルでは,1つの視点からの実世界データと,複数の視点から合成データを学習した。
他のすべての目に見えないビューからの実世界のデータをうまく一般化できます。
我々のアプローチでは、ICL-Gaitデータセットの歩行分析において、他の最先端技術と比較して優れたパフォーマンスを示しており、提供された"地上真実"よりも、ITOPデータセット上でより説得力のあるキーポイントを生成することができる。
関連論文リスト
- GenDepth: Generalizing Monocular Depth Estimation for Arbitrary Camera
Parameters via Ground Plane Embedding [8.289857214449372]
GenDepthは任意の車載カメラの設定に対してメートル法深度推定を行うことができる新しいモデルである。
地平面深度としてのカメラパラメータの新たな埋め込みを提案し,これらの埋め込みを対角領域アライメントと統合するアーキテクチャを提案する。
我々はGenDepthをいくつかの自律走行データセットで検証し、異なる車載カメラシステムに対する最先端の一般化能力を実証した。
論文 参考訳(メタデータ) (2023-12-10T22:28:34Z) - Weakly-supervised 3D Pose Transfer with Keypoints [57.66991032263699]
3Dポーズ転送の主な課題は、1) 異なる文字で同じポーズを行うペアトレーニングデータの欠如、2) ターゲットメッシュからポーズと形状情報を分離すること、3) 異なるトポロジを持つメッシュに適用することの難しさである。
本稿では,これらの課題を克服するためのキーポイントベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T12:40:24Z) - Improving 2D Human Pose Estimation in Rare Camera Views with Synthetic Data [24.63316659365843]
本稿では、ポーズとビューを包括的に制御した合成ヒトを生成するためのSMPLベースの手法であるRePoGenを紹介する。
トップビューデータセットの実験と、さまざまなポーズを持つ実画像の新しいデータセットにより、COCOデータセットにRePoGenデータを追加することは、以前のアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2023-07-13T13:17:50Z) - EllSeg-Gen, towards Domain Generalization for head-mounted eyetracking [19.913297057204357]
このようなアーティファクトの存在にもかかわらず、畳み込みネットワークは視線特徴の抽出に優れていることを示す。
複数のデータセットでトレーニングされた単一モデルのパフォーマンスを、個々のデータセットでトレーニングされたモデルのプールと比較する。
その結果, 眼球画像を用いたモデルでは, マルチセットトレーニングにより, 外観の多様性が向上することが示唆された。
論文 参考訳(メタデータ) (2022-05-04T08:35:52Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Unsupervised View-Invariant Human Posture Representation [28.840986167408037]
本研究では、2次元画像からビュー不変な3次元ポーズ表現を抽出することを学ぶ新しい教師なしアプローチを提案する。
本モデルは,同時フレーム間の人間のポーズの内在的なビュー不変性を活用することで訓練される。
RGB画像と深度画像の非教師なしのクロスビュー動作分類精度の改善を示す。
論文 参考訳(メタデータ) (2021-09-17T19:23:31Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - AdaFuse: Adaptive Multiview Fusion for Accurate Human Pose Estimation in
the Wild [77.43884383743872]
本稿では,アダプティブなマルチビュー融合手法であるAdaFuseについて述べる。
我々は、Human3.6M、Total Capture、CMU Panopticの3つの公開データセットに対するアプローチを広く評価した。
また,大規模合成データセットOcclusion-Personを作成し,咬合関節の数値評価を行う。
論文 参考訳(メタデータ) (2020-10-26T03:19:46Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。