論文の概要: Predicting Camera Viewpoint Improves Cross-dataset Generalization for 3D
Human Pose Estimation
- arxiv url: http://arxiv.org/abs/2004.03143v1
- Date: Tue, 7 Apr 2020 06:06:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 00:16:39.328428
- Title: Predicting Camera Viewpoint Improves Cross-dataset Generalization for 3D
Human Pose Estimation
- Title(参考訳): カメラ視点予測による3次元ポーズ推定のクロスデータセット一般化
- Authors: Zhe Wang, Daeyun Shin, Charless C. Fowlkes
- Abstract要約: 特定のデータセットに存在する多様性とバイアスと、それがデータセット間の一般化に与える影響について検討する。
我々は,視点を協調的に予測し,体系的にデータ間の一般化を著しく改善したモデルを見いだした。
- 参考スコア(独自算出の注目度): 32.6329300863371
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular estimation of 3d human pose has attracted increased attention with
the availability of large ground-truth motion capture datasets. However, the
diversity of training data available is limited and it is not clear to what
extent methods generalize outside the specific datasets they are trained on. In
this work we carry out a systematic study of the diversity and biases present
in specific datasets and its effect on cross-dataset generalization across a
compendium of 5 pose datasets. We specifically focus on systematic differences
in the distribution of camera viewpoints relative to a body-centered coordinate
frame. Based on this observation, we propose an auxiliary task of predicting
the camera viewpoint in addition to pose. We find that models trained to
jointly predict viewpoint and pose systematically show significantly improved
cross-dataset generalization.
- Abstract(参考訳): 3次元人間のポーズの単眼的推定は、大規模な地対運動キャプチャデータセットが利用可能になったことで注目を集めている。
しかしながら、利用可能なトレーニングデータの多様性は限定的であり、トレーニング対象の特定のデータセット外での一般的な方法の程度は明確ではない。
本研究では、特定のデータセットに存在する多様性とバイアスの体系的研究を行い、5つのポーズデータセットのコンペディションをまたいだデータセット間の一般化に与える影響について述べる。
具体的には、身体中心の座標フレームに対するカメラ視点の分布の系統的差異に着目する。
この観察に基づいて,ポーズに加えてカメラの視点を予測する補助タスクを提案する。
我々は,視点を協調的に予測し,体系的にデータ間の一般化を著しく改善したモデルを見いだした。
関連論文リスト
- SCENES: Subpixel Correspondence Estimation With Epipolar Supervision [18.648772607057175]
シーンの2つ以上のビューからポイント対応を抽出することは、基本的なコンピュータビジョンの問題である。
既存の局所的特徴マッチングアプローチは、大規模データセットの対応監視によって訓練され、テストセット上での高精度なマッチングを得る。
奥行きマップや点雲などの3次元構造を不要にすることで,この仮定を緩和する。
論文 参考訳(メタデータ) (2024-01-19T18:57:46Z) - Weakly-supervised 3D Pose Transfer with Keypoints [57.66991032263699]
3Dポーズ転送の主な課題は、1) 異なる文字で同じポーズを行うペアトレーニングデータの欠如、2) ターゲットメッシュからポーズと形状情報を分離すること、3) 異なるトポロジを持つメッシュに適用することの難しさである。
本稿では,これらの課題を克服するためのキーポイントベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T12:40:24Z) - Estimating Egocentric 3D Human Pose in the Wild with External Weak
Supervision [72.36132924512299]
本稿では,大規模な自己中心型データセットでトレーニング可能な,新たな自己中心型ポーズ推定手法を提案する。
本研究では,事前学習された外部視点のポーズ推定モデルにより抽出された高品質な特徴を用いて,エゴセントリックな特徴を監督する新しい学習戦略を提案する。
実験により,本手法は,1つの画像から正確な3Dポーズを予測し,定量的,定性的に,最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-01-20T00:45:13Z) - Enhancing Egocentric 3D Pose Estimation with Third Person Views [37.9683439632693]
本研究では,1台のウェアラブルカメラから撮影した映像から計算した人物の3次元身振り推定を強化する新しい手法を提案する。
First2Third-Poseは、最初の視点と第三視点の両方から捉えた人間の活動を描いた2000近いビデオからなる、ペア化された新しい同期データセットである。
実験により,データセットを用いて学習した多視点埋め込み空間は,任意の単視点自我中心ビデオから識別的特徴を抽出するのに有用であることが示された。
論文 参考訳(メタデータ) (2022-01-06T11:42:01Z) - Occlusion-Invariant Rotation-Equivariant Semi-Supervised Depth Based
Cross-View Gait Pose Estimation [40.50555832966361]
閉塞不変な半教師あり学習フレームワークを用いたクロスビュー一般化のための新しい手法を提案する。
本モデルは,1つの視点からの実世界データと,複数の視点からの非競合合成データを用いて訓練した。
他の目に見えないすべてのビューから、現実世界のデータをうまく一般化することができる。
論文 参考訳(メタデータ) (2021-09-03T09:39:05Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Self-Supervised Multi-View Synchronization Learning for 3D Pose
Estimation [39.334995719523]
現在の方法では、画像の大規模なデータセットと対応するスケルトンポーズに基づいてニューラルネットワークをトレーニングすることで、学習問題としてモノラルな3次元ポーズ推定が採用されている。
そこで本稿では,ラベルなしデータセットの自己教師付き学習を通じて事前学習した微調整ネットワークによって,小さな注釈付きデータセットを活用できるアプローチを提案する。
我々は,Human3.6Mデータセット上での同期タスクの有効性を実証し,人間の3次元ポーズ推定における最先端結果を実現する。
論文 参考訳(メタデータ) (2020-10-13T08:01:24Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。