論文の概要: ADG-Pose: Automated Dataset Generation for Real-World Human Pose
Estimation
- arxiv url: http://arxiv.org/abs/2202.00753v1
- Date: Tue, 1 Feb 2022 20:51:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-03 14:20:49.554752
- Title: ADG-Pose: Automated Dataset Generation for Real-World Human Pose
Estimation
- Title(参考訳): ADG-Pose:実世界の人文推定のための自動データセット生成
- Authors: Ghazal Alinezhad Noghre, Armin Danesh Pazho, Justin Sanchez, Nathan
Hewitt, Christopher Neff, Hamed Tabkhi
- Abstract要約: ADG-Poseは、現実世界の人間のポーズ推定のためのデータセットを自動的に生成する手法である。
本稿では,実世界の人間のポーズ推定のためのデータセットを自動生成するADG-Poseについて述べる。
- 参考スコア(独自算出の注目度): 2.4956060473718407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in computer vision have seen a rise in the prominence of
applications using neural networks to understand human poses. However, while
accuracy has been steadily increasing on State-of-the-Art datasets, these
datasets often do not address the challenges seen in real-world applications.
These challenges are dealing with people distant from the camera, people in
crowds, and heavily occluded people. As a result, many real-world applications
have trained on data that does not reflect the data present in deployment,
leading to significant underperformance. This article presents ADG-Pose, a
method for automatically generating datasets for real-world human pose
estimation. These datasets can be customized to determine person distances,
crowdedness, and occlusion distributions. Models trained with our method are
able to perform in the presence of these challenges where those trained on
other datasets fail. Using ADG-Pose, end-to-end accuracy for real-world
skeleton-based action recognition sees a 20% increase on scenes with moderate
distance and occlusion levels, and a 4X increase on distant scenes where other
models failed to perform better than random.
- Abstract(参考訳): コンピュータビジョンの最近の進歩は、人間のポーズを理解するためにニューラルネットワークを用いた応用が普及している。
しかし、Stand-of-the-Artデータセットでは精度が着実に向上しているが、これらのデータセットは現実世界のアプリケーションで見られる課題に対処しないことが多い。
これらの課題は、カメラから遠く離れた人々、群衆の中の人々、そして密集した人々を扱うことです。
その結果、実世界のアプリケーションの多くは、デプロイ中のデータを反映しないデータに基づいてトレーニングを行い、パフォーマンスが大幅に低下した。
本稿では,実世界の人間のポーズ推定のためのデータセットを自動生成するADG-Poseを提案する。
これらのデータセットは、人の距離、混雑度、閉塞分布を決定するためにカスタマイズできる。
我々の方法でトレーニングされたモデルは、他のデータセットでトレーニングされたモデルが失敗するこれらの課題の存在下で実行することができる。
ADG-Poseを用いることで、現実の骨格に基づく行動認識におけるエンドツーエンドの精度は、適度な距離と閉塞レベルを持つシーンでは20%向上し、他のモデルがランダムよりもパフォーマンスが良くない遠隔シーンでは4倍向上する。
関連論文リスト
- Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Learning Human Action Recognition Representations Without Real Humans [66.61527869763819]
そこで本研究では,仮想人間を含む合成データを用いて,実世界の映像を活用してモデルを事前学習するベンチマークを提案する。
次に、このデータに基づいて学習した表現を、下流行動認識ベンチマークの様々なセットに転送可能であるかを評価する。
私たちのアプローチは、以前のベースラインを最大5%上回ります。
論文 参考訳(メタデータ) (2023-11-10T18:38:14Z) - Decanus to Legatus: Synthetic training for 2D-3D human pose lifting [26.108023246654646]
10個の手作り3Dポーズ(Decanus)に基づく3Dポーズ分布から無限個の合成人間のポーズ(Legatus)を生成するアルゴリズムを提案する。
この結果から,特定データセットの実際のデータを用いた手法に匹敵する3次元ポーズ推定性能を,ゼロショット設定で実現し,フレームワークの可能性を示した。
論文 参考訳(メタデータ) (2022-10-05T13:10:19Z) - Efficient Realistic Data Generation Framework leveraging Deep
Learning-based Human Digitization [0.0]
提案手法は、実際の背景画像として入力され、さまざまなポーズで人物を投入する。
対応するタスクのベンチマークと評価は、実データに対する補足として、合成データが効果的に使用できることを示している。
論文 参考訳(メタデータ) (2021-06-28T08:07:31Z) - Adapted Human Pose: Monocular 3D Human Pose Estimation with Zero Real 3D
Pose Data [14.719976311208502]
トレーニングとテストデータドメインのギャップは、しばしばモデルのパフォーマンスに悪影響を及ぼします。
本稿では、外見とポーズ空間の両方における適応問題に対処する適応的ヒューマンポーズ(AHuP)アプローチを提案する。
AHuPは、実際のアプリケーションでは、ターゲットドメインからのデータはアクセスできないか、限られた情報しか取得できないという現実的な前提に基づいて構築されている。
論文 参考訳(メタデータ) (2021-05-23T01:20:40Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Deep Learning-Based Human Pose Estimation: A Survey [66.01917727294163]
人間のポーズ推定は、過去10年間に注目を集めてきた。
ヒューマン・コンピュータ・インタラクション、モーション・アナリティクス、拡張現実、バーチャル・リアリティーなど幅広い用途で利用されている。
最近のディープラーニングベースのソリューションは、人間のポーズ推定において高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-12-24T18:49:06Z) - SelfPose: 3D Egocentric Pose Estimation from a Headset Mounted Camera [97.0162841635425]
頭部装着型VR装置の縁に設置した下向きの魚眼カメラから撮影した単眼画像から,エゴセントリックな3Dボディポーズ推定法を提案する。
この特異な視点は、厳密な自己閉塞と視点歪みを伴う、独特の視覚的な外観のイメージに繋がる。
本稿では,2次元予測の不確実性を考慮した新しいマルチブランチデコーダを用いたエンコーダデコーダアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-11-02T16:18:06Z) - Methodology for Building Synthetic Datasets with Virtual Humans [1.5556923898855324]
大規模なデータセットは、ディープニューラルネットワークの改善、ターゲットトレーニングに使用することができる。
特に,100の合成IDからなるデータセットにまたがる複数の2次元画像のレンダリングに3次元形態素顔モデルを用いる。
論文 参考訳(メタデータ) (2020-06-21T10:29:36Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。