論文の概要: 2D Image head pose estimation via latent space regression under
occlusion settings
- arxiv url: http://arxiv.org/abs/2311.06038v1
- Date: Fri, 10 Nov 2023 12:53:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-13 15:02:49.797406
- Title: 2D Image head pose estimation via latent space regression under
occlusion settings
- Title(参考訳): 閉塞条件下での潜時空間回帰による2次元画像頭部ポーズ推定
- Authors: Jos\'e Celestino, Manuel Marques, Jacinto C. Nascimento and Jo\~ao
Paulo Costeira
- Abstract要約: この戦略は、隠蔽されたシナリオの問題をよりよく構造化するための基本的な鍵として、潜在空間回帰に基づいている。
提案手法の有用性として, (i) BIWIとAFLW2000データセットの2つの包括バージョン, (ii) Pandoraデータセットのリアルタイムオクルージョン, (iii) 人間とロボットの相互作用シナリオに対する実生活応用について述べる。
- 参考スコア(独自算出の注目度): 7.620379605206596
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Head orientation is a challenging Computer Vision problem that has been
extensively researched having a wide variety of applications. However, current
state-of-the-art systems still underperform in the presence of occlusions and
are unreliable for many task applications in such scenarios. This work proposes
a novel deep learning approach for the problem of head pose estimation under
occlusions. The strategy is based on latent space regression as a fundamental
key to better structure the problem for occluded scenarios. Our model surpasses
several state-of-the-art methodologies for occluded HPE, and achieves similar
accuracy for non-occluded scenarios. We demonstrate the usefulness of the
proposed approach with: (i) two synthetically occluded versions of the BIWI and
AFLW2000 datasets, (ii) real-life occlusions of the Pandora dataset, and (iii)
a real-life application to human-robot interaction scenarios where face
occlusions often occur. Specifically, the autonomous feeding from a robotic
arm.
- Abstract(参考訳): ヘッドオリエンテーションはコンピュータビジョンの問題であり、様々な用途で広く研究されている。
しかし、現在の最先端システムは、隠蔽の存在下ではまだ性能が低く、そのようなシナリオにおける多くのタスクアプリケーションには信頼できない。
本研究は,隠蔽下での頭部ポーズ推定問題に対する新しい深層学習手法を提案する。
この戦略は、隠されたシナリオの問題をよりよく構造化するための基本的な鍵として、潜在空間回帰に基づいている。
本モデルはオクルードhpeの最先端手法を数種類超え,非オクルードシナリオでも同様の精度を実現する。
提案手法の有用性を示す。
(i)BIWIとAFLW2000データセットの2つの合成外用バージョン
(ii)pandoraデータセットの実生活閉塞、及び
三 顔の閉塞がしばしば発生する人間とロボットの相互作用シナリオに対する現実的な応用。
具体的には、ロボットアームからの自律給餌です。
関連論文リスト
- C$^{2}$INet: Realizing Incremental Trajectory Prediction with Prior-Aware Continual Causal Intervention [10.189508227447401]
複雑なシナリオにおけるマルチエージェントの軌道予測は、自律運転のようなアプリケーションには不可欠である。
既存の手法は、しばしば環境バイアスを見落とし、一般化の低さにつながる。
一般化可能なマルチエージェント軌道予測のための連続因果干渉法(C$2$INet)を提案する。
論文 参考訳(メタデータ) (2024-11-19T08:01:20Z) - Towards Cross-View-Consistent Self-Supervised Surround Depth Estimation [9.569646683579899]
連続画像からの自己監督下周深度推定は経済的な代替手段を提供する。
従来のSSSDE法では、画像間で情報を融合する異なるメカニズムが提案されているが、それらのいくつかは、クロスビュー制約を明示的に考慮している。
本稿では,SSSDEのクロスビュー一貫性を高めるために,効率的で一貫したポーズ推定設計と2つの損失関数を提案する。
論文 参考訳(メタデータ) (2024-07-04T16:29:05Z) - Viewpoint Generation using Feature-Based Constrained Spaces for Robot
Vision Systems [63.942632088208505]
この出版物は幾何学的問題としての視点の生成を概説し、それを解決するための一般化された理論的枠組みを紹介している。
$mathcalC$-space は、視点制約が分散する位相空間として理解することができる。
紹介された$mathcalC$-spacesは、汎用ドメインと視点制約モデルに基づいて、現在のフレームワークを異なるアプリケーションやロボットビジョンシステムに転送しやすくする。
論文 参考訳(メタデータ) (2023-06-12T08:57:15Z) - A Survey on Deep Learning-Based Monocular Spacecraft Pose Estimation:
Current State, Limitations and Prospects [7.08026800833095]
非協力宇宙船の姿勢を推定することは、軌道上の視覚ベースのシステムを実現するための重要なコンピュータビジョン問題である。
コンピュータビジョンの一般的な傾向に続き、この問題を解決するためにディープラーニング(DL)手法を活用する研究がますます増えている。
有望な研究段階の結果にもかかわらず、実際のミッションでこのような方法が使われるのを防ぐ大きな課題が今も残っている。
論文 参考訳(メタデータ) (2023-05-12T09:52:53Z) - Progressive Multi-view Human Mesh Recovery with Self-Supervision [68.60019434498703]
既存のソリューションは通常、新しい設定への一般化性能の低下に悩まされる。
マルチビューヒューマンメッシュリカバリのためのシミュレーションに基づく新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-12-10T06:28:29Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Occlusion-Robust Object Pose Estimation with Holistic Representation [42.27081423489484]
State-of-the-art(SOTA)オブジェクトのポーズ推定器は2段階のアプローチを取る。
我々は,新しいブロック・アンド・ブラックアウトバッチ拡張技術を開発した。
また,総合的なポーズ表現学習を促進するためのマルチ精度監視アーキテクチャも開発している。
論文 参考訳(メタデータ) (2021-10-22T08:00:26Z) - Deep Bingham Networks: Dealing with Uncertainty and Ambiguity in Pose
Estimation [74.76155168705975]
Deep Bingham Networks (DBN)は、3Dデータに関するほぼすべての実生活アプリケーションで発生するポーズ関連の不確実性と曖昧性を扱うことができる。
DBNは、(i)異なる分布モードを生成できる多仮説予測ヘッドにより、アートダイレクトポーズ回帰ネットワークの状態を拡張する。
トレーニング中のモードや後方崩壊を回避し,数値安定性を向上させるための新しいトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-12-20T19:20:26Z) - Multi-person 3D Pose Estimation in Crowded Scenes Based on Multi-View
Geometry [62.29762409558553]
マルチパーソナライズされた3次元ポーズ推定手法における特徴マッチングと深さ推定のコアは、エピポーラ制約である。
スパサーの群衆シーンにおけるこの定式化の良好なパフォーマンスにもかかわらず、その効果はより密集した群衆の状況下でしばしば挑戦される。
本稿では,マルチパーソン3次元ポーズ推定式から脱却し,群衆ポーズ推定として再編成する。
論文 参考訳(メタデータ) (2020-07-21T17:59:36Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。