論文の概要: Latent Embedding Clustering for Occlusion Robust Head Pose Estimation
- arxiv url: http://arxiv.org/abs/2403.20251v1
- Date: Fri, 29 Mar 2024 15:57:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-01 15:14:57.432872
- Title: Latent Embedding Clustering for Occlusion Robust Head Pose Estimation
- Title(参考訳): Occlusion Robust Head Pose 推定のための潜伏埋め込みクラスタリング
- Authors: José Celestino, Manuel Marques, Jacinto C. Nascimento,
- Abstract要約: 頭部ポーズ推定は、幅広い応用において有用であることから、コンピュータビジョンにおいて重要な研究領域となっている。
この分野で最も難しい課題の1つは、現実世界のシナリオで頻繁に発生するヘッドオクルージョンの管理である。
我々は,現実の頭部閉塞のシナリオにおいて堅牢な,新規で効率的なフレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.620379605206596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Head pose estimation has become a crucial area of research in computer vision given its usefulness in a wide range of applications, including robotics, surveillance, or driver attention monitoring. One of the most difficult challenges in this field is managing head occlusions that frequently take place in real-world scenarios. In this paper, we propose a novel and efficient framework that is robust in real world head occlusion scenarios. In particular, we propose an unsupervised latent embedding clustering with regression and classification components for each pose angle. The model optimizes latent feature representations for occluded and non-occluded images through a clustering term while improving fine-grained angle predictions. Experimental evaluation on in-the-wild head pose benchmark datasets reveal competitive performance in comparison to state-of-the-art methodologies with the advantage of having a significant data reduction. We observe a substantial improvement in occluded head pose estimation. Also, an ablation study is conducted to ascertain the impact of the clustering term within our proposed framework.
- Abstract(参考訳): 頭部ポーズ推定は、ロボット工学、監視、運転注意監視など幅広い用途で有用であることを考えると、コンピュータビジョンにおいて重要な研究領域となっている。
この分野で最も難しい課題の1つは、現実世界のシナリオで頻繁に発生するヘッドオクルージョンの管理である。
本稿では,現実の頭部閉塞のシナリオにおいて頑健な,新規で効率的な枠組みを提案する。
特に,各ポーズ角に対して回帰成分と分類成分を有する非教師なし潜在埋め込みクラスタリングを提案する。
このモデルは、クラスタリング項を通して、隠蔽画像と非隠蔽画像の潜在特徴表現を最適化し、きめ細かい角度予測を改善した。
In-theld Head poseベンチマークデータセットの実験的評価により、最先端の手法と比較して競争性能が向上し、データ量の大幅な削減が期待できる。
我々は,隠蔽頭部ポーズ推定の大幅な改善を観察した。
また,提案フレームワークにおけるクラスタリング項の影響を確認するため,アブレーション実験を行った。
関連論文リスト
- Neighbor-Aware Calibration of Segmentation Networks with Penalty-Based
Constraints [19.897181782914437]
本稿では,ロジット値の等式制約に基づく基本的かつ単純な解を提案し,強制制約と罰則の重みを明示的に制御する。
我々のアプローチは、広範囲のディープセグメンテーションネットワークのトレーニングに利用できる。
論文 参考訳(メタデータ) (2024-01-25T19:46:57Z) - 2D Image head pose estimation via latent space regression under
occlusion settings [7.620379605206596]
この戦略は、隠蔽されたシナリオの問題をよりよく構造化するための基本的な鍵として、潜在空間回帰に基づいている。
提案手法の有用性として, (i) BIWIとAFLW2000データセットの2つの包括バージョン, (ii) Pandoraデータセットのリアルタイムオクルージョン, (iii) 人間とロボットの相互作用シナリオに対する実生活応用について述べる。
論文 参考訳(メタデータ) (2023-11-10T12:53:02Z) - Group-Conditional Conformal Prediction via Quantile Regression
Calibration for Crop and Weed Classification [0.0]
本稿では,ブラックボックス予測装置の予測性能について,統計的に妥当な保証を提供する共形予測フレームワークを提案する。
このフレームワークは、実践的な側面と、Adaptive Prediction Sets (APS) アプローチに沿った特別な注意を払って公開されている。
この欠点に対処するため、群-条件共形アプローチが提示される。
論文 参考訳(メタデータ) (2023-08-29T08:02:41Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - The Probabilistic Normal Epipolar Constraint for Frame-To-Frame Rotation
Optimization under Uncertain Feature Positions [53.478856119297284]
特徴位置における異方性および不均一性を考慮した確率論的正規極性制約(PNEC)を導入する。
合成データの実験において、新しいPNECは元のNECよりも正確な回転推定値が得られることを示した。
我々は,提案手法を最先端のモノクロ回転専用オドメトリーシステムに統合し,実世界のKITTIデータセットに対して一貫した改良を行った。
論文 参考訳(メタデータ) (2022-04-05T14:47:11Z) - Welsch Based Multiview Disparity Estimation [0.8594140167290096]
多数のビューを持つアプリケーションにおいて,オクルージョンを不均一性推定の鍵となる課題として実験的に同定する。
本稿では,分散度推定のためのグローバル変動フレームワークにおいて,データ項に対するウェルシュ損失関数の利用を提案する。
論文 参考訳(メタデータ) (2021-10-02T13:44:49Z) - Unsupervised Learning of Debiased Representations with Pseudo-Attributes [85.5691102676175]
教師なし方式で,単純かつ効果的な脱バイアス手法を提案する。
特徴埋め込み空間上でクラスタリングを行い、クラスタリング結果を利用して疑似属性を識別する。
次に,非偏り表現を学習するために,クラスタベースの新しい重み付け手法を用いる。
論文 参考訳(メタデータ) (2021-08-06T05:20:46Z) - Adversarial Motion Modelling helps Semi-supervised Hand Pose Estimation [116.07661813869196]
そこで本稿では,非ラベルビデオに対人トレーニングとモーションモデリングのアイデアを組み合わせることを提案する。
本研究は,非ラベル映像系列の半教師あり学習により,逆方向が手ポーズ推定器の特性の向上につながることを示す。
このアプローチの主な利点は、ペアのトレーニングデータよりもはるかに容易に、未ペアのビデオとジョイントシーケンスデータを利用することができることです。
論文 参考訳(メタデータ) (2021-06-10T17:50:19Z) - Learning to Detect Head Movement in Unconstrained Remote Gaze Estimation
in the Wild [19.829721663742124]
本稿では,視線推定に異なるレベルの頭部表現をより堅牢に組み込むことができるエンドツーエンドの視線推定手法を提案する。
提案手法は,画像品質の低い実世界のシナリオ,照明の異なるシナリオ,直接目的情報を利用できないシナリオに一般化することができる。
論文 参考訳(メタデータ) (2020-04-07T22:38:49Z) - Peeking into occluded joints: A novel framework for crowd pose
estimation [88.56203133287865]
OPEC-NetはイメージガイドされたプログレッシブGCNモジュールで、推論の観点から見えない関節を推定する。
OCPoseは、隣接するインスタンス間の平均IoUに対して、最も複雑なOccluded Poseデータセットである。
論文 参考訳(メタデータ) (2020-03-23T19:32:40Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。