論文の概要: FLAME: Facial Landmark Heatmap Activated Multimodal Gaze Estimation
- arxiv url: http://arxiv.org/abs/2110.04828v1
- Date: Sun, 10 Oct 2021 15:40:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-16 14:25:33.683067
- Title: FLAME: Facial Landmark Heatmap Activated Multimodal Gaze Estimation
- Title(参考訳): FLAME:マルチモーダル・ゲイズ推定による顔のランドマークヒートマップ
- Authors: Neelabh Sinha, Michal Balazia, and Fran\c{c}ois Bremond
- Abstract要約: 本研究では,目印熱マップを用いた眼解剖情報を組み合わせて,人ごとの校正を行なわずに正確な視線推定を行う手法を提案する。
評価の結果,ベンチマークデータセットであるColumbiaGazeとEYEDIAPの競合性能は約10%であった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D gaze estimation is about predicting the line of sight of a person in 3D
space. Person-independent models for the same lack precision due to anatomical
differences of subjects, whereas person-specific calibrated techniques add
strict constraints on scalability. To overcome these issues, we propose a novel
technique, Facial Landmark Heatmap Activated Multimodal Gaze Estimation
(FLAME), as a way of combining eye anatomical information using eye landmark
heatmaps to obtain precise gaze estimation without any person-specific
calibration. Our evaluation demonstrates a competitive performance of about 10%
improvement on benchmark datasets ColumbiaGaze and EYEDIAP. We also conduct an
ablation study to validate our method.
- Abstract(参考訳): 3次元視線推定は、3次元空間内の人の視線を予測することである。
同じ個人非依存モデルでは、被験者の解剖学的差異による精度の欠如があるが、個人固有の校正手法はスケーラビリティに厳しい制約を加える。
これらの課題を克服するために,眼のランドマーク・ヒートマップを用いた眼解剖情報を組み合わせて,人ごとのキャリブレーションを伴わずに正確な視線推定を行う新しい手法であるFacial Landmark Heatmap Activated Multimodal Gaze Estimation (FLAME)を提案する。
評価の結果,ベンチマークデータセットであるColumbiaGazeとEYEDIAPの競合性能は約10%向上した。
また, この方法を検証するため, アブレーション試験を行った。
関連論文リスト
- RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - Precise Facial Landmark Detection by Reference Heatmap Transformer [52.417964103227696]
より正確に顔のランドマークを検出するための参照ヒートマップ変換器(RHT)を提案する。
評価実験の結果,提案手法は文献における最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-03-14T12:26:48Z) - NeRF-Gaze: A Head-Eye Redirection Parametric Model for Gaze Estimation [37.977032771941715]
本稿では,ニューラルラジアンス場に基づく新しい頭部方向パラメトリックモデルを提案する。
我々のモデルは、顔と目を切り離して、別々のニューラルレンダリングを行うことができる。
顔、アイデンティティ、照明、視線方向の属性を別々に制御する目的を達成することができる。
論文 参考訳(メタデータ) (2022-12-30T13:52:28Z) - 3DGazeNet: Generalizing Gaze Estimation with Weak-Supervision from
Synthetic Views [67.00931529296788]
本稿では,適応を伴わない新しい環境に直接適用可能な一般的な視線推定モデルを訓練することを提案する。
視覚的擬似アノテーションを用いた多彩な顔の大規模データセットを作成し、シーンの3次元形状に基づいて抽出する。
本研究では,本手法を視線一般化タスクにおいて検証し,真理データが得られない場合の最先端技術と比較して最大30%の改善を実証する。
論文 参考訳(メタデータ) (2022-12-06T14:15:17Z) - Active Gaze Control for Foveal Scene Exploration [124.11737060344052]
本研究では,葉型カメラを用いた人間とロボットが現場を探索する方法をエミュレートする手法を提案する。
提案手法は,同数の視線シフトに対してF1スコアを2~3ポイント増加させる。
論文 参考訳(メタデータ) (2022-08-24T14:59:28Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - 360-Degree Gaze Estimation in the Wild Using Multiple Zoom Scales [26.36068336169795]
焦点を絞った表情から視線を推定する能力を模倣するモデルを開発した。
このモデルは、クリアアイパッチを抽出する必要がない。
モデルを拡張して、360度視線推定の課題に対処する。
論文 参考訳(メタデータ) (2020-09-15T08:45:12Z) - It's Written All Over Your Face: Full-Face Appearance-Based Gaze
Estimation [82.16380486281108]
顔の全体像のみを入力とする外観に基づく手法を提案する。
本手法は,特徴写像に空間重みを印加した畳み込みニューラルネットワークを用いて顔画像の符号化を行う。
本手法は2次元視線と3次元視線の両方で技量を有意に上回ることを示す。
論文 参考訳(メタデータ) (2016-11-27T15:00:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。