論文の概要: Nonlinear Dynamical Systems for Automatic Face Annotation in Head Tracking and Pose Estimation
- arxiv url: http://arxiv.org/abs/2502.15179v1
- Date: Fri, 21 Feb 2025 03:20:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-24 17:06:56.688092
- Title: Nonlinear Dynamical Systems for Automatic Face Annotation in Head Tracking and Pose Estimation
- Title(参考訳): 頭部追跡・電位推定における自動顔アノテーションのための非線形力学系
- Authors: Thoa Thieu, Roderick Melnik,
- Abstract要約: 拡張カルマンフィルタ(EKF)とアンカルマンフィルタ(UKF)の3次元顔の動き追跡における性能について考察する。
UKFは高次非線形性を捕捉できるため、平均二乗誤差(MSE)を低くする。
EKFは、UKFと比較して平均二乗誤差(MSE)が低い。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Facial landmark tracking plays a vital role in applications such as facial recognition, expression analysis, and medical diagnostics. In this paper, we consider the performance of the Extended Kalman Filter (EKF) and Unscented Kalman Filter (UKF) in tracking 3D facial motion in both deterministic and stochastic settings. We first analyze a noise-free environment where the state transition is purely deterministic, demonstrating that UKF outperforms EKF by achieving lower mean squared error (MSE) due to its ability to capture higher-order nonlinearities. However, when stochastic noise is introduced, EKF exhibits superior robustness, maintaining lower mean square error (MSE) compared to UKF, which becomes more sensitive to measurement noise and occlusions. Our results highlight that UKF is preferable for high-precision applications in controlled environments, whereas EKF is better suited for real-world scenarios with unpredictable noise. These findings provide practical insights for selecting the appropriate filtering technique in 3D facial tracking applications, such as motion capture and facial recognition.
- Abstract(参考訳): 顔認識、表情分析、医療診断などの応用において、顔の目印追跡は重要な役割を担っている。
本稿では,拡張カルマンフィルタ (EKF) とアンセントカルマンフィルタ (Unscented Kalman Filter, UKF) の3次元顔の動きを決定論的・確率的に追跡する性能について考察する。
我々はまず、状態遷移が純粋に決定論的である雑音のない環境を解析し、高次非線形性を捉える能力により平均二乗誤差(MSE)を低くすることで、UKFよりも優れていることを示した。
しかし、確率ノイズを導入すると、EKFは、測定ノイズや閉塞に敏感になるUKFと比較して平均二乗誤差(MSE)を低く保ち、優れたロバスト性を示す。
この結果から,UKFは制御環境における高精度なアプリケーションに適しているが,EKFは予測不可能なノイズを伴う現実のシナリオに適していることがわかった。
これらの結果は、モーションキャプチャや顔認識などの3次元顔追跡アプリケーションにおいて、適切なフィルタリング手法を選択するための実用的な洞察を与える。
関連論文リスト
- KFD-NeRF: Rethinking Dynamic NeRF with Kalman Filter [49.85369344101118]
KFD-NeRFは,Kalmanフィルタに基づく効率的かつ高品質な運動再構成フレームワークと統合された,新しい動的ニューラル放射場である。
我々のキーとなる考え方は、動的放射場を、観測と予測という2つの知識源に基づいて時間的に異なる状態が推定される動的システムとしてモデル化することである。
我々のKFD-NeRFは、同等の計算時間と最先端の視線合成性能で、徹底的な訓練を施した類似または優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-18T05:48:24Z) - Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity [55.399230250413986]
上流タスクから有害なセマンティックノイズを除去するためのQFM-IQM(Quality-Aware Feature Matching IQA Metric)を提案する。
提案手法は,8つの標準IQAデータセット上での最先端NR-IQA法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2023-12-11T06:50:27Z) - Semantic Scene Completion with Cleaner Self [93.99441599791275]
セマンティックシーンコンプリート(SSC)は、単一のビュー深さと/またはRGB 2Dピクセルの画像を3Dボクセルに変換し、それぞれのセマンティックラベルが予測される。
SSCは、予測モデルが目に見える表面の背後にあるものを「想像する」必要があるため、よく知られた偽装問題であり、通常はTrncated Signed Distance Function (TSDF) によって表される。
我々は3Dボクセルを用いて、TSDF-CADと呼ばれる完全な可視表面を生成し、次に「クリーン」なSSCモデルを訓練する。
モデルはノイズフリーなので、期待できる。
論文 参考訳(メタデータ) (2023-03-17T13:50:18Z) - Occlusion-Robust FAU Recognition by Mining Latent Space of Masked
Autoencoders [23.39566752915331]
顔面行動単位(FAUs)は、きめ細かい表情解析に重要である。
新しいアプローチは、マスク付きオートエンコーダ(MAE)の潜伏空間からの豊富な情報を活用し、FAU機能に変換する。
FAUは、通常の条件下での最先端の手法と同等の性能を達成できる。
論文 参考訳(メタデータ) (2022-12-08T01:57:48Z) - FLNeRF: 3D Facial Landmarks Estimation in Neural Radiance Fields [64.17946473855382]
本稿では,ニューラルレイディアンス場(NeRF)における3次元顔のランドマークを直接予測する最初の重要な研究について述べる。
我々の3D粗い顔ランドマークNeRF(FLNeRF)モデルは、特定の顔のNeRFから、正確にランドマークを検出するために、個々の顔の特徴を持つ効率的なサンプルを抽出する。
論文 参考訳(メタデータ) (2022-11-21T06:26:01Z) - Outlier-Insensitive Kalman Filtering Using NUV Priors [24.413595920205907]
実際には、観測は外れ値によって破損し、カルマンフィルタ(KF)の性能を著しく損なう。
本研究では、各電位外乱を未知の分散確率変数(NUV)としてモデル化し、外乱に敏感なKFを提案する。
予測最大化(EM)と変動ロバスト性(AM)の両方を用いて、NUVs分散をオンラインで推定する。
論文 参考訳(メタデータ) (2022-10-12T11:00:13Z) - FP-Diffusion: Improving Score-based Diffusion Models by Enforcing the
Underlying Score Fokker-Planck Equation [72.19198763459448]
雑音が増大する傾向にあるデータ密度に対応する雑音条件スコア関数の族を学習する。
これらの摂動データ密度は、密度の時空間進化を管理する偏微分方程式(PDE)であるフォッカー・プランク方程式(Fokker-Planck equation, FPE)によって結合される。
我々は、摂動データ密度の雑音条件スコアを特徴付けるスコアFPEと呼ばれる対応する方程式を導出する。
論文 参考訳(メタデータ) (2022-10-09T16:27:25Z) - NR-DFERNet: Noise-Robust Network for Dynamic Facial Expression
Recognition [1.8604727699812171]
DFERタスクにおけるノイズフレームの干渉を低減するために、ノイズロスト動的表情認識ネットワーク(NR-DFERNet)を提案する。
具体的には、空間的段階において、より識別的な空間的特徴を学習するために静的特徴に動的特徴を導入する動的静的融合モジュール(DSF)を考案する。
対象の無関係なフレームの影響を抑えるために,時間段階の変換器に新しい動的クラストークン(DCT)を導入する。
論文 参考訳(メタデータ) (2022-06-10T10:17:30Z) - A Look at Improving Robustness in Visual-inertial SLAM by Moment
Matching [17.995121900076615]
本稿では,拡張カルマンフィルタ(EKF)がもたらす実用的意味と限界について批判的な考察を行う。
我々は,視覚-慣性計測と視覚SLAMの両方にモーメントマッチング(未開のカルマンフィルタリング)アプローチを採用する。
論文 参考訳(メタデータ) (2022-05-27T08:22:03Z) - Shape Matters: Understanding the Implicit Bias of the Noise Covariance [76.54300276636982]
勾配降下のノイズはパラメータ化モデルに対するトレーニングにおいて重要な暗黙の正則化効果をもたらす。
ミニバッチやラベルの摂動によって引き起こされるパラメータ依存ノイズはガウスノイズよりもはるかに効果的であることを示す。
分析の結果,パラメータ依存ノイズは局所最小値に偏りを生じさせるが,球状ガウス雑音は生じないことがわかった。
論文 参考訳(メタデータ) (2020-06-15T18:31:02Z) - Semantic Neighborhood-Aware Deep Facial Expression Recognition [14.219890078312536]
意味的摂動を定式化し,訓練中に信頼できないサンプルを選択する新しい手法を提案する。
実験の結果,提案手法の有効性が示され,その結果が得られた。
論文 参考訳(メタデータ) (2020-04-27T11:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。