論文の概要: 2D-3D Attention and Entropy for Pose Robust 2D Facial Recognition
- arxiv url: http://arxiv.org/abs/2505.09073v1
- Date: Wed, 14 May 2025 02:17:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.346843
- Title: 2D-3D Attention and Entropy for Pose Robust 2D Facial Recognition
- Title(参考訳): Pose Robust 2D Facial Recognitionにおける2D-3Dの注意とエントロピー
- Authors: J. Brennan Peace, Shuowen Hu, Benjamin S. Riggan,
- Abstract要約: 本稿では,画像に基づくパフォーマンスにおいて,大きな相違点にまたがる改善を容易にする新しいパフォーマンスフレームワークを提案する。
提案するフレームワークは,共有クラウド(3D)表現を有効にすることで,少なくとも7.100以上のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 3.1632426898254224
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Despite recent advances in facial recognition, there remains a fundamental issue concerning degradations in performance due to substantial perspective (pose) differences between enrollment and query (probe) imagery. Therefore, we propose a novel domain adaptive framework to facilitate improved performances across large discrepancies in pose by enabling image-based (2D) representations to infer properties of inherently pose invariant point cloud (3D) representations. Specifically, our proposed framework achieves better pose invariance by using (1) a shared (joint) attention mapping to emphasize common patterns that are most correlated between 2D facial images and 3D facial data and (2) a joint entropy regularizing loss to promote better consistency$\unicode{x2014}$enhancing correlations among the intersecting 2D and 3D representations$\unicode{x2014}$by leveraging both attention maps. This framework is evaluated on FaceScape and ARL-VTF datasets, where it outperforms competitive methods by achieving profile (90$\unicode{x00b0}$$\unicode{x002b}$) TAR @ 1$\unicode{x0025}$ FAR improvements of at least 7.1$\unicode{x0025}$ and 1.57$\unicode{x0025}$, respectively.
- Abstract(参考訳): 近年の顔認識の進歩にもかかわらず、登録とクエリ(プローブ)画像の実質的な相違により、パフォーマンスの劣化に関する根本的な問題が残っている。
そこで本研究では,画像ベース(2D)表現が本質的に不変な点クラウド(3D)表現の特性を推論できるようにすることにより,大きな相違点間の性能向上を促進する新しい領域適応フレームワークを提案する。
具体的には,(1)2次元の顔画像と3次元の顔データに最も相関する共通パターンを強調するための共通(結合)アテンションマッピング,(2)より整合性を高めるための共同エントロピー正規化損失($\unicode{x2014}$enhancing correlations of the intersecting 2D and 3D representations$\unicode{x2014}$by。
このフレームワークはFaceScapeとARL-VTFデータセットで評価されており、プロファイル(90$\unicode{x00b0}$$\unicode{x002b}$) TAR @ 1$\unicode{x0025}$ FARの改善により、それぞれ少なくとも7.1$\unicode{x0025}$と1.57$\unicode{x0025}$を達成して、競合メソッドよりも優れています。
関連論文リスト
- PostoMETRO: Pose Token Enhanced Mesh Transformer for Robust 3D Human Mesh Recovery [20.763457281944834]
本稿では,2次元ポーズ表現をトークン的に変換器に統合するPostoMETROを提案する。
閉塞のような極端なシナリオの下でも、より正確な3D座標を生成することができます。
論文 参考訳(メタデータ) (2024-03-19T06:18:25Z) - Learning Naturally Aggregated Appearance for Efficient 3D Editing [90.57414218888536]
カラーフィールドは、標準画像(canonical image)とも呼ばれる、明示的な2次元の外観アグリゲーションとして学習する。
テクスチャクエリのために3Dポイントを2Dピクセルにマッピングする投影場を標準画像に補完する。
提案手法は,既存のNeRFベースの編集手法に比べて,編集1回あたり20倍高速であることを示す。
論文 参考訳(メタデータ) (2023-12-11T18:59:31Z) - Two Views Are Better than One: Monocular 3D Pose Estimation with Multiview Consistency [0.493599216374976]
2つの同期ビューで動作する新しい損失関数、一貫性損失を導入する。
我々の整合性喪失は、3Dデータを必要としない微調整の性能を著しく向上させる。
半教師付き方式でモデルをスクラッチからトレーニングする場合,一貫性損失を用いることで最先端の性能が得られることを示す。
論文 参考訳(メタデータ) (2023-11-21T08:21:55Z) - A Single 2D Pose with Context is Worth Hundreds for 3D Human Pose
Estimation [18.72362803593654]
3Dポーズ列を3Dに上げる3Dポーズ推定における支配的なパラダイムは、長期的な時間的手がかりに大きく依存している。
これは、通常の2次元の関節座標が視覚的手がかりを持たないため、空間的文脈を知覚できないことに起因する。
そこで本研究では,市販の2次元ポーズ検出器によって生成される,手軽に利用可能な中間的視覚表現を活用する,単純かつ強力なソリューションを提案する。
論文 参考訳(メタデータ) (2023-11-06T18:04:13Z) - Learning from Abstract Images: on the Importance of Occlusion in a
Minimalist Encoding of Human Poses [0.0]
2D-to-D表現は、クロスデータセットのベンチマークではパフォーマンスが悪い。
本稿では,それを符号化しながら3次元情報を用いた新しい表現を提案する。
その結果、カメラの視点から完全に独立したポーズを予測できる。
論文 参考訳(メタデータ) (2023-07-19T10:45:49Z) - CheckerPose: Progressive Dense Keypoint Localization for Object Pose
Estimation with Graph Neural Network [66.24726878647543]
単一のRGB画像から固い物体の6-DoFのポーズを推定することは、非常に難しい課題である。
近年の研究では、高密度対応型解の大きな可能性を示している。
そこで本研究では,CheckerPoseというポーズ推定アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-29T17:30:53Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - Fusing Wearable IMUs with Multi-View Images for Human Pose Estimation: A
Geometric Approach [76.10879433430466]
多視点画像と人手足に装着したIMUから3次元人間のポーズを推定する。
まず2つの信号から2Dのポーズを検出し、3D空間に持ち上げる。
単純な2段階のアプローチは、公開データセット上の大きなマージンによる最先端のエラーを低減する。
論文 参考訳(メタデータ) (2020-03-25T00:26:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。