論文の概要: Occlusion-Robust FAU Recognition by Mining Latent Space of Masked
Autoencoders
- arxiv url: http://arxiv.org/abs/2212.04029v1
- Date: Thu, 8 Dec 2022 01:57:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 15:33:39.332196
- Title: Occlusion-Robust FAU Recognition by Mining Latent Space of Masked
Autoencoders
- Title(参考訳): マスクオートエンコーダの潜在空間のマイニングによる排他的FAU認識
- Authors: Minyang Jiang, Yongwei Wang, Martin J. McKeown and Z. Jane Wang
- Abstract要約: 顔面行動単位(FAUs)は、きめ細かい表情解析に重要である。
新しいアプローチは、マスク付きオートエンコーダ(MAE)の潜伏空間からの豊富な情報を活用し、FAU機能に変換する。
FAUは、通常の条件下での最先端の手法と同等の性能を達成できる。
- 参考スコア(独自算出の注目度): 23.39566752915331
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial action units (FAUs) are critical for fine-grained facial expression
analysis. Although FAU detection has been actively studied using ideally high
quality images, it was not thoroughly studied under heavily occluded
conditions. In this paper, we propose the first occlusion-robust FAU
recognition method to maintain FAU detection performance under heavy
occlusions. Our novel approach takes advantage of rich information from the
latent space of masked autoencoder (MAE) and transforms it into FAU features.
Bypassing the occlusion reconstruction step, our model efficiently extracts FAU
features of occluded faces by mining the latent space of a pretrained masked
autoencoder. Both node and edge-level knowledge distillation are also employed
to guide our model to find a mapping between latent space vectors and FAU
features. Facial occlusion conditions, including random small patches and large
blocks, are thoroughly studied. Experimental results on BP4D and DISFA datasets
show that our method can achieve state-of-the-art performances under the
studied facial occlusion, significantly outperforming existing baseline
methods. In particular, even under heavy occlusion, the proposed method can
achieve comparable performance as state-of-the-art methods under normal
conditions.
- Abstract(参考訳): 顔面行動単位(FAUs)は、きめ細かい表情解析に重要である。
FAU検出は、理想的には高品質な画像を用いて活発に研究されているが、密閉条件下では十分に研究されていない。
本稿では, 重閉塞下でのFAU検出性能を維持するために, 初となるOcclusion-robust FAU認識法を提案する。
我々の新しいアプローチは、マスク付きオートエンコーダ(MAE)の潜伏空間からの豊富な情報を活用し、FAU特徴に変換する。
咬合再構成ステップをバイパスして,事前学習したマスク式オートエンコーダの潜在空間を抽出し,咬合面のfau特徴を効率的に抽出する。
ノードレベルの知識蒸留とエッジレベルの知識蒸留を併用して,潜在空間ベクトルとFAUの特徴のマッピングを行う。
ランダムな小さなパッチや大きなブロックを含む顔面閉塞条件を徹底的に研究した。
BP4D と DISFA データセットを用いた実験結果から,既存のベースライン法を著しく上回り,研究対象の顔面閉塞下で最先端の性能を達成できることが示唆された。
特に, 重閉塞下であっても, 提案手法は, 通常の条件下での最先端手法と同等の性能を達成できる。
関連論文リスト
- Effort: Efficient Orthogonal Modeling for Generalizable AI-Generated Image Detection [66.16595174895802]
既存のAI生成画像(AIGI)検出手法は、しばしば限定的な一般化性能に悩まされる。
本稿では、AIGI検出において、これまで見過ごされてきた重要な非対称性現象を同定する。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection [1.0358639819750703]
教師なし異常検出(UAD)研究では、計算効率が高くスケーラブルなソリューションを開発する必要がある。
再建・塗り替えのアプローチを再考し、強みと弱みを分析して改善する。
異常再構成の特徴情報を減衰させる2つの層のみを用いるFADeR(Feature Attenuation of Defective Representation)を提案する。
論文 参考訳(メタデータ) (2024-07-05T15:44:53Z) - Towards More General Video-based Deepfake Detection through Facial Feature Guided Adaptation for Foundation Model [15.61920157541529]
内部にリッチな情報をエンコードしたファンデーションモデルを適用することにより,新しいディープフェイク検出手法を提案する。
近年のパラメータ効率の良い微調整技術に触発されて,新しいサイドネットワーク型デコーダを提案する。
提案手法は,見知らぬディープフェイクサンプルの同定に優れた有効性を示し,顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2024-04-08T14:58:52Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Latent-OFER: Detect, Mask, and Reconstruct with Latent Vectors for
Occluded Facial Expression Recognition [0.0]
提案手法は, 顔の隠蔽部分を, 隠蔽されていないかのように検出し, 認識し, FER精度を向上する。
まず、視覚変換器(ViT)ベースのオクルージョンパッチ検出器は、隠蔽されたパッチから潜在ベクトルのみを訓練することで、隠蔽された位置をマスクする。
第2に、ハイブリッド再構成ネットワークは、ViTと畳み込みニューラルネットワーク(CNN)を用いて、完全な画像としてマスキング位置を生成する。
最後に、式関連潜時ベクトル抽出器は、CNNに基づくクラスアクティベーションマップを適用して、すべての潜時ベクトルから式関連情報を検索し、使用する。
論文 参考訳(メタデータ) (2023-07-21T07:56:32Z) - RARE: Robust Masked Graph Autoencoder [45.485891794905946]
Masked graph autoencoder (MGAE) は、有望な自己教師付きグラフ事前学習(SGP)パラダイムとして登場した。
本稿では,ロバストmAsked gRaph autoEncoder (RARE) と呼ばれる新しいSGP手法を提案する。
論文 参考訳(メタデータ) (2023-04-04T03:35:29Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Robust and Precise Facial Landmark Detection by Self-Calibrated Pose
Attention Network [73.56802915291917]
より堅牢で正確な顔のランドマーク検出を実現するための半教師付きフレームワークを提案する。
より効果的な顔形状制約をモデル化するために,境界対応ランドマーク強度(BALI)フィールドを提案する。
自己キャリブレーション・ポース・アテンション(SCPA)モデルは、中間的監督を強制する自己学習型目標関数を提供するように設計されている。
論文 参考訳(メタデータ) (2021-12-23T02:51:08Z) - End2End Occluded Face Recognition by Masking Corrupted Features [82.27588990277192]
最先端の一般的な顔認識モデルは、隠蔽された顔画像に対してうまく一般化しない。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
我々のアプローチは、深い畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習されたマスクによってそれらをきれいにする。
論文 参考訳(メタデータ) (2021-08-21T09:08:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。