論文の概要: Beyond Spatial Explanations: Explainable Face Recognition in the Frequency Domain
- arxiv url: http://arxiv.org/abs/2407.11941v1
- Date: Tue, 16 Jul 2024 17:29:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 13:34:07.239312
- Title: Beyond Spatial Explanations: Explainable Face Recognition in the Frequency Domain
- Title(参考訳): 空間的説明を超えて:周波数領域における説明可能な顔認識
- Authors: Marco Huber, Naser Damer,
- Abstract要約: 我々は、探索されていない周波数領域における説明可能な顔認識について、一歩前進して検討する。
この研究は、周波数領域における検証に基づく決定の説明可能性について初めて提案する。
- 参考スコア(独自算出の注目度): 6.69421628320396
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The need for more transparent face recognition (FR), along with other visual-based decision-making systems has recently attracted more attention in research, society, and industry. The reasons why two face images are matched or not matched by a deep learning-based face recognition system are not obvious due to the high number of parameters and the complexity of the models. However, it is important for users, operators, and developers to ensure trust and accountability of the system and to analyze drawbacks such as biased behavior. While many previous works use spatial semantic maps to highlight the regions that have a significant influence on the decision of the face recognition system, frequency components which are also considered by CNNs, are neglected. In this work, we take a step forward and investigate explainable face recognition in the unexplored frequency domain. This makes this work the first to propose explainability of verification-based decisions in the frequency domain, thus explaining the relative influence of the frequency components of each input toward the obtained outcome. To achieve this, we manipulate face images in the spatial frequency domain and investigate the impact on verification outcomes. In extensive quantitative experiments, along with investigating two special scenarios cases, cross-resolution FR and morphing attacks (the latter in supplementary material), we observe the applicability of our proposed frequency-based explanations.
- Abstract(参考訳): より透明な顔認識(FR)と他の視覚に基づく意思決定システムの必要性は、最近、研究、社会、産業により多くの注目を集めている。
深層学習に基づく顔認識システムで2つの顔画像が一致するか一致しないかは、パラメータの多さとモデルの複雑さから明らかではない。
しかし,ユーザ,オペレータ,開発者がシステムの信頼性と説明責任を保証し,バイアス行動などの欠点を分析することは重要である。
従来の多くの研究では、認識システムの決定に大きな影響を及ぼす領域を強調するために空間意味マップを使用していたが、CNNでも考慮されている周波数成分は無視されている。
本研究では、探索されていない周波数領域における説明可能な顔認識について、一歩前進して検討する。
これにより、周波数領域における検証に基づく決定の説明可能性について初めて提案し、各入力の周波数成分が得られた結果に対する相対的影響を説明する。
これを実現するために,空間周波数領域における顔画像の操作を行い,検証結果への影響について検討する。
広範にわたる定量的実験では、クロスレゾリューションFRとモーフィングアタック(後者は補助材料)という2つの特殊なシナリオを調査し、周波数に基づく説明法の適用性について検討した。
関連論文リスト
- Towards A Comprehensive Visual Saliency Explanation Framework for AI-based Face Recognition Systems [9.105950041800225]
本書は,顔認識タスクの包括的説明枠組みを考案した。
AIに基づく顔認識システムのためのビジュアル・サリエンシ・マップに基づく説明の包括的定義を提供する。
CorrRISE というモデルに依存しない新しい説明法が提案されている。
論文 参考訳(メタデータ) (2024-07-08T14:25:46Z) - Explainable Face Verification via Feature-Guided Gradient
Backpropagation [9.105950041800225]
顔認識システムの意思決定に対する信頼性の高い解釈の必要性が高まっている。
本稿ではまず,勾配逆伝播による顔画像とその深部表現の空間的関係について検討する。
FRシステムの"アクセプション"と"リジェクト"の決定を説明するために、正確で洞察に富んだ類似性と相似性の相似性マップを提供する新しい説明手法が考案された。
論文 参考訳(メタデータ) (2024-03-07T14:43:40Z) - Attention Consistency Refined Masked Frequency Forgery Representation
for Generalizing Face Forgery Detection [96.539862328788]
既存の偽造検出方法は、未確認領域の真正性を決定する不満足な一般化能力に悩まされている。
ACMF(Attention Consistency Refined masked frequency forgery representation model)を提案する。
いくつかのパブリックフェイスフォージェリーデータセットの実験結果から,提案手法の性能は最先端の手法と比較して優れていることが示された。
論文 参考訳(メタデータ) (2023-07-21T08:58:49Z) - Explanation of Face Recognition via Saliency Maps [13.334500258498798]
本稿では,説明可能な顔認識(XFR)の厳密な定義を提案する。
次に、類似性に基づくRISEアルゴリズム(S-RISE)を導入し、高品質なビジュアル・サリエンシ・マップを作成する。
一般的なビジュアル・サリエンシに基づくXFR手法の信頼性と精度を体系的に評価するための評価手法を提案する。
論文 参考訳(メタデータ) (2023-04-12T19:04:21Z) - Privacy-Preserving Face Recognition with Learnable Privacy Budgets in
Frequency Domain [77.8858706250075]
本稿では,周波数領域における差分プライバシーを用いたプライバシ保護顔認証手法を提案する。
本手法はいくつかの古典的顔認証テストセットで非常によく機能する。
論文 参考訳(メタデータ) (2022-07-15T07:15:36Z) - Masked Frequency Modeling for Self-Supervised Visual Pre-Training [102.89756957704138]
MFM(Masked Frequency Modeling)は、視覚モデルの自己教師付き事前学習のための統合周波数領域に基づくアプローチである。
MFMはまず入力画像の周波数成分の一部をマスクアウトし、周波数スペクトルの欠落周波数を予測する。
MFMは初めて、ViTとCNNの両方で、単純な非シームフレームワークは、以下のものを使って意味のある表現を学習できることを示した。
論文 参考訳(メタデータ) (2022-06-15T17:58:30Z) - Beyond the Visible: A Survey on Cross-spectral Face Recognition [15.469814029453893]
クロススペクトル顔認識 (CFR) とは、異なるスペクトル帯から生じる顔画像を用いて個人を認識することを指す。
近年のディープニューラルネットワーク(DNN)の進歩により、CFRシステムの性能が大幅に向上した。
論文 参考訳(メタデータ) (2022-01-12T12:09:24Z) - Detect and Locate: A Face Anti-Manipulation Approach with Semantic and
Noise-level Supervision [67.73180660609844]
本稿では,画像中の偽造顔を効率的に検出する,概念的にシンプルだが効果的な方法を提案する。
提案手法は,画像に関する意味の高い意味情報を提供するセグメンテーションマップに依存する。
提案モデルでは,最先端検出精度と顕著なローカライゼーション性能を実現する。
論文 参考訳(メタデータ) (2021-07-13T02:59:31Z) - Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in
Frequency Domain [88.7339322596758]
本論文では,空間画像と位相スペクトルを組み合わせ,顔の偽造のアップサンプリング成果をキャプチャするSPSL(Spatial-Phase Shallow Learning)法を提案する。
SPSLは、クロスデータセット評価における最先端性能とマルチクラス分類を実現し、単一データセット評価において同等の結果を得ることができる。
論文 参考訳(メタデータ) (2021-03-02T16:45:08Z) - Thinking in Frequency: Face Forgery Detection by Mining Frequency-aware
Clues [44.78809141563589]
本稿では,F3-Net(F3-Net)とF3-Net(F3-Net)の2つの異なる相補的な周波数認識手法の利点を生かした新しい周波数情報を提案する。
提案したF3-Netは、FaceForensics++データセットにおいて、すべての圧縮品質において競合する最先端の手法よりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2020-07-18T07:39:08Z) - Learning Oracle Attention for High-fidelity Face Completion [121.72704525675047]
U-Net構造に基づく顔補完のための包括的フレームワークを設計する。
複数のスケールで顔のテクスチャ間の相関関係を効率よく学習する双対空間アテンションモジュールを提案する。
顔成分の位置を事前の知識として捉え,これらの領域に複数識別器を課す。
論文 参考訳(メタデータ) (2020-03-31T01:37:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。