論文の概要: IFAST: Weakly Supervised Interpretable Face Anti-spoofing from
Single-shot Binocular NIR Images
- arxiv url: http://arxiv.org/abs/2309.17399v1
- Date: Fri, 29 Sep 2023 17:00:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-02 12:33:42.173405
- Title: IFAST: Weakly Supervised Interpretable Face Anti-spoofing from
Single-shot Binocular NIR Images
- Title(参考訳): IFAST:シングルショットの両眼NIR画像から顔の偽造を監視
- Authors: Jiancheng Huang, Donghao Zhou, Shifeng Chen
- Abstract要約: 単発顔反偽造(英: Single-shot face anti-spoofing, FAS)は、顔認識システムを保護するための重要な技術である。
本稿では,解釈可能な予測を生成するために,弱い監督しか必要としない解釈可能なFAS変換器を提案する。
IFASTはBNI-FASの最先端の成果を得られ,両眼NIR画像を用いた単発FASの有効性が証明された。
- 参考スコア(独自算出の注目度): 8.348593305367524
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-shot face anti-spoofing (FAS) is a key technique for securing face
recognition systems, and it requires only static images as input. However,
single-shot FAS remains a challenging and under-explored problem due to two
main reasons: 1) on the data side, learning FAS from RGB images is largely
context-dependent, and single-shot images without additional annotations
contain limited semantic information. 2) on the model side, existing
single-shot FAS models are infeasible to provide proper evidence for their
decisions, and FAS methods based on depth estimation require expensive
per-pixel annotations. To address these issues, a large binocular NIR image
dataset (BNI-FAS) is constructed and published, which contains more than
300,000 real face and plane attack images, and an Interpretable FAS Transformer
(IFAST) is proposed that requires only weak supervision to produce
interpretable predictions. Our IFAST can produce pixel-wise disparity maps by
the proposed disparity estimation Transformer with Dynamic Matching Attention
(DMA) block. Besides, a well-designed confidence map generator is adopted to
cooperate with the proposed dual-teacher distillation module to obtain the
final discriminant results. The comprehensive experiments show that our IFAST
can achieve state-of-the-art results on BNI-FAS, proving the effectiveness of
the single-shot FAS based on binocular NIR images.
- Abstract(参考訳): 顔認識システムを保護するためには,シングルショットフェイスアンチスプーフィング(fas)が重要な技術であり,入力として静止画像のみを必要とする。
しかし、単一ショットのfasは2つの主な理由から、難解で未解決な問題である。
データ側では、RGB画像からFASを学習することは、主にコンテキスト依存であり、追加アノテーションのない単発画像は、限られた意味情報を含んでいる。
2) モデル側では,既存の単発FASモデルは決定の適切な証拠を与えることができないため,深度推定に基づくFAS手法には高額なピクセル単位のアノテーションが必要である。
これらの問題に対処するために、30万以上の実顔および平面攻撃画像を含む大規模な双眼NIR画像データセット(BNI-FAS)を構築し、公開し、解釈可能な予測を生成するために弱監督のみを必要とする解釈可能なFAS変換器(IFAST)を提案する。
我々のIFASTはDMA(Dynamic Matching Attention)ブロックを用いた不均一度推定変換器によって画素単位の不均一度マップを生成することができる。
また, 提案したデュアルティーチンガー蒸留モジュールと連携して最終識別結果を得るために, 適切に設計された信頼マップ生成器が採用された。
両眼NIR画像を用いた単発FASの有効性を実証し,BNI-FASにおけるIFASTの有効性を実証した。
関連論文リスト
- Efficient One-Step Diffusion Refinement for Snapshot Compressive Imaging [8.819370643243012]
Coded Aperture Snapshot Spectral Imaging (CASSI)は3次元マルチスペクトル画像(MSI)を撮影するための重要な技術である
現在の最先端の手法は、主にエンドツーエンドであり、高周波の詳細を再構築する際の制限に直面している。
本稿では,Snapshot Compressive Imagingのための自己教師型適応フレームワークにおいて,新しい1段階拡散確率モデルを提案する。
論文 参考訳(メタデータ) (2024-09-11T17:02:10Z) - Hybrid-Supervised Dual-Search: Leveraging Automatic Learning for
Loss-free Multi-Exposure Image Fusion [60.221404321514086]
マルチ露光画像融合(MEF)は、様々な露光レベルを表すデジタルイメージングの限界に対処するための重要な解決策である。
本稿では、ネットワーク構造と損失関数の両方を自動設計するための二段階最適化探索方式であるHSDS-MEFと呼ばれるMEFのためのハイブリッドスーパービジョンデュアルサーチ手法を提案する。
論文 参考訳(メタデータ) (2023-09-03T08:07:26Z) - Robust Single Image Dehazing Based on Consistent and Contrast-Assisted
Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。
具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。
我々の手法は最先端のアプローチを大きく上回っている。
論文 参考訳(メタデータ) (2022-03-29T08:11:04Z) - Dual Spoof Disentanglement Generation for Face Anti-spoofing with Depth
Uncertainty Learning [54.15303628138665]
フェース・アンチ・スプーフィング(FAS)は、顔認識システムが提示攻撃を防ぐ上で重要な役割を担っている。
既存のフェース・アンチ・スプーフィング・データセットは、アイデンティティと重要なばらつきが不十分なため、多様性を欠いている。
我々は「生成によるアンチ・スプーフィング」によりこの問題に対処するデュアル・スポット・ディアンタングメント・ジェネレーション・フレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-01T15:36:59Z) - Palette: Image-to-Image Diffusion Models [50.268441533631176]
我々は条件付き拡散モデルを用いた画像から画像への変換のためのシンプルで一般的なフレームワークであるPaletteを紹介する。
4つの困難な画像から画像への変換タスクにおいて、Paletteは強力なGANと回帰ベースラインを上回っている。
本稿では、FID、インセプションスコア、事前訓練されたResNet-50の分類精度、参照画像に対する知覚距離などのサンプル品質スコアについて報告する。
論文 参考訳(メタデータ) (2021-11-10T17:49:29Z) - SRDiff: Single Image Super-Resolution with Diffusion Probabilistic
Models [19.17571465274627]
単一の画像スーパーリゾリューション(SISR)は、与えられた低リゾリューション(LR)画像から高解像度(HR)画像を再構成することを目的とする。
新規な単像超解像拡散確率モデル(SRDiff)を提案する。
SRDiffはデータ可能性の変動境界の変種に最適化されており、多様で現実的なSR予測を提供することができる。
論文 参考訳(メタデータ) (2021-04-30T12:31:25Z) - More Photos are All You Need: Semi-Supervised Learning for Fine-Grained
Sketch Based Image Retrieval [112.1756171062067]
クロスモーダル検索のための新しい半監視フレームワークについて紹介する。
私たちの設計の中心には、連続したフォトツースケッチ生成モデルがあります。
また,不適切な生成を誘導する判別器誘導機構も導入する。
論文 参考訳(メタデータ) (2021-03-25T17:27:08Z) - Inter-class Discrepancy Alignment for Face Recognition [55.578063356210144]
IA(Inter-class DiscrepancyAlignment)という統合フレームワークを提案する。
IDA-DAOは、画像と隣人の相違を考慮した類似度スコアの整合に使用される。
IDA-SSEは、GANで生成された仮想候補画像を導入することで、説得力のあるクラス間隣人を提供できます。
論文 参考訳(メタデータ) (2021-03-02T08:20:08Z) - A GAN-Based Input-Size Flexibility Model for Single Image Dehazing [16.83211957781034]
本稿では,単一画像デハジングの課題に焦点をあてる。
ヘイズフリーの画像を直接生成する新しいモデルを設計します。
この理由と画像サイズを考慮し,単一画像デハジングのための新たな入力サイズフレキシビリティ条件付き生成逆ネットワーク(cgan)を提案する。
論文 参考訳(メタデータ) (2021-02-19T08:27:17Z) - Unsupervised Facial Action Unit Intensity Estimation via Differentiable
Optimization [45.07851622835555]
顔画像からの顔AU強度推定のための教師なしフレームワークGE-Netを提案する。
本フレームワークは,入力画像に一致するように顔パラメータを反復的に更新する,微分可能な最適化を行う。
実験により,本手法は既存手法と比較して最先端の結果が得られることが示された。
論文 参考訳(メタデータ) (2020-04-13T12:56:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。