論文の概要: Domain Generalization via Ensemble Stacking for Face Presentation Attack
Detection
- arxiv url: http://arxiv.org/abs/2301.02145v2
- Date: Sat, 16 Sep 2023 08:25:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 00:59:36.250486
- Title: Domain Generalization via Ensemble Stacking for Face Presentation Attack
Detection
- Title(参考訳): 顔提示攻撃検出のためのアンサンブルスタックによるドメイン一般化
- Authors: Usman Muhammad, Jorma Laaksonen, Djamila Romaissa Beddiar, and Mourad
Oussalah
- Abstract要約: 顔提示攻撃検出(PAD)は、偽造攻撃に対する顔認識システムを保護する上で重要な役割を担っている。
本研究では,合成データ生成と深層アンサンブル学習を組み合わせた包括的ソリューションを提案する。
4つのデータセットに対する実験結果は、3つのベンチマークデータセット上でのHTER(low half total error rate)を示す。
- 参考スコア(独自算出の注目度): 4.61143637299349
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face Presentation Attack Detection (PAD) plays a pivotal role in securing
face recognition systems against spoofing attacks. Although great progress has
been made in designing face PAD methods, developing a model that can generalize
well to unseen test domains remains a significant challenge. Moreover, due to
different types of spoofing attacks, creating a dataset with a sufficient
number of samples for training deep neural networks is a laborious task. This
work proposes a comprehensive solution that combines synthetic data generation
and deep ensemble learning to enhance the generalization capabilities of face
PAD. Specifically, synthetic data is generated by blending a static image with
spatiotemporal encoded images using alpha composition and video distillation.
This way, we simulate motion blur with varying alpha values, thereby generating
diverse subsets of synthetic data that contribute to a more enriched training
set. Furthermore, multiple base models are trained on each subset of synthetic
data using stacked ensemble learning. This allows the models to learn
complementary features and representations from different synthetic subsets.
The meta-features generated by the base models are used as input to a new model
called the meta-model. The latter combines the predictions from the base
models, leveraging their complementary information to better handle unseen
target domains and enhance the overall performance. Experimental results on
four datasets demonstrate low half total error rates (HTERs) on three benchmark
datasets: CASIA-MFSD (8.92%), MSU-MFSD (4.81%), and OULU-NPU (6.70%). The
approach shows potential for advancing presentation attack detection by
utilizing large-scale synthetic data and the meta-model.
- Abstract(参考訳): 顔提示攻撃検出(PAD)は、偽造攻撃に対する顔認識システムを保護する上で重要な役割を担っている。
フェイスパッド法の設計には大きな進歩があったが、未発見のテスト領域にうまく一般化できるモデルの開発は依然として大きな課題である。
さらに、さまざまな種類のスプーフィング攻撃のために、ディープニューラルネットワークをトレーニングする十分な数のサンプルでデータセットを作成するのは、面倒な作業である。
本研究では,合成データ生成と深層アンサンブル学習を組み合わせることで,顔PADの一般化能力を向上する包括的ソリューションを提案する。
具体的には、アルファ組成とビデオ蒸留を用いて静止画像と時空間符号化画像とを混合して合成データを生成する。
この方法で、様々なアルファ値のモーションボケをシミュレートし、より強化されたトレーニングセットに寄与する合成データの多様なサブセットを生成する。
さらに、積層アンサンブル学習を用いて合成データの各サブセット上で複数のベースモデルを訓練する。
これによりモデルは異なる合成部分集合から相補的な特徴や表現を学ぶことができる。
ベースモデルによって生成されるメタ特徴は、メタモデルと呼ばれる新しいモデルの入力として使用される。
後者はベースモデルからの予測を組み合わせることで、補完的な情報を活用して、目に見えないターゲットドメインをよりよく処理し、全体的なパフォーマンスを向上させる。
4つのデータセットにおける実験結果は、casia-mfsd (8.92%)、msu-mfsd (4.81%)、oulu-npu (6.70%)の3つのベンチマークデータセットで低い半分誤差率 (hter) を示している。
提案手法は,大規模合成データとメタモデルを用いて,提示攻撃検出の進展を示す。
関連論文リスト
- Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - Improving the Effectiveness of Deep Generative Data [5.856292656853396]
下流の画像処理タスクのための純粋合成画像のモデルを訓練すると、実際のデータに対するトレーニングに比べ、望ましくない性能低下が生じる。
本稿では,この現象に寄与する要因を記述した新しい分類法を提案し,CIFAR-10データセットを用いて検討する。
本手法は,合成データと合成データの混合による学習と合成データのみの学習において,下流分類タスクのベースラインに優れる。
論文 参考訳(メタデータ) (2023-11-07T12:57:58Z) - Private Synthetic Data Meets Ensemble Learning [15.425653946755025]
機械学習モデルが合成データに基づいてトレーニングされ、実際のデータにデプロイされると、しばしばパフォーマンス低下が発生する。
実データを用いた場合のパフォーマンス向上を目標として,下流モデルのトレーニングのための新たなアンサンブル戦略を導入する。
論文 参考訳(メタデータ) (2023-10-15T04:24:42Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - CARLA-GeAR: a Dataset Generator for a Systematic Evaluation of
Adversarial Robustness of Vision Models [61.68061613161187]
本稿では,合成データセットの自動生成ツールであるCARLA-GeARについて述べる。
このツールは、Python APIを使用して、CARLAシミュレータ上に構築されており、自律運転のコンテキストにおいて、いくつかのビジョンタスク用のデータセットを生成することができる。
本稿では,CARLA-GeARで生成されたデータセットが,現実世界の敵防衛のベンチマークとして今後どのように利用されるかを示す。
論文 参考訳(メタデータ) (2022-06-09T09:17:38Z) - Synthetic Data and Hierarchical Object Detection in Overhead Imagery [0.0]
衛星画像における低・ゼロサンプル学習を向上させるための新しい合成データ生成および拡張技術を開発した。
合成画像の有効性を検証するために,検出モデルと2段階モデルの訓練を行い,実際の衛星画像上で得られたモデルを評価する。
論文 参考訳(メタデータ) (2021-01-29T22:52:47Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Multi-Spectral Image Synthesis for Crop/Weed Segmentation in Precision
Farming [3.4788711710826083]
本稿では, 精密農業における作物・雑草の分枝化問題に適用し, 共通データ増分法に関する代替手法を提案する。
我々は、最も関連性の高いオブジェクトクラス(作物や雑草)を合成されたクラスに置き換えることで、半人工的なサンプルを作成する。
RGBデータに加えて、近赤外(NIR)情報も考慮し、4つのチャネルマルチスペクトル合成画像を生成する。
論文 参考訳(メタデータ) (2020-09-12T08:49:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。