論文の概要: Flickr-PAD: New Face High-Resolution Presentation Attack Detection
Database
- arxiv url: http://arxiv.org/abs/2304.13015v1
- Date: Tue, 25 Apr 2023 17:42:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 19:29:06.880491
- Title: Flickr-PAD: New Face High-Resolution Presentation Attack Detection
Database
- Title(参考訳): flickr-pad:新しい顔高分解能プレゼンテーションアタック検出データベース
- Authors: Diego Pasmino, Carlos Aravena, Juan Tapia and Christoph Busch
- Abstract要約: この研究は、オープンアクセスFlickrイメージに基づいた新しいPADデータベース「Flickr-PAD」を提示する。
私たちの新しい手作りデータベースは、高品質な印刷と画面のシナリオを示しています。
これにより、研究者はより広いデータベース上の既存のアルゴリズムと新しいアプローチを比較することができる。
- 参考スコア(独自算出の注目度): 10.303961124927284
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Nowadays, Presentation Attack Detection is a very active research area.
Several databases are constituted in the state-of-the-art using images
extracted from videos. One of the main problems identified is that many
databases present a low-quality, small image size and do not represent an
operational scenario in a real remote biometric system. Currently, these images
are captured from smartphones with high-quality and bigger resolutions. In
order to increase the diversity of image quality, this work presents a new PAD
database based on open-access Flickr images called: "Flickr-PAD". Our new
hand-made database shows high-quality printed and screen scenarios. This will
help researchers to compare new approaches to existing algorithms on a wider
database. This database will be available for other researchers. A
leave-one-out protocol was used to train and evaluate three PAD models based on
MobileNet-V3 (small and large) and EfficientNet-B0. The best result was reached
with MobileNet-V3 large with BPCER10 of 7.08% and BPCER20 of 11.15%.
- Abstract(参考訳): 現在,プレゼンテーションアタック検出は非常に活発な研究分野である。
映像から抽出した画像を用いて,最先端のデータベースを構成する。
主な問題は、多くのデータベースが低品質で小さな画像サイズであり、実際の遠隔バイオメトリックシステムでは運用シナリオを表現していないことである。
現在、これらの画像は高品質で解像度の高いスマートフォンから撮影されている。
画像品質の多様性を高めるため、この研究は「Flickr-PAD」と呼ばれるオープンアクセスFlickrイメージに基づいた新しいPADデータベースを提供する。
新しい手作りデータベースは、高品質な印刷と画面のシナリオを示しています。
これにより、研究者はより広いデータベース上の既存のアルゴリズムと新しいアプローチを比較することができる。
このデータベースは他の研究者も利用できる。
MobileNet-V3(小さくて大きい)とEfficientNet-B0に基づく3つのPADモデルのトレーニングと評価に、Left-one-outプロトコルが使用された。
最大の成果はMobileNet-V3で、BPCER10は7.08%、BPCER20は11.15%だった。
関連論文リスト
- Raising the Bar of AI-generated Image Detection with CLIP [50.345365081177555]
本研究の目的は、AI生成画像の普遍的検出のための事前学習された視覚言語モデル(VLM)の可能性を探ることである。
我々は,CLIP機能に基づく軽量な検出戦略を開発し,その性能を様々な難易度シナリオで検証する。
論文 参考訳(メタデータ) (2023-11-30T21:11:20Z) - FORB: A Flat Object Retrieval Benchmark for Universal Image Embedding [7.272083488859574]
多様なパターンを持つ平坦な画像に対して,ビジュアル検索手法をベンチマークするための新しいデータセットを提案する。
我々のフラットオブジェクト検索ベンチマーク(FORB)は一般的に採用されている3Dオブジェクトドメインを補完する。
アウト・オブ・ディストリビューション領域のイメージ埋め込み品質を評価するためのテストベッドとして機能する。
論文 参考訳(メタデータ) (2023-09-28T08:41:51Z) - Recurrent Multi-scale Transformer for High-Resolution Salient Object
Detection [68.65338791283298]
Salient Object Detection (SOD) は、画像やビデオの中で最も顕著なオブジェクトを識別し、セグメント化することを目的としている。
従来のSOD法は主に解像度の低い画像に限られており、高分解能SODの開発に適応することが困難である。
本研究ではまず,2K-8K解像度で10,500個の高品質なアノテート画像を含む新しいHRS10Kデータセットを提案する。
論文 参考訳(メタデータ) (2023-08-07T17:49:04Z) - FarSight: A Physics-Driven Whole-Body Biometric System at Large Distance
and Altitude [67.55994773068191]
本稿ではFarSightの設計・開発・評価について述べる。
FarSightは、全身(顔、歩行、身体形状の融合)の生体認証のために設計された革新的なソフトウェアシステムである。
我々は、新たに取得したIARPAバイオメトリック認識とAltitude and Rangeデータセットによる同定を用いて、FarSightの有効性を検証した。
論文 参考訳(メタデータ) (2023-06-29T16:14:27Z) - Search By Image: Deeply Exploring Beneficial Features for Beauty Product
Retrieval [21.78262478923889]
本稿では,ニューラルネットワークによる美容積検索(BPR)の実用的意義について検討する。
我々は様々な種類の画像の特徴を抽出し、これらの特徴がiにとって有益かどうかという興味深い疑問を提起する。
美容製品画像の複数特徴(VM-Net)の組み合わせを理解するために,新しい可変アテンションニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-24T15:38:58Z) - Expanding Accurate Person Recognition to New Altitudes and Ranges: The
BRIAR Dataset [1.965868228519436]
近年、顔認識技術は、ディープラーニングモデルで使用する大規模で複雑なトレーニングデータセットが利用可能であることから、大幅に進歩している。
しかしこれらのデータセットは、より高度なセキュリティ、法医学、軍事的応用において、限られた実用性を持っている。
本稿では,データセットの収集とキュレートに使用される手法と,現在のデータセットの特徴について述べる。
論文 参考訳(メタデータ) (2022-11-03T15:51:39Z) - BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird's-Eye View Representation [105.96557764248846]
本稿では,汎用マルチタスクマルチセンサ融合フレームワークであるBEVFusionを紹介する。
共有鳥眼ビュー表示空間におけるマルチモーダル特徴を統一する。
3Dオブジェクト検出では1.3%高いmAPとNDS、BEVマップのセグメンテーションでは13.6%高いmIoU、コストは1.9倍である。
論文 参考訳(メタデータ) (2022-05-26T17:59:35Z) - Generalized Iris Presentation Attack Detection Algorithm under
Cross-Database Settings [63.90855798947425]
プレゼンテーションアタックは、バイオメトリックなモダリティの大部分に大きな課題をもたらす。
本稿では,汎用的な深層学習に基づくプレゼンテーション攻撃検出ネットワークであるMVANetを提案する。
これはハイブリッドアルゴリズムの単純さと成功、あるいは複数の検出ネットワークの融合にインスパイアされている。
論文 参考訳(メタデータ) (2020-10-25T22:42:27Z) - SqueezeFacePoseNet: Lightweight Face Verification Across Different Poses
for Mobile Platforms [55.84746218227712]
顔認識技術は、モバイルデバイスでカメラが利用できることを考えると、信頼性が高く堅牢なユーザー認証を提供することができる。
ディープ畳み込みニューラルネットワークは、多くの正確な顔認証アーキテクチャをもたらすが、その典型的なサイズ(数百メガバイト)は、ダウンロード可能なモバイルアプリケーションに組み込むことができない。
我々は,より大規模なモデルと比較して,十分な精度で動作可能な数メガバイトの軽量な顔認識ネットワークを開発した。
論文 参考訳(メタデータ) (2020-07-16T19:02:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。