論文の概要: Can Foundation Models Generalise the Presentation Attack Detection Capabilities on ID Cards?
- arxiv url: http://arxiv.org/abs/2506.05263v1
- Date: Thu, 05 Jun 2025 17:24:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.846823
- Title: Can Foundation Models Generalise the Presentation Attack Detection Capabilities on ID Cards?
- Title(参考訳): ファウンデーションモデルはIDカードの提示攻撃検出能力を一般化できるか?
- Authors: Juan E. Tapia, Christoph Busch,
- Abstract要約: 巨大なデータセットでトレーニングされたファンデーションモデル(FM)は、一般化機能の改善に役立つ。
チリのIDに基づく1つのプライベートデータセットと、フィンランド、スペイン、スロバキアの3つのID国に基づく1つのオープンセット。
以上の結果から,ボナファイド画像が一般化の鍵であることが示唆された。
- 参考スコア(独自算出の注目度): 8.19090399879644
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Nowadays, one of the main challenges in presentation attack detection (PAD) on ID cards is obtaining generalisation capabilities for a diversity of countries that are issuing ID cards. Most PAD systems are trained on one, two, or three ID documents because of privacy protection concerns. As a result, they do not obtain competitive results for commercial purposes when tested in an unknown new ID card country. In this scenario, Foundation Models (FM) trained on huge datasets can help to improve generalisation capabilities. This work intends to improve and benchmark the capabilities of FM and how to use them to adapt the generalisation on PAD of ID Documents. Different test protocols were used, considering zero-shot and fine-tuning and two different ID card datasets. One private dataset based on Chilean IDs and one open-set based on three ID countries: Finland, Spain, and Slovakia. Our findings indicate that bona fide images are the key to generalisation.
- Abstract(参考訳): 現在、IDカードの提示攻撃検出(PAD)における課題の一つとして、IDカードを発行している各国の多様性の一般化能力の獲得が挙げられる。
ほとんどのPADシステムは、プライバシー保護の懸念から、1つ、2つ、3つのID文書で訓練されている。
その結果、未知の新しいIDカード国でテストした場合、商業目的の競争結果を得ることができない。
このシナリオでは、巨大なデータセットでトレーニングされたファンデーションモデル(FM)が、一般化機能を改善するのに役立ちます。
この作業は、FMの能力を改善し、ベンチマークすることを目的としており、それをIDドキュメントのPADに適応させる方法である。
ゼロショットと微調整と2つの異なるIDカードデータセットを考慮して異なるテストプロトコルが使用された。
チリのIDに基づく1つのプライベートデータセットと、フィンランド、スペイン、スロバキアの3つのID国に基づく1つのオープンセット。
以上の結果から,ボナファイド画像が一般化の鍵であることが示唆された。
関連論文リスト
- CFReID: Continual Few-shot Person Re-Identification [130.5656289348812]
Lifelong ReIDは、複数のドメインにまたがる知識を漸進的に学習し、蓄積するために提案されている。
LReIDモデルは、一般にプライバシとコストの懸念のためにアクセスできない、目に見えない各ドメインの大規模ラベル付きデータでトレーニングする必要がある。
本稿では,数ショットデータを用いてモデルをインクリメンタルにトレーニングし,すべてのドメインでテストするContinual Few-shot ReIDを提案する。
論文 参考訳(メタデータ) (2025-03-24T09:17:05Z) - Few-Shot Learning: Expanding ID Cards Presentation Attack Detection to Unknown ID Countries [2.946386240942919]
本稿では,遠隔検証システムに配備されたIDカードの提示攻撃を検出するためのFew-shot Learningアプローチを提案する。
本研究は,アルゼンチンやコスタリカなどの新しいIDカード国における,原型ネットワークをベースラインとして,スペインやチリの文書にまたがるパフォーマンスを分析した。
論文 参考訳(メタデータ) (2024-09-10T20:05:00Z) - Synthesizing Efficient Data with Diffusion Models for Person Re-Identification Pre-Training [51.87027943520492]
本稿では,既知の同一性に基づく多様な画像の効率向上と生成を行う新しいパラダイムDiffusion-ReIDを提案する。
提案したパラダイムに適合して,まず,5,183個のIDから777K以上の画像で構成された,大規模なRe-IDデータセットDiff-Personを新たに作成する。
論文 参考訳(メタデータ) (2024-06-10T06:26:03Z) - Unified Physical-Digital Face Attack Detection [66.14645299430157]
顔認識(FR)システムは物理的(印刷写真)とデジタル(ディープフェイク)攻撃に悩まされることがある。
以前の関連する作業では、両方の状況が同時に考慮されることはめったにありません。
視覚言語モデル(VLM)に基づく一元攻撃検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-31T09:38:44Z) - Raising the Bar of AI-generated Image Detection with CLIP [50.345365081177555]
本研究の目的は、AI生成画像の普遍的検出のための事前学習された視覚言語モデル(VLM)の可能性を探ることである。
我々は,CLIP機能に基づく軽量な検出戦略を開発し,その性能を様々な難易度シナリオで検証する。
論文 参考訳(メタデータ) (2023-11-30T21:11:20Z) - Improving Presentation Attack Detection for ID Cards on Remote
Verification Systems [2.0305676256390934]
本稿では,IDカードの遠隔生体認証システムのための2段階のエンドツーエンド提示検出手法を提案する。
提案は、実例190,000のチリのIDカードイメージからなるデータベースを使用して、第三者企業の支援により開発された。
本手法は2つの畳み込みニューラルネットワークを個別にトレーニングし,それぞれ1.69%,2.36%のIDカード攻撃でBPCERtextsubscript100スコアに達した。
論文 参考訳(メタデータ) (2023-01-23T16:59:26Z) - Synthetic ID Card Image Generation for Improving Presentation Attack
Detection [12.232059909207578]
本研究は,不正検出ネットワークを訓練しながら,データ量を増やすために,IDカード画像を合成的に生成する3つの手法について検討する。
以上の結果から, PAIS (Print/Scan Presentation Attack Instrument Species) の性能低下や, PAIS (Sing/Scan Presentation Instrument Species) の性能低下を伴わずに, 合成画像でデータベースを補足できることが示唆された。
論文 参考訳(メタデータ) (2022-10-31T19:07:30Z) - Towards an Efficient Semantic Segmentation Method of ID Cards for
Verification Systems [8.820032281861227]
本研究では,IDカードのセマンティックセグメンテーションを用いて背景を除去する手法を提案する。
MobileUNetとDenseNet10をベースとした2つのディープラーニングアプローチが検討された。
提案手法は,モバイル端末上でのリアルタイム操作に利用できるほど軽量である。
論文 参考訳(メタデータ) (2021-11-24T19:54:17Z) - Semi-Supervised Domain Generalizable Person Re-Identification [74.75528879336576]
既存の人物の再識別(re-id)メソッドは、新しい目に見えないシナリオにデプロイされると立ち往生する。
近年,新たなシナリオにおける未ラベルの広範なデータをトランスダクティブ学習方式で活用するドメイン適応型人物再認識への取り組みが進められている。
我々は、複数のラベル付きデータセットを探索し、人物の再識別のための一般化されたドメイン不変表現を学習することを目指している。
論文 参考訳(メタデータ) (2021-08-11T06:08:25Z) - Unsupervised Pre-training for Person Re-identification [90.98552221699508]
大規模無ラベル人物再識別(Re-ID)データセットLUPersonを提案する。
学習者のRe-ID特徴表現の一般化能力を向上させるために,教師なし事前学習を初めて行おうとする。
論文 参考訳(メタデータ) (2020-12-07T14:48:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。