論文の概要: IDNet: A Novel Dataset for Identity Document Analysis and Fraud Detection
- arxiv url: http://arxiv.org/abs/2408.01690v2
- Date: Tue, 3 Sep 2024 22:30:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-07 01:49:25.763747
- Title: IDNet: A Novel Dataset for Identity Document Analysis and Fraud Detection
- Title(参考訳): IDNet:ID文書分析と不正検出のための新しいデータセット
- Authors: Hong Guan, Yancheng Wang, Lulu Xie, Soham Nag, Rajeev Goel, Niranjan Erappa Narayana Swamy, Yingzhen Yang, Chaowei Xiao, Jonathan Prisby, Ross Maciejewski, Jia Zou,
- Abstract要約: IDNetは、プライバシー保護詐欺検出の取り組みを促進するために設計されたベンチマークデータセットである。
合成されたID文書の837,060枚の画像からなり、合計で約490ギガバイトである。
本研究は,プライバシ保護不正検出手法の訓練にどのように役立つかを示すとともに,データセットの有用性と利用事例を評価した。
- 参考スコア(独自算出の注目度): 25.980165854663145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective fraud detection and analysis of government-issued identity documents, such as passports, driver's licenses, and identity cards, are essential in thwarting identity theft and bolstering security on online platforms. The training of accurate fraud detection and analysis tools depends on the availability of extensive identity document datasets. However, current publicly available benchmark datasets for identity document analysis, including MIDV-500, MIDV-2020, and FMIDV, fall short in several respects: they offer a limited number of samples, cover insufficient varieties of fraud patterns, and seldom include alterations in critical personal identifying fields like portrait images, limiting their utility in training models capable of detecting realistic frauds while preserving privacy. In response to these shortcomings, our research introduces a new benchmark dataset, IDNet, designed to advance privacy-preserving fraud detection efforts. The IDNet dataset comprises 837,060 images of synthetically generated identity documents, totaling approximately 490 gigabytes, categorized into 20 types from $10$ U.S. states and 10 European countries. We evaluate the utility and present use cases of the dataset, illustrating how it can aid in training privacy-preserving fraud detection methods, facilitating the generation of camera and video capturing of identity documents, and testing schema unification and other identity document management functionalities.
- Abstract(参考訳): パスポート、運転免許証、IDカードなどの政府発行のID文書の効果的な不正検出と分析は、オンラインプラットフォームにおけるID盗難の防止とセキュリティ強化に不可欠である。
正確な不正検出と分析ツールのトレーニングは、広範囲のIDドキュメントデータセットの可用性に依存する。
しかし、MIDV-500、MIDV-2020、FMIDVなどの現在の公開ベンチマークデータセットは、限られた数のサンプルを提供し、不正パターンの不十分なバリエーションをカバーし、ポートレートイメージのような重要な個人識別領域の変更をほとんど含んでおらず、プライバシーを保護しながら現実的な詐欺を検知する訓練モデルにおける彼らの有用性を制限している。
これらの欠点に対応するために,本研究では,プライバシ保護不正検出を推進すべく,新たなベンチマークデータセットであるIDNetを導入する。
IDNetデータセットは、合成生成されたID文書の837,060枚の画像で構成され、合計で490ギガバイトであり、米国10ドルと欧州10カ国から20種類に分類されている。
本稿では,プライバシ保護による不正検出方法のトレーニング,カメラの生成,アイデンティティドキュメントのキャプチャ,スキーマ統一やその他のIDドキュメント管理機能のテストなど,データセットの有用性と利用事例を評価した。
関連論文リスト
- Synthetic dataset of ID and Travel Document [1.9296797946506603]
本稿では,SIDTDと呼ばれる,IDおよび旅行用文書の合成データセットを提案する。
SIDTDデータセットは、偽ID文書検出システムのトレーニングと評価を支援するために作成されている。
論文 参考訳(メタデータ) (2024-01-03T18:06:28Z) - Open-Set: ID Card Presentation Attack Detection using Neural Transfer
Style [2.946386240942919]
本研究は,4つのGANを用いた画像翻訳モデルを用いて,サンプルの生成を改善するために,IDカード提示攻撃装置(PAI)について検討する。
印刷攻撃では0.63%,スクリーンキャプチャ攻撃では0.29%,EER性能は0.29%向上した。
論文 参考訳(メタデータ) (2023-12-21T16:28:08Z) - Diff-Privacy: Diffusion-based Face Privacy Protection [58.1021066224765]
本稿では,Diff-Privacyと呼ばれる拡散モデルに基づく顔のプライバシー保護手法を提案する。
具体的には、提案したマルチスケール画像インバージョンモジュール(MSI)をトレーニングし、元の画像のSDMフォーマット条件付き埋め込みのセットを得る。
本研究は,条件付き埋め込みに基づいて,組込みスケジューリング戦略を設計し,デノナイズプロセス中に異なるエネルギー関数を構築し,匿名化と視覚的アイデンティティ情報隠蔽を実現する。
論文 参考訳(メタデータ) (2023-09-11T09:26:07Z) - Synthetic ID Card Image Generation for Improving Presentation Attack
Detection [12.232059909207578]
本研究は,不正検出ネットワークを訓練しながら,データ量を増やすために,IDカード画像を合成的に生成する3つの手法について検討する。
以上の結果から, PAIS (Print/Scan Presentation Attack Instrument Species) の性能低下や, PAIS (Sing/Scan Presentation Instrument Species) の性能低下を伴わずに, 合成画像でデータベースを補足できることが示唆された。
論文 参考訳(メタデータ) (2022-10-31T19:07:30Z) - Unsupervised Text Deidentification [101.2219634341714]
個人識別情報を漏洩する単語を隠蔽する教師なしの識別手法を提案する。
K匿名性に基づくプライバシによって動機づけられた私たちは、最小の再識別ランクを保証するリアクションを生成します。
論文 参考訳(メタデータ) (2022-10-20T18:54:39Z) - Protecting Celebrities with Identity Consistency Transformer [119.67996461810304]
アイデンティティ一貫性変換器は、高度なセマンティクス、特にアイデンティティ情報に焦点を当て、内面領域と外面領域におけるアイデンティティの不整合を見つけ、容疑者の顔を検出する。
我々は、アイデンティティ一貫性変換器が、異なるデータセットにまたがるだけでなく、ディープフェイクビデオを含む現実世界のアプリケーションで見られる様々な種類の画像劣化フォームにまたがる優れた一般化能力を示すことを示した。
論文 参考訳(メタデータ) (2022-03-02T18:59:58Z) - MIDV-2020: A Comprehensive Benchmark Dataset for Identity Document
Analysis [48.35030471041193]
MIDV-2020は1000の動画クリップ、2000のスキャン画像、1000のユニークなモックIDドキュメントの写真で構成されている。
72409の注釈付き画像により、提案されたデータセットは公開日までで最大の公開IDドキュメントデータセットである。
論文 参考訳(メタデータ) (2021-07-01T12:14:17Z) - Source Printer Identification from Document Images Acquired using
Smartphone [14.889347839830092]
我々は,文字画像とプリンタ固有のノイズ残差の融合から,単一のCNNモデルを学習することを提案する。
提案手法は,5x2クロスバリデーション手法を用いて,文字「e」の画像を用いた98.42%の文書分類精度を実現する。
論文 参考訳(メタデータ) (2020-03-27T18:59:32Z) - Towards Face Encryption by Generating Adversarial Identity Masks [53.82211571716117]
敵の識別マスクを生成するためのターゲットID保護反復法(TIP-IM)を提案する。
TIP-IMは、様々な最先端の顔認識モデルに対して95%以上の保護成功率を提供する。
論文 参考訳(メタデータ) (2020-03-15T12:45:10Z) - Intra-Camera Supervised Person Re-Identification [87.88852321309433]
本稿では,カメラごとの個人識別アノテーションに基づく新しい人物識別パラダイムを提案する。
これにより、最も時間がかかり、面倒なカメラ間IDラベリングプロセスがなくなる。
MATE(Multi-tAsk mulTi-labEl)Deep Learning method for intra-Camera Supervised (ICS) person re-id。
論文 参考訳(メタデータ) (2020-02-12T15:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。