論文の概要: A Unified Framework for Iris Anti-Spoofing: Introducing IrisGeneral Dataset and Masked-MoE Method
- arxiv url: http://arxiv.org/abs/2408.09752v1
- Date: Mon, 19 Aug 2024 07:24:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-08-20 17:24:19.911653
- Title: A Unified Framework for Iris Anti-Spoofing: Introducing IrisGeneral Dataset and Masked-MoE Method
- Title(参考訳): Iris アンチスプーフィングのための統一フレームワーク: Iris General データセットの導入と Masked-MoE 法
- Authors: Hang Zou, Chenxi Du, Ajian Liu, Yuan Zhang, Jing Liu, Mingchuan Yang, Jun Wan, Hui Zhang,
- Abstract要約: IrisGeneralデータセットは、7つのデータベースに属する10のサブセットを含み、4つの機関が公開し、6種類のデバイスで収集する。
Iris Generalは、平均性能、断面積一般化、アイリスアンチスプーフィングモデルのクロスデバイス一般化の3つのプロトコルで設計されている。
- 参考スコア(独自算出の注目度): 19.797699153226382
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Iris recognition is widely used in high-security scenarios due to its stability and distinctiveness. However, the acquisition of iris images typically requires near-infrared illumination and near-infrared band filters, leading to significant and consistent differences in imaging across devices. This underscores the importance of developing cross-domain capabilities in iris anti-spoofing methods. Despite this need, there is no dataset available that comprehensively evaluates the generalization ability of the iris anti-spoofing task. To address this gap, we propose the IrisGeneral dataset, which includes 10 subsets, belonging to 7 databases, published by 4 institutions, collected with 6 types of devices. IrisGeneral is designed with three protocols, aimed at evaluating average performance, cross-racial generalization, and cross-device generalization of iris anti-spoofing models. To tackle the challenge of integrating multiple sub-datasets in IrisGeneral, we employ multiple parameter sets to learn from the various subsets. Specifically, we utilize the Mixture of Experts (MoE) to fit complex data distributions using multiple sub-neural networks. To further enhance the generalization capabilities, we introduce a novel method Masked-MoE (MMoE). It randomly masks a portion of tokens for some experts and requires their outputs to be similar to the unmasked experts, which improves the generalization ability and effectively mitigates the overfitting issue produced by MoE. We selected ResNet50, VIT-B/16, CLIP, and FLIP as representative models and benchmarked them on the IrisGeneral dataset. Experimental results demonstrate that our proposed MMoE with CLIP achieves the best performance on IrisGeneral.
- Abstract(参考訳): アイリス認識は、その安定性と特異性のために、高いセキュリティシナリオで広く使用されている。
しかし、虹彩画像の取得は通常、近赤外線照明と近赤外線帯域フィルタを必要とするため、デバイス間での撮像において顕著で一貫した違いが生じる。
このことは、アイリスアンチスプーフィング法におけるクロスドメイン機能開発の重要性を浮き彫りにする。
このようなニーズにもかかわらず、アイリスアンチスプーフィングタスクの一般化能力を包括的に評価するデータセットは存在しない。
このギャップに対処するために、IrisGeneralデータセットを提案する。IrisGeneralデータセットは、7つのデータベースに属する10のサブセットを含み、4つの機関が発行し、6種類のデバイスで収集する。
Iris Generalは、平均性能、断面積一般化、アイリスアンチスプーフィングモデルのクロスデバイス一般化の3つのプロトコルで設計されている。
IrisGeneralに複数のサブデータセットを統合するという課題に対処するために、我々は様々なサブセットから学習するために複数のパラメーターセットを使用します。
具体的には、Mixture of Experts (MoE)を用いて、複数のサブニューラルネットワークを用いて複雑なデータ分布を適合させる。
一般化機能をさらに強化するため,Masked-MoE (MMoE) という新しい手法を導入する。
ランダムに一部の専門家のトークンの一部を隠蔽し、そのアウトプットは未成熟の専門家に似ており、一般化能力を改善し、MoEが生み出す過度な問題を効果的に軽減する。
我々は、代表モデルとしてResNet50、VIT-B/16、CLIP、FLIPを選択し、それらをIrisGeneralデータセットでベンチマークした。
実験の結果,CLIPを用いたMMoEはIrisGeneral上で最高の性能を示した。
関連論文リスト
- GeMID: Generalizable Models for IoT Device Identification [4.029017464832905]
デバイス識別(DI)は、そのトラフィックパターンに基づいてIoTデバイスを識別する。
機械学習モデルを構築する既存のDIアプローチは、様々なネットワーク環境におけるモデル一般化可能性の課題を見落としていることが多い。
本稿では,この制限に対処する新しいフレームワークを提案し,異なるネットワーク環境において収集されたデータセット間のDIモデルの一般化性を評価する。
論文 参考訳(メタデータ) (2024-11-05T17:09:43Z) - Uni$^2$Det: Unified and Universal Framework for Prompt-Guided Multi-dataset 3D Detection [64.08296187555095]
Uni$2$Detは3D検出のための統一的で普遍的なマルチデータセットトレーニングのためのフレームワークである。
マルチデータセット3D検出のためのマルチステージプロンプトモジュールを提案する。
ゼロショットクロスデータセット転送の結果は,提案手法の一般化能力を検証する。
論文 参考訳(メタデータ) (2024-09-30T17:57:50Z) - MFCLIP: Multi-modal Fine-grained CLIP for Generalizable Diffusion Face Forgery Detection [64.29452783056253]
フォトリアリスティック・フェイスジェネレーション手法の急速な発展は、社会やアカデミックにおいて大きな関心を集めている。
既存のアプローチは主に画像モダリティを用いて顔の偽造パターンをキャプチャするが、きめ細かいノイズやテキストのような他のモダリティは完全には探索されていない。
そこで本研究では,画像ノイズの多点にわたる包括的かつきめ細かなフォージェリートレースをマイニングする,MFCLIP(MF-modal Fine-fine-fine-fine-fine-fine CLIP)モデルを提案する。
論文 参考訳(メタデータ) (2024-09-15T13:08:59Z) - All in One Framework for Multimodal Re-identification in the Wild [58.380708329455466]
オールインワン(AIO)という,ReID導入のためのマルチモーダル学習パラダイム
AIOは、凍結したトレーニング済みのビッグデータをエンコーダとして利用し、追加の微調整なしに効果的なマルチモーダル検索を可能にする。
クロスモーダルおよびマルチモーダルReIDの実験により、AIOは様々なモーダルデータを扱うだけでなく、困難な状況でも優れていることが明らかになった。
論文 参考訳(メタデータ) (2024-05-08T01:04:36Z) - Synthesizing Iris Images using Generative Adversarial Networks: Survey and Comparative Analysis [11.5164036021499]
本稿では,GANを用いた合成虹彩画像生成技術について概説する。
まず,合成虹彩生成に使用されてきた各種手法について検討し,StyleGAN,RaSGAN,CIT-GAN,iWarpGAN,StarGANなどに基づく発電機について検討した。
論文 参考訳(メタデータ) (2024-04-26T01:45:58Z) - BlendX: Complex Multi-Intent Detection with Blended Patterns [4.852816974803059]
BlendXは、前者よりも多様なパターンを特徴とする洗練されたデータセットのスイートです。
データセット構築には,ルールベースと生成ツール – OpenAIのChatGPT – の両方を使用します。
BlendXの実験によると、最先端のMIDモデルは、新しいデータセットがもたらす課題に苦戦している。
論文 参考訳(メタデータ) (2024-03-27T06:13:04Z) - An Open-World, Diverse, Cross-Spatial-Temporal Benchmark for Dynamic Wild Person Re-Identification [58.5877965612088]
人物再識別(ReID)は、データ駆動のディープラーニング技術のおかげで大きな進歩を遂げました。
既存のベンチマークデータセットには多様性がなく、これらのデータに基づいてトレーニングされたモデルは、動的なワイルドシナリオに対してうまく一般化できない。
OWDと呼ばれる新しいOpen-World, Diverse, Cross-Spatial-Temporalデータセットを開発した。
論文 参考訳(メタデータ) (2024-03-22T11:21:51Z) - Enhancing Mobile Face Anti-Spoofing: A Robust Framework for Diverse
Attack Types under Screen Flash [6.870705319423985]
顔認証システムを確保するためには、顔の偽造防止(FAS)が不可欠である。
ATR-FASと呼ばれる軽フラッシュ下での攻撃型頑健な対面防止フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-29T14:41:40Z) - Generalizable Metric Network for Cross-domain Person Re-identification [55.71632958027289]
クロスドメイン(ドメインの一般化)シーンは、Re-IDタスクにおいて課題となる。
既存のほとんどのメソッドは、すべてのドメインのドメイン不変またはロバストな機能を学ぶことを目的としています。
本稿では,サンプルペア空間における標本類似性を調べるために,GMN(Generalizable Metric Network)を提案する。
論文 参考訳(メタデータ) (2023-06-21T03:05:25Z) - Few-Shot Specific Emitter Identification via Deep Metric Ensemble
Learning [26.581059299453663]
本稿では,自動監視ブロードキャスト(ADS-B)信号を用いた航空機識別のための新しいFS-SEIを提案する。
特に,提案手法は特徴埋め込みと分類から成り立っている。
シミュレーションの結果,カテゴリごとのサンプル数が5以上であれば,提案手法の平均精度は98%以上であることがわかった。
論文 参考訳(メタデータ) (2022-07-14T01:09:22Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - META: Mimicking Embedding via oThers' Aggregation for Generalizable
Person Re-identification [68.39849081353704]
Domain Generalizable (DG) Person Re-identification (ReID)は、トレーニング時に対象のドメインデータにアクセスすることなく、見えないドメインをまたいでテストすることを目的としている。
本稿では,DG ReID のための OThers' Aggregation (META) を用いた Mimicking Embedding という新しい手法を提案する。
論文 参考訳(メタデータ) (2021-12-16T08:06:50Z) - Toward Accurate and Reliable Iris Segmentation Using Uncertainty
Learning [96.72850130126294]
高精度で信頼性の高いアイリスセグメンテーションのためのアイリスU変換器(アイリスUsformer)を提案する。
IrisUsformerの精度向上のために,位置感応操作と再パッケージング変圧器ブロックを採用することで精巧に設計する。
IrisUsformer は SOTA IrisParseNet の 35% MAC を用いて, セグメンテーション精度の向上を図っている。
論文 参考訳(メタデータ) (2021-10-20T01:37:19Z) - Unsupervised and self-adaptative techniques for cross-domain person
re-identification [82.54691433502335]
非重複カメラにおける人物再識別(ReID)は難しい課題である。
Unsupervised Domain Adaptation(UDA)は、ソースで訓練されたモデルから、IDラベルアノテーションなしでターゲットドメインへの機能学習適応を実行するため、有望な代替手段です。
本稿では,新しいオフライン戦略によって生成されたサンプルのトリプレットを利用する,UDAベースのReID手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T23:58:39Z) - Generalized Iris Presentation Attack Detection Algorithm under
Cross-Database Settings [63.90855798947425]
プレゼンテーションアタックは、バイオメトリックなモダリティの大部分に大きな課題をもたらす。
本稿では,汎用的な深層学習に基づくプレゼンテーション攻撃検出ネットワークであるMVANetを提案する。
これはハイブリッドアルゴリズムの単純さと成功、あるいは複数の検出ネットワークの融合にインスパイアされている。
論文 参考訳(メタデータ) (2020-10-25T22:42:27Z) - On Benchmarking Iris Recognition within a Head-mounted Display for AR/VR
Application [16.382021536377437]
我々は、ヘッドマウントディスプレイ(HMD)に適した虹彩認識アルゴリズムのセットを評価する。
我々は最近開発されたミニチュアセグメンテーションモデル(EyeMMS)を用いて虹彩のセグメンテーションを行っている。
アイリス認識の性能に感銘を受けて,HMDにおける非協調的なキャプチャ設定において,ユーザの継続的な認証を提案する。
論文 参考訳(メタデータ) (2020-10-20T17:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。