論文の概要: G-MSGINet: A Grouped Multi-Scale Graph-Involution Network for Contactless Fingerprint Recognition
- arxiv url: http://arxiv.org/abs/2505.08233v2
- Date: Wed, 14 May 2025 06:16:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 13:24:43.917686
- Title: G-MSGINet: A Grouped Multi-Scale Graph-Involution Network for Contactless Fingerprint Recognition
- Title(参考訳): G-MSGINet:コンタクトレス指紋認識のためのマルチスケールグラフ畳み込みネットワーク
- Authors: Santhoshkumar Peddi, Soham Bandyopadhyay, Debasis Samanta,
- Abstract要約: G-MSGINetは、接触レス指紋認識のための統一されたフレームワークである。
生の入力画像から直接、微妙な局所化とアイデンティティの埋め込みを共同で行う。
3つのベンチマークデータセットの大規模な実験は、G-MSGINetが97.0%から99.1%の範囲で0.83pm0.02$、ランク1の識別精度で一貫してF1スコアを達成していることを示している。
- 参考スコア(独自算出の注目度): 20.458766184257147
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper presents G-MSGINet, a unified and efficient framework for robust contactless fingerprint recognition that jointly performs minutiae localization and identity embedding directly from raw input images. Existing approaches rely on multi-branch architectures, orientation labels, or complex preprocessing steps, which limit scalability and generalization across real-world acquisition scenarios. In contrast, the proposed architecture introduces the GMSGI layer, a novel computational module that integrates grouped pixel-level involution, dynamic multi-scale kernel generation, and graph-based relational modelling into a single processing unit. Stacked GMSGI layers progressively refine both local minutiae-sensitive features and global topological representations through end-to-end optimization. The architecture eliminates explicit orientation supervision and adapts graph connectivity directly from learned kernel descriptors, thereby capturing meaningful structural relationships among fingerprint regions without fixed heuristics. Extensive experiments on three benchmark datasets, namely PolyU, CFPose, and Benchmark 2D/3D, demonstrate that G-MSGINet consistently achieves minutiae F1-scores in the range of $0.83\pm0.02$ and Rank-1 identification accuracies between 97.0% and 99.1%, while maintaining an Equal Error Rate (EER) as low as 0.5%. These results correspond to improvements of up to 4.8% in F1-score and 1.4% in Rank-1 accuracy when compared to prior methods, using only 0.38 million parameters and 6.63 giga floating-point operations, which represents up to ten times fewer parameters than competitive baselines. This highlights the scalability and effectiveness of G-MSGINet in real-world contactless biometric recognition scenarios.
- Abstract(参考訳): 本稿では,G-MSGINetについて述べる。G-MSGINetは,原画像から直接,微妙な局所化とアイデンティティの埋め込みを共同で行う,堅牢な接触指紋認識のための統一的で効率的なフレームワークである。
既存のアプローチは、マルチブランチアーキテクチャ、指向ラベル、複雑な前処理ステップに依存しており、現実の取得シナリオにおけるスケーラビリティと一般化を制限している。
対照的に,提案アーキテクチャでは,グループ化ピクセルレベルのインボリューション,動的マルチスケールカーネル生成,グラフベースのリレーショナルモデリングを単一の処理ユニットに統合する新しい計算モジュールであるGMSGI層を導入している。
積層GMSGI層は、エンド・ツー・エンドの最適化により局所的な微妙な特徴とグローバルなトポロジカル表現の両方を徐々に洗練する。
このアーキテクチャは、明示的な配向の監督を排除し、学習されたカーネル記述子から直接グラフ接続を適用し、固定されたヒューリスティクスを使わずに指紋領域間の有意義な構造的関係をキャプチャする。
PolyU, CFPose, Benchmark 2D/3D の3つのベンチマークデータセットに対する大規模な実験により、G-MSGINet は 0.83\pm0.02$ と Rank-1 の識別精度を 97.0% から 99.1% の範囲で一貫して達成し、EER (Equal Error Rate) は 0.5% と低い。
これらの結果は、F1スコアの最大4.8%、従来の手法と比較してランク1の精度1.4%の改善に対応しており、競合ベースラインの最大10倍のパラメータである0.38万のパラメータと6.63ギガの浮動小数点演算しか使用していない。
これは、現実世界の接触のない生体認証シナリオにおけるG-MSGINetのスケーラビリティと有効性を強調している。
関連論文リスト
- Grasp the Graph (GtG) 2.0: Ensemble of GNNs for High-Precision Grasp Pose Detection in Clutter [2.812395851874055]
本稿では,仮説とテストのロボティクス把握フレームワークであるGrasp the Graph 2.0 (GtG 2.0)を紹介する。
ポイントクラウドデータからの効率的な幾何学的推論には、グラフニューラルネットワークのアンサンブルを使用する。
GtG 2.0は、仮説とテスト、グラフニューラルネットワークベースの手法と比較して、GraspNet-1Billionベンチマークの平均精度が35%向上している。
論文 参考訳(メタデータ) (2025-05-05T14:14:32Z) - Dual-Individual Genetic Algorithm: A Dual-Individual Approach for Efficient Training of Multi-Layer Neural Networks [0.0]
本稿では,二元画像分類タスクのためのニューラルネットワークを最適化する改良された遺伝的アルゴリズムを提案する。
Dual-Individual Genetic Algorithmはクロスオーバーのために2つの個人を雇い、リーダーとフォロワーという2つのパラメータセットで表現している。
実験の結果、Dual-Individual GAは、アーキテクチャを持つ3層ネットワーク上で、99.04%のトレーニング精度と80%のテスト精度(コスト=0.034)を達成することが示された。
論文 参考訳(メタデータ) (2025-04-24T08:04:08Z) - G-OSR: A Comprehensive Benchmark for Graph Open-Set Recognition [54.45837774534411]
ノードレベルとグラフレベルの両方でグラフオープンセット認識(GOSR)手法を評価するベンチマークである textbfG-OSR を導入する。
結果は、現在のGOSR手法の一般化可能性と限界に関する重要な洞察を与える。
論文 参考訳(メタデータ) (2025-03-01T13:02:47Z) - GG-SSMs: Graph-Generating State Space Models [18.718025325906762]
State Space Models (SSM) は、コンピュータビジョンと時系列分析ドメインのシーケンシャルデータをモデリングするための強力なツールである。
グラフ生成状態空間モデル(GG-SSM)は,特徴関係に基づいたグラフを動的に構築することにより,これらの制約を克服する新しいフレームワークである。
我々は、イベントベースのアイトラッキング、画像ネット分類、光フロー推定、および6つの時系列データセットを含む11の多様なデータセット上でGG-SSMを検証する。
論文 参考訳(メタデータ) (2024-12-17T00:07:29Z) - Part-aware Unified Representation of Language and Skeleton for Zero-shot Action Recognition [57.97930719585095]
本稿では,PURLS(Part-aware Unified Representation between Language and Skeleton)を紹介する。
本手法はスケルトン/言語のバックボーンと3つの大規模データセットを用いて評価する。
その結果、PURLSの普遍性と優れた性能を示し、以前のスケルトンベースのソリューションと他のドメインからの標準ベースラインを上回った。
論文 参考訳(メタデータ) (2024-06-19T08:22:32Z) - Integrative Graph-Transformer Framework for Histopathology Whole Slide Image Representation and Classification [18.16710321320098]
デジタル病理学において、MIL(Multiple Case Learning)戦略は、弱い教師付き病理組織像全体(WSI)分類タスクにおいて広く用いられている。
既存の注意に基づくMILアプローチは、しばしば隣接する組織タイル間のコンテキスト情報や本質的な空間的関係を見落としている。
本稿では、文脈対応リレーショナル特徴とグローバルWSI表現を同時にキャプチャする統合グラフ変換フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-26T22:31:05Z) - Histopathology Whole Slide Image Analysis with Heterogeneous Graph
Representation Learning [78.49090351193269]
本稿では,WSI分析のために,異なる種類の核間の相互関係を利用する新しいグラフベースのフレームワークを提案する。
具体的には、WSI を各ノードに "nucleus-type" 属性と各エッジに類似した意味属性を持つ異種グラフとして定式化する。
我々のフレームワークは、様々なタスクに対してかなりのマージンで最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-07-09T14:43:40Z) - Interactive Segmentation as Gaussian Process Classification [58.44673380545409]
クリックベースのインタラクティブセグメンテーション(IS)は、ユーザインタラクション下で対象オブジェクトを抽出することを目的としている。
現在のディープラーニング(DL)ベースの手法のほとんどは、主にセマンティックセグメンテーションの一般的なパイプラインに従っている。
本稿では,各画像上でガウス過程(GP)に基づく画素単位のバイナリ分類モデルとしてISタスクを定式化することを提案する。
論文 参考訳(メタデータ) (2023-02-28T14:01:01Z) - EGRC-Net: Embedding-induced Graph Refinement Clustering Network [66.44293190793294]
埋め込みによるグラフリファインメントクラスタリングネットワーク (EGRC-Net) という新しいグラフクラスタリングネットワークを提案する。
EGRC-Netは学習した埋め込みを利用して初期グラフを適応的に洗練し、クラスタリング性能を向上させる。
提案手法はいくつかの最先端手法より一貫して優れている。
論文 参考訳(メタデータ) (2022-11-19T09:08:43Z) - Cross-Domain Facial Expression Recognition: A Unified Evaluation
Benchmark and Adversarial Graph Learning [85.6386289476598]
我々は,クロスドメイン全体的特徴共適応のための新しい逆グラフ表現適応(AGRA)フレームワークを開発した。
我々は,いくつかの一般的なベンチマークで広範囲かつ公平な評価を行い,提案したAGRAフレームワークが従来の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-03T15:00:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。