論文の概要: DiffVein: A Unified Diffusion Network for Finger Vein Segmentation and
Authentication
- arxiv url: http://arxiv.org/abs/2402.02060v1
- Date: Sat, 3 Feb 2024 06:49:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 22:27:22.201501
- Title: DiffVein: A Unified Diffusion Network for Finger Vein Segmentation and
Authentication
- Title(参考訳): DiffVein: 指静脈分割と認証のための統合拡散ネットワーク
- Authors: Yanjun Liu, Wenming Yang and Qingmin Liao
- Abstract要約: DiffVeinは、静脈分割と認証タスクを同時に処理する統合拡散モデルベースのフレームワークである。
これら2つのブランチ間の機能相互作用を改善するために,2つの特別なモジュールを導入する。
このようにして、我々のフレームワークは拡散とセグメンテーションの埋め込みの間の動的相互作用を可能にする。
- 参考スコア(独自算出の注目度): 50.017055360261665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Finger vein authentication, recognized for its high security and specificity,
has become a focal point in biometric research. Traditional methods
predominantly concentrate on vein feature extraction for discriminative
modeling, with a limited exploration of generative approaches. Suffering from
verification failure, existing methods often fail to obtain authentic vein
patterns by segmentation. To fill this gap, we introduce DiffVein, a unified
diffusion model-based framework which simultaneously addresses vein
segmentation and authentication tasks. DiffVein is composed of two dedicated
branches: one for segmentation and the other for denoising. For better feature
interaction between these two branches, we introduce two specialized modules to
improve their collective performance. The first, a mask condition module,
incorporates the semantic information of vein patterns from the segmentation
branch into the denoising process. Additionally, we also propose a Semantic
Difference Transformer (SD-Former), which employs Fourier-space self-attention
and cross-attention modules to extract category embedding before feeding it to
the segmentation task. In this way, our framework allows for a dynamic
interplay between diffusion and segmentation embeddings, thus vein segmentation
and authentication tasks can inform and enhance each other in the joint
training. To further optimize our model, we introduce a Fourier-space
Structural Similarity (FourierSIM) loss function, which is tailored to improve
the denoising network's learning efficacy. Extensive experiments on the USM and
THU-MVFV3V datasets substantiates DiffVein's superior performance, setting new
benchmarks in both vein segmentation and authentication tasks.
- Abstract(参考訳): 高セキュリティと特異性で認識されている指静脈認証は、生体計測研究の焦点となっている。
伝統的な手法は、主に識別的モデリングのための静脈の特徴抽出に集中し、生成的アプローチを限定的に探究する。
検証の失敗に苦しむため、既存の方法はしばしばセグメンテーションによって真正の静脈パターンを得ることができない。
このギャップを埋めるために、静脈分割と認証タスクを同時に扱う統合拡散モデルベースのフレームワークであるDiffVeinを紹介する。
diffveinはセグメンテーションのための1つとデノーミングのためのもう1つの2つの専用ブランチから構成されている。
これら2つのブランチ間の機能的相互作用を改善するために,2つの特別なモジュールを導入する。
第1のマスク条件モジュールは、セグメンテーションブランチからの静脈パターンの意味情報をデノナイズ処理に組み込む。
さらに,セグメンテーションタスクに投入する前にカテゴリ埋め込みを抽出するために,フーリエ空間自己アテンションとクロスアテンションモジュールを用いた意味差トランスフォーマ(sd-former)を提案する。
このようにして,このフレームワークは拡散とセグメンテーションの動的相互作用を可能にするので,静脈セグメンテーションと認証タスクは協調学習において相互に情報を与え,強化することができる。
このモデルをさらに最適化するために,ネットワークの学習効率を向上させるために,Fourier-space Structure similarity (FourierSIM)損失関数を導入する。
USMとTHU-MVFV3Vデータセットに関する大規模な実験は、DiffVeinの優れたパフォーマンスを裏付け、静脈セグメンテーションと認証タスクの両方に新しいベンチマークを設定する。
関連論文リスト
- Coarse-to-Fine Proposal Refinement Framework for Audio Temporal Forgery Detection and Localization [60.899082019130766]
本稿では、フレームレベル検出ネットワーク(FDN)と、音声の時間的偽造検出とローカライゼーションのための改良ネットワーク(PRN)を提案する。
FDNは、偽のフレーム間で情報的不整合の手がかりを抽出し、偽の領域を大まかに示すのに有用な識別的特徴を得る。
PRNは、FDNから派生した粗粒度の提案を洗練するために、信頼スコアと回帰オフセットを予測する責任がある。
論文 参考訳(メタデータ) (2024-07-23T15:07:52Z) - HiDiff: Hybrid Diffusion Framework for Medical Image Segmentation [16.906987804797975]
HiDiffは医療画像セグメンテーションのためのハイブリッド拡散フレームワークである。
既存の識別的セグメンテーションモデルと新しい生成的拡散モデルの強みを相乗化することができる。
小さなオブジェクトをセグメンテーションし、新しいデータセットに一般化する。
論文 参考訳(メタデータ) (2024-07-03T23:59:09Z) - Denoising Diffusion Semantic Segmentation with Mask Prior Modeling [61.73352242029671]
本稿では,従来の識別的アプローチのセマンティックセグメンテーション品質を,デノナイズ拡散生成モデルでモデル化したマスクを用いて改善することを提案する。
市販セグメンタを用いた先行モデルの評価を行い,ADE20KとCityscapesの実験結果から,本手法が競争力のある定量的性能を実現することを示す。
論文 参考訳(メタデータ) (2023-06-02T17:47:01Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z) - DOAD: Decoupled One Stage Action Detection Network [77.14883592642782]
人々をローカライズし、ビデオからアクションを認識することは、ハイレベルなビデオ理解にとって難しい課題だ。
既存の手法は主に2段階ベースで、1段階は人物境界ボックス生成、もう1段階は行動認識を行う。
本稿では、時間的行動検出の効率を向上させるために、DOADと呼ばれる分離したワンステージネットワークを提案する。
論文 参考訳(メタデータ) (2023-04-01T08:06:43Z) - Part-guided Relational Transformers for Fine-grained Visual Recognition [59.20531172172135]
識別的特徴を学習し,特徴変換モジュールとの相関関係を探索するフレームワークを提案する。
提案手法は,3-of-the-levelオブジェクト認識において,部分ブランチの追加に頼らず,最先端の性能に達する。
論文 参考訳(メタデータ) (2022-12-28T03:45:56Z) - GaitStrip: Gait Recognition via Effective Strip-based Feature
Representations and Multi-Level Framework [34.397404430838286]
本稿では,様々なレベルの歩行情報を抽出するために,GaitStripという名前のストリップベースマルチレベル歩行認識ネットワークを提案する。
具体的には、私たちの高レベルブランチは歩行シーケンスのコンテキストを探求し、低レベルブランチは詳細な姿勢変化に焦点を当てています。
我々のGaitStripは、通常の歩行条件と複雑な歩行条件の両方において最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-03-08T09:49:48Z) - Label-Efficient Semantic Segmentation with Diffusion Models [27.01899943738203]
拡散モデルは意味的セグメンテーションの道具としても機能することを示した。
特に、いくつかの事前訓練拡散モデルに対して、逆拡散過程のマルコフステップを実行するネットワークからの中間活性化について検討する。
これらのアクティベーションは、入力画像から意味情報を効果的にキャプチャし、セグメンテーション問題に対して優れたピクセルレベルの表現であることを示す。
論文 参考訳(メタデータ) (2021-12-06T15:55:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。