論文の概要: GAFSV-Net: A Vision Framework for Online Signature Verification
- arxiv url: http://arxiv.org/abs/2605.00120v1
- Date: Thu, 30 Apr 2026 18:21:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.705305
- Title: GAFSV-Net: A Vision Framework for Online Signature Verification
- Title(参考訳): GAFSV-Net:オンライン署名検証のためのビジョンフレームワーク
- Authors: Himanshu Singhal, Suresh Sundaram,
- Abstract要約: ImageSV-Netは、各シグネチャを6チャンネルの非対称なグラミアン角野画像SV-Netとして表現する。
デュアルブランチのConvNeXt-TinyエンコーダはGASFとGADFを独立して処理する。
We evaluate on DeepSignDB and BiosecurID, outform all sequence-based baselines training under same objectives。
- 参考スコア(独自算出の注目度): 6.4768782466318795
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online signature verification (OSV) requires distinguishing skilled forgeries from genuine samples under high intra-class variability and with very few enrollment samples. Existing deep learning methods operate directly on raw temporal sequences, restricting them to 1D architectures and preventing the use of pretrained 2D vision backbones. We bridge this gap with GAFSV-Net, which represents each signature as a six-channel asymmetric Gramian Angular Field image: three kinematic channels (pen speed, pressure derivative, direction angle) are each encoded into complementary GASF and GADF matrices that capture pairwise temporal co-occurrence and directional transition structure respectively. A dual-branch ConvNeXt-Tiny encoder processes GASF and GADF independently, with bidirectional cross-attention enabling each branch to query discriminative patterns from the other before metric-space projection. Training uses semi-hard triplet loss with skilled-forgery hard-negative injection; verification is performed via cosine similarity against a small enrollment prototype. We evaluate on DeepSignDB and BiosecurID, outperforming all sequence-based baselines trained under identical objectives, demonstrating that the representational gain of 2D temporal encoding is consistent and independent of training procedure, with ablations characterising each design choice's contribution.
- Abstract(参考訳): オンラインシグネチャ検証 (OSV) では, 高いクラス内変動率と極めて少ない登録サンプルで, 本物のサンプルと熟練した偽造品を区別する必要がある。
既存のディープラーニング手法は、生の時間的シーケンスを直接操作し、1Dアーキテクチャに制限し、事前訓練された2Dビジョンバックボーンの使用を防止する。
3つのキネマティックチャネル (ペン速度, 圧力微分, 方向角) をそれぞれ相補的GASFおよびGADF行列に符号化し, 対側的共起および方向遷移構造を捉える。
二重ブランチのConvNeXt-TinyエンコーダはGASFとGADFを独立に処理し、各ブランチが距離空間投影の前に互いに識別パターンをクエリできる双方向のクロスアテンションを実現する。
訓練は半硬度三重項損失と熟練鍛造型硬陰性注射を用いて行われ、小入学者の試作機に対してコサイン類似性によって検証が行われる。
We evaluate on DeepSignDB and BiosecurID, out outperform all sequence-based baselines under identical objectives, demonstrated that the representational gain of 2D temporal encoding is consistent and independent of training procedure, with ablations which each design choice's contribution。
関連論文リスト
- End-to-End Training for Unified Tokenization and Latent Denoising [82.91537591286554]
統一トークン化と潜伏拡散のためのオートエンコーダアーキテクチャUNITEを提案する。
UNITEは、画像トークン化器と重量共有による潜伏ジェネレータの両方として機能するジェネレータで構成されている。
トークン化とスクラッチ生成の単一段階共同訓練が実現可能であることを示す。
論文 参考訳(メタデータ) (2026-03-23T17:59:49Z) - DiffGRM: Diffusion-based Generative Recommendation Model [63.35379395455103]
ジェネレーティブレコメンデーション(GR)は、トークン化器を介して各項目をn桁のセマンティックID(SID)として表現する新興パラダイムである。
自己回帰デコーダをマスク付き離散拡散モデル(MDM)に置き換える拡散ベースGRモデルDiffGRMを提案する。
実験では、複数のデータセットに対する強力な生成的および差別的推奨ベースラインよりも一貫した利得を示す。
論文 参考訳(メタデータ) (2025-10-21T03:23:32Z) - SG-XDEAT: Sparsity-Guided Cross-Dimensional and Cross-Encoding Attention with Target-Aware Conditioning in Tabular Learning [0.0]
本稿では,表データの教師あり学習のための新しいフレームワークであるSG-XDEATを提案する。
中心となるSG-XDEATはデュアルストリームエンコーダを使用し、各入力機能を2つの並列表現に分解する。
これらの双対表現は、注意に基づくモジュールの階層的なスタックを通して伝播される。
論文 参考訳(メタデータ) (2025-10-14T15:56:40Z) - BEAST: Efficient Tokenization of B-Splines Encoded Action Sequences for Imitation Learning [24.858548048614878]
B-spline Encoded Action Sequence Tokenizer (BEAST)について述べる。
BEAST は B-splines を用いて、アクションシーケンスをコンパクトな離散トークンまたは連続トークンにエンコードする。
BEASTは166のシミュレーションタスクと8つの実世界のタスクからなる3つの異なるロボット設定からなる3つの確立されたベンチマークで評価した。
論文 参考訳(メタデータ) (2025-06-06T13:26:16Z) - S^2Former-OR: Single-Stage Bi-Modal Transformer for Scene Graph Generation in OR [50.435592120607815]
外科手術のシーングラフ生成(SGG)は、手術室(OR)におけるホモロジー認知知能の増強に不可欠である
これまでの研究は主に多段階学習に依存しており、生成したセマンティックシーングラフはポーズ推定とオブジェクト検出を伴う中間プロセスに依存している。
本研究では,S2Former-OR(S2Former-OR)と呼ばれるORにおけるSGGのための新しいシングルステージバイモーダルトランスフォーマフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-22T11:40:49Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - SURDS: Self-Supervised Attention-guided Reconstruction and Dual Triplet
Loss for Writer Independent Offline Signature Verification [16.499360910037904]
オフライン署名検証(英: Offline Signature Verification、OSV)は、法学、商業、法学の様々な分野における基本的な生体計測の課題である。
著者に依存しないOSVにおける自己教師付き表現学習とメートル法学習を活用する2段階のディープラーニングフレームワークを提案する。
提案したフレームワークは2つのオフライン署名データセットで評価され、様々な最先端の手法と比較されている。
論文 参考訳(メタデータ) (2022-01-25T07:26:55Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。