論文の概要: Alpha Divergence Losses for Biometric Verification
- arxiv url: http://arxiv.org/abs/2511.13621v1
- Date: Mon, 17 Nov 2025 17:27:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 18:52:09.637692
- Title: Alpha Divergence Losses for Biometric Verification
- Title(参考訳): 生体認証のためのAlpha Divergence Losses
- Authors: Dimitrios Koutsianos, Ladislav Mosner, Yannis Panagakis, Themos Stafylakis,
- Abstract要約: $$$-divergence loss関数は、CosFaceやArcFaceのようなマージンベースのSoftmax損失に代わる魅力的な代替手段を提供する。
本稿では,Q-MarginとA3Mの2つの新しいマージンベース$$-divergence損失について検討する。
本手法は,IJB-BとIJB-Cの顔評価ベンチマークにおいて,高い性能向上を実現している。
- 参考スコア(独自算出の注目度): 19.758259380263528
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Performance in face and speaker verification is largely driven by margin based softmax losses like CosFace and ArcFace. Recently introduced $α$-divergence loss functions offer a compelling alternative, particularly for their ability to induce sparse solutions (when $α>1$). However, integrating an angular margin-crucial for verification tasks-is not straightforward. We find this integration can be achieved in at least two distinct ways: via the reference measure (prior probabilities) or via the logits (unnormalized log-likelihoods). In this paper, we explore both pathways, deriving two novel margin-based $α$-divergence losses: Q-Margin (margin in the reference measure) and A3M (margin in the logits). We identify and address a critical training instability in A3M-caused by the interplay of penalized logits and sparsity-with a simple yet effective prototype re-initialization strategy. Our methods achieve significant performance gains on the challenging IJB-B and IJB-C face verification benchmarks. We demonstrate similarly strong performance in speaker verification on VoxCeleb. Crucially, our models significantly outperform strong baselines at low false acceptance rates (FAR). This capability is crucial for practical high-security applications, such as banking authentication, when minimizing false authentications is paramount.
- Abstract(参考訳): 顔と話者の検証のパフォーマンスは、CosFaceやArcFaceのようなマージンベースのソフトマックスの損失に大きく左右される。
最近導入された$α$分割損失関数は、特にスパース解を誘導する能力($α>1$)のために、魅力的な代替手段を提供する。
しかし、検証タスクに角の辺縁検定を組み込むことは簡単ではない。
この積分は、基準測度(事前確率)またはロジット(非正規化ログ類似度)を介して、少なくとも2つの異なる方法で達成できる。
本稿では, 両経路を探索し, Q-Margin(基準尺度におけるマージン)とA3M(ロジットにおけるマージン)の2つの新しいマージンベースの$α$-divergence損失を導出した。
ペナル化ロジットとスパーシティーの相互行為によるA3Mの臨界トレーニング不安定性を,シンプルで効果的なプロトタイプ再初期化戦略を用いて同定し,対処する。
本手法は,IJB-BとIJB-Cの顔評価ベンチマークにおいて,高い性能向上を実現している。
同様に,VoxCeleb上での話者検証においても高い性能を示す。
重要なことは、我々のモデルは偽受け入れ率(FAR)で強いベースラインを著しく上回ります。
この機能は、偽認証を最小化することが最重要である場合、銀行認証のような実用的な高セキュリティアプリケーションにとって重要である。
関連論文リスト
- CLUE: Non-parametric Verification from Experience via Hidden-State Clustering [64.50919789875233]
隠れアクティベーションの軌跡内の幾何的に分離可能なシグネチャとして解の正しさが符号化されていることを示す。
ClUE は LLM-as-a-judge ベースラインを一貫して上回り、候補者の再選において近代的な信頼に基づく手法に適合または超えている。
論文 参考訳(メタデータ) (2025-10-02T02:14:33Z) - R-Stitch: Dynamic Trajectory Stitching for Efficient Reasoning [80.104336426172]
CoT(Chain-of- Thought)は、大規模言語モデルの問題解決能力を高める。
CoTは長い自己回帰軌道のためにかなりの推論コストを発生させる。
トレーニング不要なハイブリッドデコーディングフレームワークであるR-Stitchを紹介する。
論文 参考訳(メタデータ) (2025-07-23T08:14:36Z) - LH2Face: Loss function for Hard High-quality Face [2.9307424859610447]
ほとんどの顔認識アルゴリズムは、ソフトマックス分類とコサイン類似性に基づいている。
ハードハイクオリティフェイス(LH2Face)のためのロス関数という新しいロス関数の提案
我々のLH2Faceは、ハードな高品質の顔データセットのスキームよりも優れており、IJB-Bデータセットの49.39%の精度を実現している。
論文 参考訳(メタデータ) (2025-06-30T06:59:02Z) - Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs [71.7892165868749]
LLM(Commercial Large Language Model) APIは基本的な信頼の問題を生み出します。
ユーザーは特定のモデルに課金するが、プロバイダが忠実に提供できることを保証することはない。
我々は,このモデル置換問題を定式化し,現実的な逆条件下での検出方法を評価する。
我々は,信頼された実行環境(TEE)を実用的で堅牢なソリューションとして使用し,評価する。
論文 参考訳(メタデータ) (2025-04-07T03:57:41Z) - Expressive Losses for Verified Robustness via Convex Combinations [67.54357965665676]
本研究では, 過近似係数と異なる表現的損失に対する性能分布の関係について検討した。
表現性が不可欠である一方で、最悪の場合の損失のより良い近似は、必ずしも優れた堅牢性-正確性トレードオフに結びついていないことを示す。
論文 参考訳(メタデータ) (2023-05-23T12:20:29Z) - Certifiably Robust Interpretation via Renyi Differential Privacy [77.04377192920741]
我々はRenyi差分プライバシー(RDP)の新しい視点から解釈堅牢性の問題を研究する。
まず、証明可能で証明可能なトップ$k$ロバスト性を提供する。
第二に、提案手法は既存の手法よりも実験的堅牢性を$sim10%$で提供する。
第3に,ロバスト性と計算効率のトレードオフを円滑に行うことができる。
論文 参考訳(メタデータ) (2021-07-04T06:58:01Z) - NPT-Loss: A Metric Loss with Implicit Mining for Face Recognition [28.773161837693344]
深層畳み込みニューラルネットワーク(dcnns)を用いた顔認識は近年目覚ましい成功を収めている。
DCNNベースのFRの重要な要素の1つは、さまざまなアイデンティティ間の識別を保証する損失関数の適切な設計です。
本稿では,プロキシによる三重項損失に相当する新しい損失と,ハード負のマイニングの暗黙のメカニズムを提案する。
論文 参考訳(メタデータ) (2021-03-05T07:26:40Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。