論文の概要: Are Face Embeddings Compatible Across Deep Neural Network Models?
- arxiv url: http://arxiv.org/abs/2604.07282v1
- Date: Wed, 08 Apr 2026 16:44:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.644104
- Title: Are Face Embeddings Compatible Across Deep Neural Network Models?
- Title(参考訳): ディープニューラルネットワークモデルにおける顔埋め込みは相容れないか?
- Authors: Fizza Rubab, Yiying Tong, Arun Ross,
- Abstract要約: 我々は、異なるディープニューラルネットワーク(DNN)モデルが、あるモデルの顔表現を他のモデルと整列できるかどうかを検討する。
以上の結果から, 驚くほどのクロスモデル互換性が確認された。
これらの発見は、モデルの相互運用性、アンサンブル設計、バイオメトリックテンプレートセキュリティに影響を及ぼす。
- 参考スコア(独自算出の注目度): 8.929662625846595
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated face recognition has made rapid strides over the past decade due to the unprecedented rise of deep neural network (DNN) models that can be trained for domain-specific tasks. At the same time, foundation models that are pretrained on broad vision or vision-language tasks have shown impressive generalization across diverse domains, including biometrics. This raises an important question: Do different DNN models--both domain-specific and foundation models--encode facial identity in similar ways, despite being trained on different datasets, loss functions, and architectures? In this regard, we directly analyze the geometric structure of embedding spaces imputed by different DNN models. Treating embeddings of face images as point clouds, we study whether simple affine transformations can align face representations of one model with another. Our findings reveal surprising cross-model compatibility: low-capacity linear mappings substantially improve cross-model face recognition over unaligned baselines for both face identification and verification tasks. Alignment patterns generalize across datasets and vary systematically across model families, indicating representational convergence in facial identity encoding. These findings have implications for model interoperability, ensemble design, and biometric template security.
- Abstract(参考訳): 顔認識は、ドメイン固有のタスクのためにトレーニングできるディープニューラルネットワーク(DNN)モデルが前例のない増加により、過去10年間で急速に進歩している。
同時に、幅広いビジョンや視覚言語タスクに基づいて事前訓練された基礎モデルは、バイオメトリックスを含む様々な領域で顕著な一般化を示している。
異なるデータセット、損失関数、アーキテクチャでトレーニングされているにもかかわらず、ドメイン固有モデルとファンデーションモデルの両方で、顔認証を同じようにエンコードするのか?
そこで本研究では,異なるDNNモデルによる埋め込み空間の幾何学的構造を直接解析する。
顔画像の埋め込みを点雲として扱うことで、簡単なアフィン変換が、あるモデルの顔表現を他のモデルと整合させることができるかどうかを考察する。
低容量リニアマッピングは、顔識別と検証の両方のタスクにおいて、不整合ベースライン上でのクロスモデル顔認識を大幅に改善する。
アライメントパターンはデータセット全体にわたって一般化され、モデルファミリ間で体系的に変化し、顔認証符号化における表現収束を示す。
これらの発見は、モデルの相互運用性、アンサンブル設計、バイオメトリックテンプレートセキュリティに影響を及ぼす。
関連論文リスト
- Connecting Neural Models Latent Geometries with Relative Geodesic Representations [21.71782603770616]
遅延構造を異なる潜在空間間で共有する場合、表現間の相対距離を歪みまで保存できることが示される。
異なるニューラルモデルは、ほぼ同じ基礎多様体をパラメータ化し、プルバック計量に基づく表現を導入すると仮定する。
本手法は,オートエンコーダと視覚基盤識別モデルを対象として,モデルの縫合と検索のタスクについて検証する。
論文 参考訳(メタデータ) (2025-06-02T12:34:55Z) - Sequential Modeling Enables Scalable Learning for Large Vision Models [120.91839619284431]
本稿では,言語データを用いずにLVM(Large Vision Model)を学習できる新しい逐次モデリング手法を提案する。
我々は、生画像やビデオや注釈付きデータソースを表現できる共通フォーマット「視覚文」を定義した。
論文 参考訳(メタデータ) (2023-12-01T18:59:57Z) - Modeling biological face recognition with deep convolutional neural
networks [0.0]
ディープ畳み込みニューラルネットワーク(DCNN)は、生物物体認識の最先端の計算モデルとなっている。
近年,この成果を生体顔認証研究に移管する試みが始まっている。
本稿では,生物認識のモデル化にDCNNを用いた最初の研究について概説する。
論文 参考訳(メタデータ) (2022-08-13T16:45:30Z) - Surface Vision Transformers: Attention-Based Modelling applied to
Cortical Analysis [8.20832544370228]
球面多様体上に投影された任意の曲面データを研究するために、ドメインに依存しないアーキテクチャを導入する。
ビジョントランスモデルは、連続したマルチヘッド自己アテンション層を介してパッチのシーケンスを符号化する。
実験の結果、SiTは一般的に表面CNNよりも優れており、登録データと未登録データで比較可能であることがわかった。
論文 参考訳(メタデータ) (2022-03-30T15:56:11Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - InterFaceGAN: Interpreting the Disentangled Face Representation Learned
by GANs [73.27299786083424]
我々は、最先端のGANモデルによって学習された不整合顔表現を解釈するInterFaceGANというフレームワークを提案する。
まず、GANは潜在空間の線型部分空間で様々な意味学を学ぶ。
次に、異なる意味論間の相関関係について詳細な研究を行い、部分空間射影を通してそれらをよりよく解離させる。
論文 参考訳(メタデータ) (2020-05-18T18:01:22Z) - A Detailed Look At CNN-based Approaches In Facial Landmark Detection [5.774786149181392]
CNNベースのアプローチは回帰とヒートマップのアプローチに分けられる。
本稿では,CNNに基づくアプローチの両面について検討し,その利点と欠点を一般化し,ヒートマップアプローチのバリエーションを導入する。
包括的評価を行い,提案モデルが全テストデータセットにおいて,他のモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-05-08T16:17:42Z) - Learning Formation of Physically-Based Face Attributes [16.55993873730069]
4000個の高分解能顔スキャンを組み合わせたデータセットに基づいて,非線形形態素顔モデルを提案する。
我々のディープラーニングに基づく生成モデルは、アルベドと幾何学の相関を学習し、生成した資産の解剖学的正確性を保証する。
論文 参考訳(メタデータ) (2020-04-02T07:01:30Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。