論文の概要: LVFace: Progressive Cluster Optimization for Large Vision Models in Face Recognition
- arxiv url: http://arxiv.org/abs/2501.13420v2
- Date: Tue, 25 Mar 2025 03:43:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-26 20:14:01.304859
- Title: LVFace: Progressive Cluster Optimization for Large Vision Models in Face Recognition
- Title(参考訳): LVFace: 顔認識における大規模視覚モデルのためのプログレッシブクラスタ最適化
- Authors: Jinghan You, Shanglin Li, Yuanrui Sun, Jiangchuan Wei, Mingyu Guo, Chao Feng, Jiao Ran,
- Abstract要約: 視覚変換器(ViT)は大規模な視覚モデリングに革命をもたらしたが、依然としてCNNが支配的である顔認識(FR)では未探索のままである。
より優れた結果を得るために,プログレッシブクラスタ最適化(PCO)を統合したVTベースのFRモデルであるLVFaceを提案する。
- 参考スコア(独自算出の注目度): 9.067342817048253
- License:
- Abstract: Vision Transformers (ViTs) have revolutionized large-scale visual modeling, yet remain underexplored in face recognition (FR) where CNNs still dominate. We identify a critical bottleneck: CNN-inspired training paradigms fail to unlock ViT's potential, leading to suboptimal performance and convergence instability.To address this challenge, we propose LVFace, a ViT-based FR model that integrates Progressive Cluster Optimization (PCO) to achieve superior results. Specifically, PCO sequentially applies negative class sub-sampling (NCS) for robust and fast feature alignment from random initialization, feature expectation penalties for centroid stabilization, performing cluster boundary refinement through full-batch training without NCS constraints. LVFace establishes a new state-of-the-art face recognition baseline, surpassing leading approaches such as UniFace and TopoFR across multiple benchmarks. Extensive experiments demonstrate that LVFace delivers consistent performance gains, while exhibiting scalability to large-scale datasets and compatibility with mainstream VLMs and LLMs. Notably, LVFace secured 1st place in the ICCV 2021 Masked Face Recognition (MFR)-Ongoing Challenge (March 2025), proving its efficacy in real-world scenarios.
- Abstract(参考訳): 視覚変換器(ViT)は大規模な視覚モデリングに革命をもたらしたが、依然としてCNNが支配的である顔認識(FR)では未探索のままである。
CNNにインスパイアされたトレーニングパラダイムは、ViTの可能性を解き放つことができず、最適性能と収束不安定をもたらす。この課題に対処するため、我々は、PCO(Progressive Cluster Optimization)を統合したViTベースのFRモデルであるLVFaceを提案する。
具体的には、ランダム初期化による堅牢かつ高速な特徴アライメント、セントロイド安定化のための特徴予測ペナルティ、NCS制約のないフルバッチトレーニングによるクラスタ境界改善をPCOは順次、負のクラスサブサンプリング(NCS)を適用している。
LVFaceは、新しい最先端の顔認識ベースラインを確立し、複数のベンチマークでUniFaceやTopoFRのような主要なアプローチを上回っている。
大規模な実験では、LVFaceが一貫したパフォーマンス向上を実現し、大規模データセットへのスケーラビリティと、主流のVLMやLLMとの互換性を示している。
特に、LVFaceはICCV 2021 Masked Face Recognition (MFR)-Ongoing Challenge (2025年3月)で1位を獲得し、実世界のシナリオにおいてその有効性を証明した。
関連論文リスト
- OODFace: Benchmarking Robustness of Face Recognition under Common Corruptions and Appearance Variations [21.00631818827379]
既存のオープンソースモデルと商用アルゴリズムは、特定の現実世界のout-of-Distribution(OOD)シナリオにおいて堅牢性を欠いている。
OODFaceは,顔認識モデルが直面するOOD課題を2つの視点から検討する。
19の異なる顔認識モデルと3つの商用APIに関する広範な実験を行い、フェイスマスクに関する拡張実験を行った。
論文 参考訳(メタデータ) (2024-12-03T14:42:31Z) - Generalized Face Liveness Detection via De-fake Face Generator [52.23271636362843]
以前の顔アンチスプーフィング(FAS)手法は、目に見えない領域に一般化するという課題に直面している。
本稿では,大規模に付加的な現実面を効果的に活用できるAnomalous cue Guided FAS (AG-FAS)法を提案する。
提案手法は,未知のシナリオと未知のプレゼンテーションアタックを用いたクロスドメイン評価において,最先端の結果を実現する。
論文 参考訳(メタデータ) (2024-01-17T06:59:32Z) - Towards Large-scale Masked Face Recognition [44.380235958577785]
新型コロナウイルス(COVID-19)が流行する中、ほとんどの人がマスクを着用している。
本稿では,ICCV MFR WebFace260M と InsightFace の制約のないトラックにテキスト分岐ソリューションを提示する。
論文 参考訳(メタデータ) (2023-10-25T05:04:47Z) - Recognizability Embedding Enhancement for Very Low-Resolution Face
Recognition and Quality Estimation [21.423956631978186]
本研究では,視覚的品質ではなく,埋め込み空間における顔の認識性を高めるための原則的アプローチについて検討する。
まず、頑健な学習に基づく顔認識度尺度、すなわち認識可能性指標(RI)を定式化する。
次に、認識不能な顔クラスタから低RIで埋め込んだ難認識顔を、認識不能な顔クラスタから切り離して、認識可能性の向上を反映した指標変換損失を考案する。
論文 参考訳(メタデータ) (2023-04-20T03:18:03Z) - A Survey of Deep Face Restoration: Denoise, Super-Resolution, Deblur,
Artifact Removal [177.21001709272144]
顔復元(FR)は、低品質(LQ)入力画像から高品質(HQ)顔を復元することを目的としている。
本稿では,顔修復のための深層学習技術の最近の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2022-11-05T07:08:15Z) - Modeling biological face recognition with deep convolutional neural
networks [0.0]
ディープ畳み込みニューラルネットワーク(DCNN)は、生物物体認識の最先端の計算モデルとなっている。
近年,この成果を生体顔認証研究に移管する試みが始まっている。
本稿では,生物認識のモデル化にDCNNを用いた最初の研究について概説する。
論文 参考訳(メタデータ) (2022-08-13T16:45:30Z) - On the (Limited) Generalization of MasterFace Attacks and Its Relation
to the Capacity of Face Representations [11.924504853735645]
実験および理論的研究におけるMasterFace攻撃の一般化可能性について検討する。
顔空間のアイデンティティが適切に分離されていると仮定して、顔容量と最大MasterFaceカバレッジを推定する。
MasterFacesは顔認識システムに対する脅威ではなく、顔認識モデルの堅牢性を高めるツールである、と結論付けている。
論文 参考訳(メタデータ) (2022-03-23T13:02:41Z) - SynFace: Face Recognition with Synthetic Data [83.15838126703719]
我々は、ID混在(IM)とドメイン混在(DM)を併用したSynFaceを考案し、パフォーマンスギャップを緩和する。
また、合成顔画像の系統的実験分析を行い、合成データを顔認識に効果的に活用する方法についての知見を提供する。
論文 参考訳(メタデータ) (2021-08-18T03:41:54Z) - Joint Face Image Restoration and Frontalization for Recognition [79.78729632975744]
現実世界のシナリオでは、大きなポーズ、悪い照明、低解像度、ぼやけ、ノイズなど、多くの要因が顔認識性能を損なう可能性がある。
それまでの努力は通常、まず品質の低い顔から高品質な顔に復元し、次に顔認識を行う。
与えられた低品質の顔からフロンダル化された高品質の顔を復元する多段階顔復元モデルを提案する。
論文 参考訳(メタデータ) (2021-05-12T03:52:41Z) - FaceX-Zoo: A PyTorch Toolbox for Face Recognition [62.038018324643325]
顔認識の研究開発コミュニティを指向した新しいオープンソースフレームワーク、FaceX-Zooを紹介します。
facex-zooは、さまざまな監視ヘッドとバックボーンを備えたトレーニングモジュールを提供する。
訓練されたモデルの検証とプライマリアプリケーションのために、シンプルで機能的なFace SDKが提供されます。
論文 参考訳(メタデータ) (2021-01-12T11:06:50Z) - Facial Expressions as a Vulnerability in Face Recognition [73.85525896663371]
本研究では,顔認識システムのセキュリティ脆弱性としての表情バイアスについて検討する。
本稿では,表情バイアスが顔認識技術の性能に与える影響を包括的に分析する。
論文 参考訳(メタデータ) (2020-11-17T18:12:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。