論文の概要: 50 Years of Automated Face Recognition
- arxiv url: http://arxiv.org/abs/2505.24247v2
- Date: Mon, 09 Jun 2025 05:47:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 21:10:47.009607
- Title: 50 Years of Automated Face Recognition
- Title(参考訳): 顔認識の50年
- Authors: Minchul Kim, Anil Jain, Xiaoming Liu,
- Abstract要約: 顔認識は、初歩的で手作りのシステムから高度なディープラーニングモデルへと進化してきた。
近年の進歩は、高品質の顔と低品質の顔のシナリオにおいて顕著な精度を実現している。
今後の顔認識研究における重要な課題と将来的な方向性について概説する。
- 参考スコア(独自算出の注目度): 14.192320601323111
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Over the past 50 years, automated face recognition has evolved from rudimentary, handcrafted systems into sophisticated deep learning models that rival and often surpass human performance. This paper chronicles the history and technological progression of FR, from early geometric and statistical methods to modern deep neural architectures leveraging massive real and AI-generated datasets. We examine key innovations that have shaped the field, including developments in dataset, loss function, neural network design and feature fusion. We also analyze how the scale and diversity of training data influence model generalization, drawing connections between dataset growth and benchmark improvements. Recent advances have achieved remarkable milestones: state-of-the-art face verification systems now report False Negative Identification Rates of 0.13% against a 12.4 million gallery in NIST FRVT evaluations for 1:N visa-to-border matching. While recent advances have enabled remarkable accuracy in high- and low-quality face scenarios, numerous challenges persist. While remarkable progress has been achieved, several open research problems remain. We outline critical challenges and promising directions for future face recognition research, including scalability, multi-modal fusion, synthetic identity generation, and explainable systems.
- Abstract(参考訳): 過去50年間で、自動顔認識は、初歩的で手作りのシステムから、人間のパフォーマンスに対抗し、しばしば勝る高度なディープラーニングモデルへと進化してきた。
本稿では、初期の幾何学的・統計的手法から、大規模実・AI生成データセットを活用した現代の深層ニューラルネットワークまで、FRの歴史と技術の進歩を詳述する。
我々は、データセット、損失関数、ニューラルネットワーク設計、特徴融合など、この分野を形作る重要なイノベーションについて検討する。
また、トレーニングデータのスケールと多様性が、モデル一般化、データセットの成長とベンチマーク改善の関連性にどのように影響するかを分析する。
最先端の顔認証システムは、NIST FRVTによる1:Nビザ・ツー・ボーダーマッチングの1240万ギャラリーに対して、False Negative Identification Ratesの0.13%を報告している。
近年の進歩は、高品質の顔と低品質の顔のシナリオにおいて顕著な精度を実現しているが、多くの課題が続いている。
目覚ましい進歩を遂げたものの、いくつかのオープンな研究課題が残っている。
本稿では,拡張性,マルチモーダル融合,合成ID生成,説明可能なシステムなど,将来の顔認識研究における重要な課題と今後の方向性について概説する。
関連論文リスト
- SDFR: Synthetic Data for Face Recognition Competition [51.9134406629509]
大規模な顔認識データセットは、インターネットをクロールして個人の同意なしに収集し、法的、倫理的、プライバシー上の懸念を提起する。
近年、ウェブクローリングされた顔認識データセットにおける懸念を軽減するために、合成顔認識データセットの生成が提案されている。
本稿では,第18回IEEE International Conference on Automatic Face and Gesture Recognition (FG 2024)と共同で開催されているSynthetic Data for Face Recognition (SDFR)コンペティションの概要を紹介する。
SDFRコンペティションは2つのタスクに分けられ、参加者は新しい合成データセットまたは/または既存のデータセットを使用して顔認識システムを訓練することができる。
論文 参考訳(メタデータ) (2024-04-06T10:30:31Z) - Deepfake Generation and Detection: A Benchmark and Survey [134.19054491600832]
Deepfakeは、特定の条件下で非常にリアルな顔画像やビデオを作成するための技術だ。
この調査は、ディープフェイクの発生と検出の最新の展開を包括的にレビューする。
本研究では, 顔交換, 顔再現, 話し顔生成, 顔属性編集の4つの代表的なディープフェイク分野の研究に焦点をあてる。
論文 参考訳(メタデータ) (2024-03-26T17:12:34Z) - Comprehensive Exploration of Synthetic Data Generation: A Survey [4.485401662312072]
この研究は、過去10年間で417のSynthetic Data Generationモデルを調査します。
その結果、ニューラルネットワークベースのアプローチが普及し、モデルのパフォーマンスと複雑性が向上したことが明らかになった。
コンピュータビジョンが支配的であり、GANが主要な生成モデルであり、拡散モデル、トランスフォーマー、RNNが競合する。
論文 参考訳(メタデータ) (2024-01-04T20:23:51Z) - IDiff-Face: Synthetic-based Face Recognition through Fizzy
Identity-Conditioned Diffusion Models [15.217324893166579]
合成データセットは、顔認識開発のためのプライバシーに敏感な認証データに代わる有望な選択肢として登場した。
IDiff-Faceは、顔認識訓練のための現実的なアイデンティティ変動を伴う合成ID生成のための条件付き潜時拡散モデルに基づく、新しいアプローチである。
論文 参考訳(メタデータ) (2023-08-09T14:48:31Z) - Synthetic Data for Face Recognition: Current State and Future Prospects [14.288753326973984]
本研究の目的は,顔認識における合成顔データの利用事例を明確かつ構造化した画像を提供することである。
本稿では,顔認識における合成データの利用に直面する課題と,顔認識分野における合成データの今後の展望について論じる。
論文 参考訳(メタデータ) (2023-05-01T18:25:22Z) - INTERN: A New Learning Paradigm Towards General Vision [117.3343347061931]
我々はInterNという新しい学習パラダイムを開発した。
複数の段階の複数のソースからの監視信号を用いて学習することにより、トレーニング対象のモデルは強力な一般化性を生み出す。
ほとんどの場合、ターゲットドメインのトレーニングデータの10%しか適応していないモデルが、完全なデータセットでトレーニングされたトレーニングデータよりも優れています。
論文 参考訳(メタデータ) (2021-11-16T18:42:50Z) - Survey on the Analysis and Modeling of Visual Kinship: A Decade in the
Making [66.72253432908693]
親和性認識は多くの実践的応用において難しい問題である。
我々は、多くの人にその見解を刺激した公開リソースとデータ課題についてレビューする。
10周年記念には、さまざまなkinベースのタスクのためのデモコードが用意されている。
論文 参考訳(メタデータ) (2020-06-29T13:25:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。