Fugu-MT 論文翻訳(概要): LVFace: Large Vision model for Face Recogniton

論文の概要: LVFace: Large Vision model for Face Recogniton

arxiv url: http://arxiv.org/abs/2501.13420v1
Date: Thu, 23 Jan 2025 06:48:48 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-24 19:17:07.201271
Title: LVFace: Large Vision model for Face Recogniton
Title（参考訳）: LVFace:顔認識のための大規模視覚モデル
Authors: Jinghan You, Yuanrui Sun, Mingyu Guo, Chao Feng, Jiao Ran,
Abstract要約: 我々は、LVFaceと呼ばれる大きな視覚モデルに基づいて、最先端の顔認識モデルを訓練する。最大の公開顔データベースであるWebFace42Mでは、他の高度な顔認識方式よりもLVFaceの方が優れていることを示した。
参考スコア（独自算出の注目度）: 10.089694970968699
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recently, large vision models have demonstrated powerful representation capabilities in the field of computer vision. However, we unexpectedly found that face recognition research is still mainly focused on CNN-based model architectures, which may lead to suboptimal state-of-the-art (SOTA) performance in face recognition. Therefore, we study how to use various loss functions from historical research orthogonally to train a new state-of-the-art face recognition model based on large vision models, called LVFace. On the largest public face database, WebFace42M, we demonstrated the superiority of LVFace over other advanced face recognition methods and achieved first place in the ICCV21 MFR-Ongoing challenge, until the submission of this work (December 30, 2024, academic track).
Abstract（参考訳）: 近年,コンピュータビジョンの分野では,大規模な視覚モデルが強力な表現能力を実証している。しかし, 顔認識研究は依然としてCNNベースのモデルアーキテクチャに重点を置いており, 顔認識におけるSOTA(Suboptimal State-of-the-art)性能に繋がる可能性がある。そこで本稿では,LVFaceと呼ばれる大規模視覚モデルに基づいて,歴史研究の様々な損失関数を直交的に活用して,新しい最先端の顔認識モデルを訓練する方法について検討する。最大の公開顔データベースであるWebFace42Mでは、LVFaceが他の高度な顔認識法よりも優れていることを実証し、2024年12月30日(学術トラック)までICCV21 MFR-Ongoingチャレンジで1位を獲得した。

関連論文リスト

Branch, or Layer? Zeroth-Order Optimization for Continual Learning of Vision-Language Models [44.27801276966812]
本稿では、視覚言語連続学習(VLCL)のためのゼロ次最適化(ZO)の体系的探索を開拓する。まず,VLCLにおけるNuive full-ZO導入の不適合性について検討した。我々は、浅層と深層表現の不均一な学習力学を活かして、ZOとFOをネットワーク層にインターリーブする階層最適化パラダイムを開発した。
論文参考訳（メタデータ） (2025-06-14T08:59:19Z)
FUDOKI: Discrete Flow-based Unified Understanding and Generation via Kinetic-Optimal Velocities [76.46448367752944]
MLLM(Multimodal large language model)は、単一のフレームワーク内で視覚的理解と画像生成を統一する言語である。ほとんどの既存のMLLMはAutore(AR)アーキテクチャに依存しており、将来の開発に固有の制限を課している。本稿では,離散フローマッチングに基づく統一マルチモーダルモデルであるFUDOKIを紹介する。
論文参考訳（メタデータ） (2025-05-26T15:46:53Z)
xEdgeFace: Efficient Cross-Spectral Face Recognition for Edge Devices [4.910937238451485]
Heterogeneous Face Recognition (HFR) は、異なる知覚モードにわたる顔画像のマッチングという課題に対処する。ハイブリッドCNN-Transformerアーキテクチャを適用し,軽量かつ効果的なHFRフレームワークを提案する。提案手法は,RGBの顔認識タスクにおいて高い性能を保ちながら,最小対の異種データを用いた効率的なエンドツーエンドトレーニングを実現する。
論文参考訳（メタデータ） (2025-04-28T10:03:11Z)
UIFace: Unleashing Inherent Model Capabilities to Enhance Intra-Class Diversity in Synthetic Face Recognition [42.86969216015855]
顔認識(FR)はコンピュータビジョンにおいて最も重要な応用の1つである。 UIFaceとして短縮された合成顔認識のためのクラス内多様性を高めるフレームワークを提案する。実験結果から,本手法は従来の手法に比べてトレーニングデータが少なく,合成データセットの約半分の規模で大幅に上回っていることがわかった。
論文参考訳（メタデータ） (2025-02-27T06:22:18Z)
Diffusion Prior Interpolation for Flexibility Real-World Face Super-Resolution [48.34173818491552]
拡散事前補間(DPI)は、一貫性と多様性のバランスをとることができ、事前訓練されたモデルにシームレスに統合することができる。合成および実データに対して行われた広範な実験において、DPIはSOTA FSR法よりも優れていることを示した。
論文参考訳（メタデータ） (2024-12-21T09:28:44Z)
OODFace: Benchmarking Robustness of Face Recognition under Common Corruptions and Appearance Variations [21.00631818827379]
既存のオープンソースモデルと商用アルゴリズムは、特定の現実世界のout-of-Distribution(OOD)シナリオにおいて堅牢性を欠いている。 OODFaceは,顔認識モデルが直面するOOD課題を2つの視点から検討する。 19の異なる顔認識モデルと3つの商用APIに関する広範な実験を行い、フェイスマスクに関する拡張実験を行った。
論文参考訳（メタデータ） (2024-12-03T14:42:31Z)
Unleashing Network Potentials for Semantic Scene Completion [50.95486458217653]
本稿では,新しいSSCフレームワーク - Adrial Modality Modulation Network (AMMNet)を提案する。 AMMNetは、モダリティ間の勾配流の相互依存性を可能にするクロスモーダル変調と、動的勾配競争を利用するカスタマイズされた逆トレーニングスキームの2つのコアモジュールを導入している。 AMMNetは最先端のSSC法よりも大きなマージンで優れていた。
論文参考訳（メタデータ） (2024-03-12T11:48:49Z)
Generalized Face Liveness Detection via De-fake Face Generator [52.23271636362843]
以前の顔アンチスプーフィング(FAS)手法は、目に見えない領域に一般化するという課題に直面している。本稿では,大規模に付加的な現実面を効果的に活用できるAnomalous cue Guided FAS (AG-FAS)法を提案する。提案手法は,未知のシナリオと未知のプレゼンテーションアタックを用いたクロスドメイン評価において,最先端の結果を実現する。
論文参考訳（メタデータ） (2024-01-17T06:59:32Z)
Towards Large-scale Masked Face Recognition [44.380235958577785]
新型コロナウイルス(COVID-19)が流行する中、ほとんどの人がマスクを着用している。本稿では,ICCV MFR WebFace260M と InsightFace の制約のないトラックにテキスト分岐ソリューションを提示する。
論文参考訳（メタデータ） (2023-10-25T05:04:47Z)
Recognizability Embedding Enhancement for Very Low-Resolution Face Recognition and Quality Estimation [21.423956631978186]
本研究では,視覚的品質ではなく,埋め込み空間における顔の認識性を高めるための原則的アプローチについて検討する。まず、頑健な学習に基づく顔認識度尺度、すなわち認識可能性指標(RI)を定式化する。次に、認識不能な顔クラスタから低RIで埋め込んだ難認識顔を、認識不能な顔クラスタから切り離して、認識可能性の向上を反映した指標変換損失を考案する。
論文参考訳（メタデータ） (2023-04-20T03:18:03Z)
A Survey of Deep Face Restoration: Denoise, Super-Resolution, Deblur, Artifact Removal [177.21001709272144]
顔復元(FR)は、低品質(LQ)入力画像から高品質(HQ)顔を復元することを目的としている。本稿では,顔修復のための深層学習技術の最近の進歩を包括的に調査する。
論文参考訳（メタデータ） (2022-11-05T07:08:15Z)
Modeling biological face recognition with deep convolutional neural networks [0.0]
ディープ畳み込みニューラルネットワーク(DCNN)は、生物物体認識の最先端の計算モデルとなっている。近年,この成果を生体顔認証研究に移管する試みが始まっている。本稿では,生物認識のモデル化にDCNNを用いた最初の研究について概説する。
論文参考訳（メタデータ） (2022-08-13T16:45:30Z)
Blind Face Restoration: Benchmark Datasets and a Baseline Model [63.053331687284064]
Blind Face Restoration (BFR) は、対応する低品質 (LQ) 入力から高品質 (HQ) の顔画像を構築することを目的としている。 EDFace-Celeb-1M (BFR128) と EDFace-Celeb-150K (BFR512) と呼ばれる2つのブラインドフェイス復元ベンチマークデータセットを最初に合成する。最先端の手法は、ブラー、ノイズ、低解像度、JPEG圧縮アーティファクト、それらの組み合わせ(完全な劣化)の5つの設定でベンチマークされる。
論文参考訳（メタデータ） (2022-06-08T06:34:24Z)
SFace: Sigmoid-Constrained Hypersphere Loss for Robust Face Recognition [74.13631562652836]
SFace(Sigmoid-Constrained hypersphere loss)と呼ばれる新しい損失関数を提案する。 SFaceは2つのシグモイド勾配再スケール関数によってそれぞれ制御される超球面多様体にクラス内およびクラス間制約を課す。クラス内距離を減らし、ラベルノイズへの過度な適合を防ぎ、より堅牢なディープ顔認識モデルに寄与する。
論文参考訳（メタデータ） (2022-05-24T11:54:15Z)
On the (Limited) Generalization of MasterFace Attacks and Its Relation to the Capacity of Face Representations [11.924504853735645]
実験および理論的研究におけるMasterFace攻撃の一般化可能性について検討する。顔空間のアイデンティティが適切に分離されていると仮定して、顔容量と最大MasterFaceカバレッジを推定する。 MasterFacesは顔認識システムに対する脅威ではなく、顔認識モデルの堅牢性を高めるツールである、と結論付けている。
論文参考訳（メタデータ） (2022-03-23T13:02:41Z)
SphereFace Revived: Unifying Hyperspherical Face Recognition [57.07058009281208]
我々は,超球面顔認識において,大きな角マージンを理解するための統一的な枠組みを導入する。このフレームワークでは,SphereFace-Rという,トレーニングの安定性が大幅に向上した改良版を提案する。我々は、SphereFace-Rが最先端の手法よりも一貫して優れているか、競合していることを示す。
論文参考訳（メタデータ） (2021-09-12T17:07:54Z)
SynFace: Face Recognition with Synthetic Data [83.15838126703719]
我々は、ID混在(IM)とドメイン混在(DM)を併用したSynFaceを考案し、パフォーマンスギャップを緩和する。また、合成顔画像の系統的実験分析を行い、合成データを顔認識に効果的に活用する方法についての知見を提供する。
論文参考訳（メタデータ） (2021-08-18T03:41:54Z)
Joint Face Image Restoration and Frontalization for Recognition [79.78729632975744]
現実世界のシナリオでは、大きなポーズ、悪い照明、低解像度、ぼやけ、ノイズなど、多くの要因が顔認識性能を損なう可能性がある。それまでの努力は通常、まず品質の低い顔から高品質な顔に復元し、次に顔認識を行う。与えられた低品質の顔からフロンダル化された高品質の顔を復元する多段階顔復元モデルを提案する。
論文参考訳（メタデータ） (2021-05-12T03:52:41Z)
FaceX-Zoo: A PyTorch Toolbox for Face Recognition [62.038018324643325]
顔認識の研究開発コミュニティを指向した新しいオープンソースフレームワーク、FaceX-Zooを紹介します。 facex-zooは、さまざまな監視ヘッドとバックボーンを備えたトレーニングモジュールを提供する。訓練されたモデルの検証とプライマリアプリケーションのために、シンプルで機能的なFace SDKが提供されます。
論文参考訳（メタデータ） (2021-01-12T11:06:50Z)
SuperFront: From Low-resolution to High-resolution Frontal Face Synthesis [65.35922024067551]
本稿では,前頭前頭部を保存した高品質なアイデンティティを生成できるGANモデルを提案する。具体的には,高分解能(HR)面を1対多のLR面から様々なポーズで合成するSuperFront-GANを提案する。超高解像度のサイドビューモジュールをSF-GANに統合し、人事空間におけるアイデンティティ情報とサイドビューの詳細を保存します。
論文参考訳（メタデータ） (2020-12-07T23:30:28Z)
Facial Expressions as a Vulnerability in Face Recognition [73.85525896663371]
本研究では,顔認識システムのセキュリティ脆弱性としての表情バイアスについて検討する。本稿では,表情バイアスが顔認識技術の性能に与える影響を包括的に分析する。
論文参考訳（メタデータ） (2020-11-17T18:12:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。