論文の概要: MSPT: A Lightweight Face Image Quality Assessment Method with Multi-stage Progressive Training
- arxiv url: http://arxiv.org/abs/2508.07590v1
- Date: Mon, 11 Aug 2025 03:37:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.930995
- Title: MSPT: A Lightweight Face Image Quality Assessment Method with Multi-stage Progressive Training
- Title(参考訳): MSPT:多段階プログレッシブトレーニングによる軽量顔画像品質評価手法
- Authors: Xiongwei Xiao, Baoying Chen, Jishen Zeng, Jianquan Yang,
- Abstract要約: マルチステージプログレッシブトレーニング(MSPT)を用いた軽量顔品質評価ネットワークを提案する。
我々のネットワークは、より多様なデータサンプルを徐々に導入する3段階のプログレッシブトレーニング戦略を採用している。
MSPTは、VQualA 2025顔画像品質評価ベンチマークデータセットで2番目に高いスコアを達成した。
- 参考スコア(独自算出の注目度): 2.4399096457147356
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurately assessing the perceptual quality of face images is crucial, especially with the rapid progress in face restoration and generation. Traditional quality assessment methods often struggle with the unique characteristics of face images, limiting their generalizability. While learning-based approaches demonstrate superior performance due to their strong fitting capabilities, their high complexity typically incurs significant computational and storage costs, hindering practical deployment. To address this, we propose a lightweight face quality assessment network with Multi-Stage Progressive Training (MSPT). Our network employs a three-stage progressive training strategy that gradually introduces more diverse data samples and increases input image resolution. This novel approach enables lightweight networks to achieve high performance by effectively learning complex quality features while significantly mitigating catastrophic forgetting. Our MSPT achieved the second highest score on the VQualA 2025 face image quality assessment benchmark dataset, demonstrating that MSPT achieves comparable or better performance than state-of-the-art methods while maintaining efficient inference.
- Abstract(参考訳): 顔画像の知覚的品質を正確に評価することが重要である。
従来の品質評価手法は、顔画像の特徴に苦しむことが多く、その一般化性に限界がある。
学習ベースのアプローチは、強い適合性のために優れたパフォーマンスを示すが、その高い複雑さは典型的に計算とストレージのコストを著しく増加させ、実際のデプロイメントを妨げている。
そこで我々は,MSPT(Multi-Stage Progressive Training)を用いた軽量な顔品質評価ネットワークを提案する。
我々のネットワークは、より多様なデータサンプルを導入し、入力画像の解像度を向上させる3段階のプログレッシブトレーニング戦略を採用している。
この手法により、複雑な品質特徴を効果的に学習し、破滅的な忘れを著しく軽減し、軽量ネットワークで高い性能を実現することができる。
我々のMSPTは、VQualA 2025顔画像品質評価ベンチマークデータセットで2番目に高いスコアを獲得し、MSPTは、効率的な推論を維持しつつ、最先端の手法よりも同等または優れた性能を達成していることを示した。
関連論文リスト
- Analysis and Benchmarking of Extending Blind Face Image Restoration to Videos [99.42805906884499]
まず,実世界の低品質顔画像ベンチマーク(RFV-LQ)を導入し,画像に基づく顔復元アルゴリズムの評価を行った。
次に、失明顔画像復元アルゴリズムを劣化顔ビデオに拡張する際の利点と課題を網羅的に分析する。
分析では、主に顔成分の顕著なジッタとフレーム間のノイズシェープの2つの側面に分類する。
論文 参考訳(メタデータ) (2024-10-15T17:53:25Z) - Overcoming False Illusions in Real-World Face Restoration with Multi-Modal Guided Diffusion Model [55.46927355649013]
本稿では,新しいマルチモーダル・リアル・ワールド・フェイス・リカバリ技術を紹介する。
MGFRは偽の顔の特徴とアイデンティティの生成を緩和することができる。
4800のアイデンティティにまたがる21,000以上の高解像度顔画像からなるReface-HQデータセットを提案する。
論文 参考訳(メタデータ) (2024-10-05T13:46:56Z) - DSL-FIQA: Assessing Facial Image Quality via Dual-Set Degradation Learning and Landmark-Guided Transformer [23.70791030264281]
Generic Face Image Quality Assessment (GFIQA) は、顔画像の知覚的品質を評価する。
本稿では,GFIQAのトランスフォーマーに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2024-06-13T23:11:25Z) - Rank-based No-reference Quality Assessment for Face Swapping [88.53827937914038]
顔スワップ法における品質測定の基準は、操作された画像とソース画像の間のいくつかの距離に依存する。
顔スワップ用に設計された新しい非参照画像品質評価法(NR-IQA)を提案する。
論文 参考訳(メタデータ) (2024-06-04T01:36:29Z) - Boosting Cross-Quality Face Verification using Blind Face Restoration [0.13654846342364302]
低画質画像の知覚品質を高めるためには,顔認証の課題が不可欠である。
本稿では,3つの最先端のブラインドフェイス復元技術が顔認証システムの性能に与える影響について検討する。
論文 参考訳(メタデータ) (2023-08-15T18:05:19Z) - MSTRIQ: No Reference Image Quality Assessment Based on Swin Transformer
with Multi-Stage Fusion [8.338999282303755]
本稿では,Swin Transformerに基づく新しいアルゴリズムを提案する。
ローカル機能とグローバル機能の両方から情報を集約して、品質をより正確に予測する。
NTIRE 2022 Perceptual Image Quality Assessment Challengeのノーレファレンストラックで2位。
論文 参考訳(メタデータ) (2022-05-20T11:34:35Z) - Network Architecture Search for Face Enhancement [82.25775020564654]
我々は、NASFE(Network Architecture Search for Face Enhancement)と呼ばれるマルチタスクの顔復元ネットワークを提案する。
NASFEは、単一の劣化(すなわち)を含む低品質の顔画像を高めることができる。
ノイズまたはぼやけ)または複数の劣化(ノイズ+ブラル+ローライト)
論文 参考訳(メタデータ) (2021-05-13T19:46:05Z) - Deep Face Super-Resolution with Iterative Collaboration between
Attentive Recovery and Landmark Estimation [92.86123832948809]
本稿では,2つの繰り返しネットワーク間の反復的協調による深層面超解像(FSR)手法を提案する。
各繰り返しステップにおいて、リカバリブランチは、ランドマークの事前の知識を利用して、高品質な画像を生成する。
新しい注意融合モジュールはランドマークマップのガイダンスを強化するために設計されている。
論文 参考訳(メタデータ) (2020-03-29T16:04:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。