論文の概要: AI-KD: Towards Alignment Invariant Face Image Quality Assessment Using Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2404.09555v1
- Date: Mon, 15 Apr 2024 08:18:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-16 13:09:46.034913
- Title: AI-KD: Towards Alignment Invariant Face Image Quality Assessment Using Knowledge Distillation
- Title(参考訳): AI-KD:知識蒸留を用いたアライメント不変顔画像品質評価を目指して
- Authors: Žiga Babnik, Fadi Boutros, Naser Damer, Peter Peer, Vitomir Štruc,
- Abstract要約: 顔画像品質評価(FIQA)技術は近年着実に改善されているが,入力面サンプルが適切に整列していない場合,その性能は依然として低下している。
このアライメント感度は、ほとんどのFIQA技術が特定の顔アライメント手順を用いて訓練または設計されているという事実に由来する。
本稿では,既存のFIQA技術を拡張可能な知識蒸留手法であるAI-KDについて述べる。
- 参考スコア(独自算出の注目度): 7.4425335403172825
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Face Image Quality Assessment (FIQA) techniques have seen steady improvements over recent years, but their performance still deteriorates if the input face samples are not properly aligned. This alignment sensitivity comes from the fact that most FIQA techniques are trained or designed using a specific face alignment procedure. If the alignment technique changes, the performance of most existing FIQA techniques quickly becomes suboptimal. To address this problem, we present in this paper a novel knowledge distillation approach, termed AI-KD that can extend on any existing FIQA technique, improving its robustness to alignment variations and, in turn, performance with different alignment procedures. To validate the proposed distillation approach, we conduct comprehensive experiments on 6 face datasets with 4 recent face recognition models and in comparison to 7 state-of-the-art FIQA techniques. Our results show that AI-KD consistently improves performance of the initial FIQA techniques not only with misaligned samples, but also with properly aligned facial images. Furthermore, it leads to a new state-of-the-art, when used with a competitive initial FIQA approach. The code for AI-KD is made publicly available from: https://github.com/LSIbabnikz/AI-KD.
- Abstract(参考訳): 顔画像品質評価(FIQA)技術は近年着実に改善されているが、入力顔サンプルが適切に整列していない場合、その性能は依然として低下している。
このアライメント感度は、ほとんどのFIQA技術が特定の顔アライメント手順を用いて訓練または設計されているという事実に由来する。
もしアライメント技術が変化すれば、既存のほとんどのFIQA技術の性能はすぐに準最適となる。
そこで本論文では,既存のFIQA技術で拡張可能な知識蒸留手法であるAI-KDについて述べる。
提案手法の有効性を検証するため,近年の4つの顔認識モデルを用いた6つの顔データセットの総合的な実験を行い,最新技術であるFIQA技術との比較を行った。
以上の結果から,AI-KD は初期 FIQA 技術の性能を常に向上させるだけでなく,顔画像の整合性も向上することが示唆された。
さらに、競合する初期FIQAアプローチで使用する場合、新しい最先端技術につながる。
AI-KDのコードは、https://github.com/LSIbabnikz/AI-KDから公開されている。
関連論文リスト
- Rank-based No-reference Quality Assessment for Face Swapping [88.53827937914038]
顔スワップ法における品質測定の基準は、操作された画像とソース画像の間のいくつかの距離に依存する。
顔スワップ用に設計された新しい非参照画像品質評価法(NR-IQA)を提案する。
論文 参考訳(メタデータ) (2024-06-04T01:36:29Z) - Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - Optimization-Based Improvement of Face Image Quality Assessment
Techniques [5.831942593046074]
顔画像品質評価(FIQA)技術は、認識プロセスに役立つ入力顔画像からサンプル品質情報を推測しようとする。
本稿では,既存のFIQA技術の性能向上を目的とした品質ラベル最適化手法を提案する。
提案手法を6つの最先端FIQA手法による包括的実験で評価した。
論文 参考訳(メタデータ) (2023-05-24T08:06:12Z) - DifFIQA: Face Image Quality Assessment Using Denoising Diffusion
Probabilistic Models [1.217503190366097]
顔画像品質評価(FIQA)技術は、これらの性能劣化を軽減することを目的としている。
拡散確率モデル(DDPM)に基づく強力な新しいFIQA手法DifFIQAを提案する。
拡散に基づく摂動は計算コストが高いため、DifFIQA(R)と呼ばれる回帰ベースの品質予測器にDifFIQAで符号化された知識を蒸留する。
論文 参考訳(メタデータ) (2023-05-09T21:03:13Z) - Approaching Test Time Augmentation in the Context of Uncertainty Calibration for Deep Neural Networks [2.112682368145474]
画像分類のための深部モデルの不確実性校正を改善するため,M-ATTAとV-ATTAという新しい手法を提案する。
ナ適応重み付けシステムを利用することで、M/V-ATTAはモデルの精度に影響を与えることなく不確実性校正を改善する。
論文 参考訳(メタデータ) (2023-04-11T10:01:39Z) - FaceQAN: Face Image Quality Assessment Through Adversarial Noise
Exploration [1.217503190366097]
本稿では,顔画像品質評価手法であるFaceQANを提案する。
このようにして,画像品質を敵攻撃にリンクする手法が提案されている。
実験の結果,FaceQANはいくつかの望ましい特徴を示しながら,競争的な結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-12-05T09:37:32Z) - Blind Face Restoration: Benchmark Datasets and a Baseline Model [63.053331687284064]
Blind Face Restoration (BFR) は、対応する低品質 (LQ) 入力から高品質 (HQ) の顔画像を構築することを目的としている。
EDFace-Celeb-1M (BFR128) と EDFace-Celeb-150K (BFR512) と呼ばれる2つのブラインドフェイス復元ベンチマークデータセットを最初に合成する。
最先端の手法は、ブラー、ノイズ、低解像度、JPEG圧縮アーティファクト、それらの組み合わせ(完全な劣化)の5つの設定でベンチマークされる。
論文 参考訳(メタデータ) (2022-06-08T06:34:24Z) - Task-Specific Normalization for Continual Learning of Blind Image
Quality Models [105.03239956378465]
視覚的画像品質評価(BIQA)のための簡易かつ効果的な連続学習法を提案する。
このアプローチの重要なステップは、トレーニング済みのディープニューラルネットワーク(DNN)のすべての畳み込みフィルタを凍結して、安定性を明示的に保証することです。
我々は、各新しいIQAデータセット(タスク)に予測ヘッドを割り当て、対応する正規化パラメータをロードして品質スコアを生成する。
最終的な品質推定は、軽量な$K$-meansゲーティング機構で、すべての頭からの予測の重み付け総和によって計算される。
論文 参考訳(メタデータ) (2021-07-28T15:21:01Z) - NTIRE 2021 Challenge on Perceptual Image Quality Assessment [128.83256694901726]
NTIRE 2021の知覚画像品質評価(IQA)に関する課題について報告する。
CVPR 2021では、画像修復・強化ワークショップ(NTIRE)のNew Trendsと連携して開催されました。
新しいタイプの画像処理技術として、GAN(Generative Adversarial Networks)に基づく知覚画像処理アルゴリズムが、より現実的なテクスチャを持つ画像を生成する。
論文 参考訳(メタデータ) (2021-05-07T05:36:54Z) - Mining Generalized Features for Detecting AI-Manipulated Fake Faces [39.86126596985567]
本稿では,本質的な特徴をマイニングし,分布バイアスを排除し,一般化能力を向上する新しい枠組みを提案する。
提案手法は,最もポピュラーで最先端な操作技術を用いて,偽顔データセットの4つのカテゴリで評価する。
論文 参考訳(メタデータ) (2020-10-27T08:41:16Z) - Uncertainty-Aware Blind Image Quality Assessment in the Laboratory and
Wild [98.48284827503409]
我々は,テキスト化BIQAモデルを開発し,それを合成的および現実的歪みの両方で訓練するアプローチを提案する。
我々は、多数の画像ペアに対してBIQAのためのディープニューラルネットワークを最適化するために、忠実度損失を用いる。
6つのIQAデータベースの実験は、実験室と野生動物における画像品質を盲目的に評価する学習手法の可能性を示唆している。
論文 参考訳(メタデータ) (2020-05-28T13:35:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。