論文の概要: Latent Diffusion Based Face Enhancement under Degraded Conditions for Forensic Face Recognition
- arxiv url: http://arxiv.org/abs/2508.00941v1
- Date: Thu, 31 Jul 2025 14:28:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.637869
- Title: Latent Diffusion Based Face Enhancement under Degraded Conditions for Forensic Face Recognition
- Title(参考訳): 顔認識における劣化条件下での潜時拡散に基づく顔強調
- Authors: Hassan Ugail, Hamad Mansour Alawar, AbdulNasser Abbas Zehi, Ahmed Mohammad Alkendi, Ismail Lujain Jaleel,
- Abstract要約: 顔認識システムは、低品質の法医学的証拠画像を処理する際に重大な性能劣化を経験する。
本稿では,関連する劣化下での顔認識改善のための潜伏拡散に基づく拡張の評価を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Face recognition systems experience severe performance degradation when processing low-quality forensic evidence imagery. This paper presents an evaluation of latent diffusion-based enhancement for improving face recognition under forensically relevant degradations. Using a dataset of 3,000 individuals from LFW with 24,000 recognition attempts, we implement the Flux.1 Kontext Dev pipeline with Facezoom LoRA adaptation to test against seven degradation categories, including compression artefacts, blur effects, and noise contamination. Our approach demonstrates substantial improvements, increasing overall recognition accuracy from 29.1% to 84.5% (55.4 percentage point improvement, 95% CI: [54.1, 56.7]). Statistical analysis reveals significant performance gains across all degradation types, with effect sizes exceeding conventional thresholds for practical significance. These findings establish the potential of sophisticated diffusion based enhancement in forensic face recognition applications.
- Abstract(参考訳): 顔認識システムは、低品質の法医学的証拠画像を処理する際に重大な性能劣化を経験する。
本稿では, 法医学的に関係のある劣化下での顔認識改善のための潜時拡散に基づく拡張評価について述べる。
LFWの3000人のデータセットと24,000の認識の試みを用いて、Flux.1を実装した。
Kontext Dev Pipeline with Facezoom LoRA adapt to test against seven degradation categories, including compression artefacts, blur effect, noise contamination。
提案手法では,認識精度が29.1%から84.5%(55.4ポイント改善,95%CI: [54.1, 56.7])に向上した。
統計的解析により,すべての劣化型に対して顕著な性能向上がみられ,その効果の大きさは従来の閾値を超え,実用上重要なものとなった。
これらの知見は、法医学的顔認識応用における高度な拡散に基づく拡張の可能性を確立した。
関連論文リスト
- Implicit Neural Representation-Based Continuous Single Image Super Resolution: An Empirical Study [50.15623093332659]
入射神経表現(INR)は任意のスケール画像超解像(ASSR)の標準的アプローチとなっている
既存の手法を多様な設定で比較し、複数の画像品質指標に対して集計結果を示す。
トレーニング中, エッジ, テクスチャ, 細部を保存しながら, 強度変化をペナライズする新たな損失関数について検討した。
論文 参考訳(メタデータ) (2026-01-25T07:09:20Z) - ForensicFormer: Hierarchical Multi-Scale Reasoning for Cross-Domain Image Forgery Detection [0.0]
ForensicFormerは階層的なフレームワークで、低レベルのアーティファクト検出、中レベルの境界解析、高レベルのセマンティック推論を統一する。
本手法は,従来の操作,GAN生成画像,拡散モデル出力にまたがる7種類のテストセットの平均精度を86.8%維持する。
論文 参考訳(メタデータ) (2026-01-12T04:29:36Z) - Fixed-Threshold Evaluation of a Hybrid CNN-ViT for AI-Generated Image Detection Across Photos and Art [0.0]
クリーンな検証データに基づいて選択された決定しきい値を保持する固定閾値評価を導入し、すべての後処理変換に固定する。
AiDataアート/グラフィックでは91.4%の精度、AiDataアート/グラフィックでは89.7%の精度、CIFAKEでは98.3%(競争力)である。
論文 参考訳(メタデータ) (2025-12-25T05:19:09Z) - Efficient Perceptual Image Super Resolution: AIM 2025 Study and Benchmark [53.56717645904575]
我々は,厳密な効率制約を満たしつつ,Real-ESRGANの知覚結果を再現または改善することを目的としている。
提案手法は,500枚の4K解像度の試験画像からなる新しいデータセット上で評価され,それぞれが複数の劣化型を用いて劣化した。
最高パフォーマンスのアプローチは、すべてのベンチマークデータセットでReal-ESRGANを上回ります。
論文 参考訳(メタデータ) (2025-10-14T17:45:22Z) - Realism to Deception: Investigating Deepfake Detectors Against Face Enhancement [1.8886473137668816]
顔強化技術は必然的に生体計測の特徴を歪め、ディープフェイク検出器の精度を著しく低下させる。
我々は,一般的に使用されている顔強調法が,反法医学的ツールとして有効であるかどうかを体系的に評価した。
以上の結果から,顔強調法は反法医学的ツールとして効果的に機能することが示唆された。
論文 参考訳(メタデータ) (2025-09-08T19:49:52Z) - DiffusionFF: Face Forgery Detection via Diffusion-based Artifact Localization [21.139016641596676]
DiffusionFFは、拡散に基づくアーティファクトローカライゼーションによる顔偽造検出を強化する新しいフレームワークである。
本手法は,高次拡散モデルを用いて高次構造相似性(DSSIM)マップを生成し,微妙な操作の痕跡を効果的に捉える。
論文 参考訳(メタデータ) (2025-08-03T18:06:04Z) - One-Step Diffusion-based Real-World Image Super-Resolution with Visual Perception Distillation [53.24542646616045]
画像超解像(SR)生成に特化して設計された新しい視覚知覚拡散蒸留フレームワークであるVPD-SRを提案する。
VPD-SRは2つのコンポーネントから構成される: 明示的セマンティック・アウェア・スーパービジョン(ESS)と高周波知覚(HFP)損失。
提案したVPD-SRは,従来の最先端手法と教師モデルの両方と比較して,たった1ステップのサンプリングで優れた性能が得られる。
論文 参考訳(メタデータ) (2025-06-03T08:28:13Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - MRIFE: A Mask-Recovering and Interactive-Feature-Enhancing Semantic Segmentation Network For Relic Landslide Detection [7.6822321138894765]
長い期間にわたって形成された遺物地すべりは、再活性化の可能性を秘めており、危険な地質現象となっている。
遺物地すべりの高解像度リモートセンシング画像は、物体の視界のぼかし問題など、多くの課題に直面している。
より効率的な特徴抽出と分離のためのセマンティックセグメンテーションモデルとして,マスクの回収と対話型フェールエンハンシング(MRIFE)を提案する。
提案したMRIFEは実地すべりデータセットを用いて評価され,実験結果から,地すべり検出の性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2024-11-26T07:15:50Z) - Diffusion Facial Forgery Detection [56.69763252655695]
本稿では,顔に焦点をあてた拡散生成画像を対象とした包括的データセットであるDiFFを紹介する。
人体実験といくつかの代表的な偽造検出手法を用いて,DiFFデータセットの広範な実験を行った。
その結果、人間の観察者と自動検出者の2値検出精度は30%以下であることが判明した。
論文 参考訳(メタデータ) (2024-01-29T03:20:19Z) - DifAugGAN: A Practical Diffusion-style Data Augmentation for GAN-based
Single Image Super-resolution [88.13972071356422]
本稿では,DifAugGAN として知られる GAN ベースの画像超解像法(SR) のための拡散型データ拡張手法を提案する。
それは、訓練中の判別器の校正を改善するために、生成拡散モデルに拡散過程を適用することを含む。
我々のDifAugGANは、現在のGANベースのSISR手法のプラグ・アンド・プレイ戦略であり、判別器の校正を改善し、SR性能を向上させることができる。
論文 参考訳(メタデータ) (2023-11-30T12:37:53Z) - Boosting Cross-Quality Face Verification using Blind Face Restoration [0.13654846342364302]
低画質画像の知覚品質を高めるためには,顔認証の課題が不可欠である。
本稿では,3つの最先端のブラインドフェイス復元技術が顔認証システムの性能に与える影響について検討する。
論文 参考訳(メタデータ) (2023-08-15T18:05:19Z) - Impact of Face Image Quality Estimation on Presentation Attack Detection [10.832111751830272]
本研究では, 品質評価手法がボナフッ化物および攻撃試料のろ過に及ぼす影響について検討した。
その結果,低品質サンプルを除去することでトレーニングデータセットの20%を削減し,BPCERを3%改善できることが判明した。
論文 参考訳(メタデータ) (2022-09-30T14:23:47Z) - Octuplet Loss: Make Face Recognition Robust to Image Resolution [5.257115841810258]
本稿では,画像解像度に対するロバスト性を改善するために,人気三重項損失の新たな組み合わせを提案する。
我々は,高分解能画像とそれらの合成ダウンサンプリング変異体との関係をアイデンティティラベルと組み合わせて活用する。
本手法は, クロスレゾリューション (高分解能) 顔認証の性能を著しく向上させることができることを示す。
論文 参考訳(メタデータ) (2022-07-14T08:22:58Z) - On the Effect of Selfie Beautification Filters on Face Detection and
Recognition [53.561797148529664]
ソーシャルメディア画像フィルターは、例えば人工眼鏡や動物の鼻で、画像コントラスト、照明、あるいは顔の一部を妨げる。
U-NETセグメンテーションネットワークの修正版を用いて適用操作を再構築する手法を開発した。
認識の観点からは、顔を認識するために訓練されたResNet-34ネットワークを用いて抽出された特徴に対して、距離測定と訓練された機械学習アルゴリズムを用いる。
論文 参考訳(メタデータ) (2021-10-17T22:10:56Z) - Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in
Frequency Domain [88.7339322596758]
本論文では,空間画像と位相スペクトルを組み合わせ,顔の偽造のアップサンプリング成果をキャプチャするSPSL(Spatial-Phase Shallow Learning)法を提案する。
SPSLは、クロスデータセット評価における最先端性能とマルチクラス分類を実現し、単一データセット評価において同等の結果を得ることができる。
論文 参考訳(メタデータ) (2021-03-02T16:45:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。