論文の概要: On the Holistic Approach for Detecting Human Image Forgery
- arxiv url: http://arxiv.org/abs/2601.04715v1
- Date: Thu, 08 Jan 2026 08:33:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.111198
- Title: On the Holistic Approach for Detecting Human Image Forgery
- Title(参考訳): ヒト画像偽造検出のための全体論的アプローチについて
- Authors: Xiao Guo, Jie Zhu, Anil Jain, Xiaoming Liu,
- Abstract要約: 本稿では,ヒト画像偽造検出のための総合的なフレームワークであるHuForDetを紹介する。
コンテキスト化された偽造検出ブランチは、MLLM(Multi-Modal Large Language Model)を利用して、フルボディのセマンティック一貫性を分析する。
我々のHuForDetは、最先端の偽造検出性能と、多様な画像偽造者に対して優れた堅牢性を実現している。
- 参考スコア(独自算出の注目度): 20.765860380888057
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid advancement of AI-generated content (AIGC) has escalated the threat of deepfakes, from facial manipulations to the synthesis of entire photorealistic human bodies. However, existing detection methods remain fragmented, specializing either in facial-region forgeries or full-body synthetic images, and consequently fail to generalize across the full spectrum of human image manipulations. We introduce HuForDet, a holistic framework for human image forgery detection, which features a dual-branch architecture comprising: (1) a face forgery detection branch that employs heterogeneous experts operating in both RGB and frequency domains, including an adaptive Laplacian-of-Gaussian (LoG) module designed to capture artifacts ranging from fine-grained blending boundaries to coarse-scale texture irregularities; and (2) a contextualized forgery detection branch that leverages a Multi-Modal Large Language Model (MLLM) to analyze full-body semantic consistency, enhanced with a confidence estimation mechanism that dynamically weights its contribution during feature fusion. We curate a human image forgery (HuFor) dataset that unifies existing face forgery data with a new corpus of full-body synthetic humans. Extensive experiments show that our HuForDet achieves state-of-the-art forgery detection performance and superior robustness across diverse human image forgeries.
- Abstract(参考訳): AIGC(AI- generated content)の急速な進歩は、顔の操作から光現実的な人体全体の合成に至るまで、ディープフェイクの脅威をエスカレートさせた。
しかし、既存の検出方法は断片化され続けており、顔領域の偽造物や全身の合成画像に特化しており、その結果、人間の画像操作の全領域にわたって一般化することができない。
1)RGBと周波数領域の両方で動作する異種の専門家を駆使した顔フォージェリ検出ブランチ,(2)細粒度ブレンド境界から粗大なテクスチャ不規則に至るまでのアーティファクトを捕捉する適応型ラプラシアン・オブ・ガウスアン(LoG)モジュール,および(2)マルチモーダル・大規模言語モデル(MLLM)を利用したコンテキスト型フォージェリ検出ブランチにより,機能融合時のコントリビューションを動的に重み付けする信頼度推定機構を備えた,デュアルブランチアーキテクチャを特徴とするヒューマンイメージフォージェリ検出のための総合的フレームワークであるHuForDetを紹介する。
我々は、既存の顔偽造データをフルボディの合成人間の新しいコーパスと統合する人間の画像偽造データセット(HuFor)をキュレートする。
大規模な実験により、HuForDetは最先端の偽造検出性能と、多種多様な画像偽造者に対して優れた堅牢性を達成できることが示された。
関連論文リスト
- OmniDFA: A Unified Framework for Open Set Synthesis Image Detection and Few-Shot Attribution [21.62979058692505]
OmniDFAはAIGIのための新しいフレームワークで、画像の信頼性を評価し、その起源を数ショットで決定する。
OmniFakeは大規模なクラス対応合成画像データセットで、45ドルの異なる生成モデルから117ドルの画像をキュレートする。
実験により、OmniDFAはオープンセット属性に優れた能力を示し、AIGI検出における最先端の一般化性能を達成することが示された。
論文 参考訳(メタデータ) (2025-09-30T02:36:40Z) - Bi-Level Optimization for Self-Supervised AI-Generated Face Detection [56.57881725223548]
両レベル最適化に基づくAI生成顔検出器の自己教師方式を提案する。
我々の検出器は、一級・二級の分類設定において、既存のアプローチよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-07-30T16:38:29Z) - MLEP: Multi-granularity Local Entropy Patterns for Universal AI-generated Image Detection [44.40575446607237]
AI生成画像(AIGI)を効果的に検出する手法が緊急に必要である。
マルチグラニュラリティ局所エントロピーパターン (MLEP) を提案する。
MLEPは、画像のセマンティクスを著しく破壊し、潜在的なコンテンツバイアスを低減しながら、次元とスケールの画素関係を包括的にキャプチャする。
論文 参考訳(メタデータ) (2025-04-18T14:50:23Z) - Towards the Detection of AI-Synthesized Human Face Images [12.090322373964124]
本稿では,GAN(Generative Adversarial Networks)とさまざまなDMによって生成される人間の顔画像を含むベンチマークを提案する。
そして、異なる生成モデルによって導入された偽の痕跡を周波数領域で解析し、様々な知見を得た。
さらに、周波数表現で訓練された検出器が、他の見えない生成モデルとよく一致できることを実証する。
論文 参考訳(メタデータ) (2024-02-13T19:37:44Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - Exploring the Robustness of Human Parsers Towards Common Corruptions [99.89886010550836]
我々は,LIP-C,ATR-C,Pascal-Person-Part-Cという3つの汚職堅牢性ベンチマークを構築し,人間の解析モデルのリスク許容度を評価する。
データ強化戦略に触発されて、一般に破損した条件下で頑健性を高めるための新しい異種強化機構を提案する。
論文 参考訳(メタデータ) (2023-09-02T13:32:14Z) - Fighting deepfakes by detecting GAN DCT anomalies [0.0]
最先端アルゴリズムはディープニューラルネットワークを使って偽のコンテンツを検出する。
ディープフェイク画像の高精度判別が可能な新しい高速検出法を提案する。
この手法は革新的であり、最先端技術を超え、説明可能性の観点から多くの洞察を与えている。
論文 参考訳(メタデータ) (2021-01-24T19:45:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。