論文の概要: M3D-Net: Multi-Modal 3D Facial Feature Reconstruction Network for Deepfake Detection
- arxiv url: http://arxiv.org/abs/2604.14574v1
- Date: Thu, 16 Apr 2026 03:06:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.700569
- Title: M3D-Net: Multi-Modal 3D Facial Feature Reconstruction Network for Deepfake Detection
- Title(参考訳): M3D-Net:ディープフェイク検出のためのマルチモーダル3次元顔特徴再構成ネットワーク
- Authors: Haotian Wu, Yue Cheng, Shan Bian,
- Abstract要約: 本稿では,ディープフェイク検出のためのマルチモーダル3次元顔特徴再構成ネットワーク(M3D-Net)を提案する。
本手法は,一視点RGB画像から微細な顔形状と反射特性を再構成するエンド・ツー・エンドのデュアルストリームアーキテクチャを利用する。
提案手法は,検出精度とロバスト性の観点から最先端の性能を達成し,既存手法よりも優れていた。
- 参考スコア(独自算出の注目度): 6.2204470448022695
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the rapid advancement of deep learning in image generation, facial forgery techniques have achieved unprecedented realism, posing serious threats to cybersecurity and information authenticity. Most existing deepfake detection approaches rely on the reconstruction of isolated facial attributes without fully exploiting the complementary nature of multi-modal feature representations. To address these challenges, this paper proposes a novel Multi-Modal 3D Facial Feature Reconstruction Network (M3D-Net) for deepfake detection. Our method leverages an end-to-end dual-stream architecture that reconstructs fine-grained facial geometry and reflectance properties from single-view RGB images via a self-supervised 3D facial reconstruction module. The network further enhances detection performance through a 3D Feature Pre-fusion Module (PFM), which adaptively adjusts multi-scale features, and a Multi-modal Fusion Module (MFM) that effectively integrates RGB and 3D-reconstructed features using attention mechanisms. Extensive experiments on multiple public datasets demonstrate that our approach achieves state-of-the-art performance in terms of detection accuracy and robustness, significantly outperforming existing methods while exhibiting strong generalization across diverse scenarios.
- Abstract(参考訳): 画像生成におけるディープラーニングの急速な進歩により、顔の偽造技術は前例のない現実主義を達成し、サイバーセキュリティと情報信頼性に深刻な脅威をもたらしている。
既存のディープフェイク検出アプローチの多くは、マルチモーダル特徴表現の相補的な性質を完全に活用することなく、分離された顔属性の再構成に依存している。
これらの課題に対処するため,本研究では,ディープフェイク検出のためのマルチモーダル3次元顔特徴再構成ネットワーク(M3D-Net)を提案する。
本手法は, 自己監督型3次元顔再構成モジュールを用いて, 単視点RGB画像から微細な顔形状と反射特性を再構成するエンド・ツー・エンドのデュアルストリームアーキテクチャを利用する。
このネットワークは、マルチスケール機能を適応的に調整する3D Feature Pre-fusion Module (PFM) と、注意機構を用いてRGBと3D再構成機能を効果的に統合するMFM (Multi-modal Fusion Module) により、検出性能をさらに向上させる。
複数の公開データセットに対する大規模な実験により、本手法は検出精度とロバスト性の観点から最先端のパフォーマンスを達成し、既存の手法を著しく上回りながら、多様なシナリオにまたがる強力な一般化を示した。
関連論文リスト
- Wonder3D++: Cross-domain Diffusion for High-fidelity 3D Generation from a Single Image [68.55613894952177]
単一ビュー画像から高忠実なテクスチャメッシュを効率的に生成する新しい手法である textbfWonder3D++ を導入する。
マルチビュー正規写像と対応するカラー画像を生成するクロスドメイン拡散モデルを提案する。
最後に,多視点2次元表現から高品質な表面を粗い方法でわずか3ドル程度で駆動するカスケード3次元メッシュ抽出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-11-03T17:24:18Z) - MoRE: 3D Visual Geometry Reconstruction Meets Mixture-of-Experts [50.37005070020306]
MoREは、Mixture-of-Experts (MoE)アーキテクチャに基づいた、密集した3Dビジュアル基盤モデルである。
MoREは、幾何推定を安定させ、洗練する信頼に基づく深度補正モジュールを組み込んでいる。
高忠実な表面正規予測のために,高密度なセマンティック特徴とグローバルな3Dバックボーン表現を統合する。
論文 参考訳(メタデータ) (2025-10-31T06:54:27Z) - MSMA: Multi-Scale Feature Fusion For Multi-Attribute 3D Face Reconstruction From Unconstrained Images [0.0]
1つの制約のない画像から3D顔を再構築することは、制約のない環境における様々な条件のため、依然として難しい問題である。
制約のない画像から3次元顔の再構成を行うための多次元特徴融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-15T10:30:08Z) - A Hierarchical Representation Network for Accurate and Detailed Face
Reconstruction from In-The-Wild Images [15.40230841242637]
本稿では,1つの画像から正確な顔再構成を実現するために,新しい階層型表現ネットワーク(HRN)を提案する。
我々のフレームワークは、異なるビューの詳細な一貫性を考慮し、マルチビューに拡張することができる。
本手法は,再現精度と視覚効果の両方において既存手法より優れる。
論文 参考訳(メタデータ) (2023-02-28T09:24:36Z) - High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization [51.878078860524795]
フォトリアリスティック・ノベルビューを合成可能な高忠実度3次元生成対向ネットワーク(GAN)インバージョン・フレームワークを提案する。
提案手法は,1枚の画像から高忠実度3Dレンダリングを可能にし,AI生成3Dコンテンツの様々な応用に期待できる。
論文 参考訳(メタデータ) (2022-11-28T18:59:52Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z) - Weakly-Supervised Multi-Face 3D Reconstruction [45.864415499303405]
多面的3D再構築のための効果的なエンドツーエンドフレームワークを提案する。
各画像の再構成された顔に対して、同じグローバルカメラモデルを採用し、3dシーンにおける相対的な頭部位置と向きを復元することができる。
論文 参考訳(メタデータ) (2021-01-06T13:15:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。