論文の概要: LRD-Net: A Lightweight Real-Centered Detection Network for Cross-Domain Face Forgery Detection
- arxiv url: http://arxiv.org/abs/2604.10862v1
- Date: Mon, 13 Apr 2026 00:04:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.254951
- Title: LRD-Net: A Lightweight Real-Centered Detection Network for Cross-Domain Face Forgery Detection
- Title(参考訳): LRD-Net: クロスドメイン顔偽造検出のための軽量リアルセンター検出ネットワーク
- Authors: Xuecen Zhang, Vipin Chaudhary,
- Abstract要約: 両課題を同時に解決する新しいフレームワークであるRD-Net(Lightweight Real-centered Detection Network)を提案する。
LRD-Netは、軽量なマルチスケールウェーブレット誘導モジュールがMobileNetV3ベースの空間バックボーンを条件としたアテンション信号を生成するシーケンシャル周波数誘導アーキテクチャを採用している。
DiFFベンチマークの実験は、RDD-Netが最先端のクロスドメイン検出精度を達成し、既存の手法を一貫して上回ることを示した。
- 参考スコア(独自算出の注目度): 5.455290019410609
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid advancement of diffusion-based generative models has made face forgery detection a critical challenge in digital forensics. Current detection methods face two fundamental limitations: poor cross-domain generalization when encountering unseen forgery types, and substantial computational overhead that hinders deployment on resource-constrained devices. We propose LRD-Net (Lightweight Real-centered Detection Network), a novel framework that addresses both challenges simultaneously. Unlike existing dual-branch approaches that process spatial and frequency information independently, LRD-Net adopts a sequential frequency-guided architecture where a lightweight Multi-Scale Wavelet Guidance Module generates attention signals that condition a MobileNetV3-based spatial backbone. This design enables effective exploitation of frequency-domain cues while avoiding the redundancy of parallel feature extraction. Furthermore, LRD-Net employs a real-centered learning strategy with exponential moving average prototype updates and drift regularization, anchoring representations around authentic facial images rather than modeling diverse forgery patterns. Extensive experiments on the DiFF benchmark demonstrate that LRD-Net achieves state-of-the-art cross-domain detection accuracy, consistently outperforming existing methods. Critically, LRD-Net accomplishes this with only 2.63M parameters - approximately 9x fewer than conventional approaches - while achieving over 8x faster training and nearly 10x faster inference. These results demonstrate that robust cross-domain face forgery detection can be achieved without sacrificing computational efficiency, making LRD-Net suitable for real-time deployment in mobile authentication systems and resource-constrained environments.
- Abstract(参考訳): 拡散に基づく生成モデルの急速な進歩により、顔偽造検出はデジタル法医学において重要な課題となっている。
現在の検出方法は、目に見えない偽装タイプに遭遇する際のドメイン間の一般化の貧弱さと、リソース制約のあるデバイスへのデプロイメントを妨げる計算オーバーヘッドの2つの基本的な制限に直面している。
両課題を同時に解決する新しいフレームワークであるRD-Net(Lightweight Real-centered Detection Network)を提案する。
空間情報と周波数情報を独立に処理する既存のデュアルブランチアプローチとは異なり、RDD-Netはシーケンシャルな周波数誘導アーキテクチャを採用し、軽量なマルチスケールウェーブレット誘導モジュールは、MobileNetV3ベースの空間バックボーンを条件としたアテンション信号を生成する。
この設計により、並列特徴抽出の冗長性を避けつつ、周波数領域キューを効果的に活用できる。
さらに、RD-Netは、様々な偽造パターンをモデル化するのではなく、実中心学習戦略を採用し、指数関数的な平均的なプロトタイプ更新とドリフト正規化を実現している。
DiFFベンチマークの大規模な実験は、RDD-Netが最先端のクロスドメイン検出精度を達成し、既存の手法を一貫して上回ることを示した。
批判的に言えば、RD-Netは2.63万のパラメータ(従来の手法の約9倍)しか達成していないが、8倍高速なトレーニングと10倍高速な推論を実現している。
これらの結果から,堅牢なクロスドメイン顔偽造検出を計算効率を犠牲にすることなく実現できることが示され,モバイル認証システムやリソース制約環境におけるリアルタイムデプロイメントに適したRDD-Netが実現された。
関連論文リスト
- RCDN: Real-Centered Detection Network for Robust Face Forgery Identification [7.41356813669013]
既存の検出方法は、同一領域内でトレーニングやテストを行う場合、ほぼ完璧な性能を達成する。
新しい偽造技術が継続的に出現し、検出器は目に見えない操作に対して信頼性を保たなければならない。
本稿では,周波数空間畳み込みニューラルネットワーク(CNN)フレームワークであるReal-Centered Detection Network (RCDN)を提案する。
論文 参考訳(メタデータ) (2026-01-17T17:09:15Z) - Real-Time LiDAR Super-Resolution via Frequency-Aware Multi-Scale Fusion [0.4078247440919472]
FLASH (Frequency-aware LiDAR Adaptive Super- resolution with Hierarchical fusion) は、二重ドメイン処理による制限を克服する新しいフレームワークである。
FLASHは、2つの重要なイノベーションを統合する: (i) 局所的な空間的注意とFFTによるグローバルな周波数領域分析を組み合わせ、細粒度の幾何と周期的な走査パターンの両方をログ線形複雑度で捉え、 (ii) 学習された位置特異的な特徴集約による従来のスキップ接続を置き換え、CBAMによる動的特徴選択のために強化する適応的マルチスケールフュージョン。
論文 参考訳(メタデータ) (2025-11-10T18:38:15Z) - SWAN: Synergistic Wavelet-Attention Network for Infrared Small Target Detection [8.098063209250684]
赤外線小目標検出(IRSTD)は、民間および軍事用途において重要である。
近年の手法は局所的な空間パターンを主に捉えた従来の畳み込み処理に重点を置いている。
空間領域と周波数領域の両方からターゲットを知覚する新しいフレームワークであるSynergistic Wavelet-Attention Network (SWAN)を提案する。
論文 参考訳(メタデータ) (2025-08-02T11:26:58Z) - Towards Smarter Sensing: 2D Clutter Mitigation in RL-Driven Cognitive MIMO Radar [8.674241138986925]
このシステムは平面配列構成を採用し、伝送波形とビームフォーミングパターンを適用して検出性能を最適化する。
堅牢なウォルド型検出器はSARSAベースのRLアルゴリズムと統合されており、レーダーは複雑な乱雑な環境を学習し適応することができる。
論文 参考訳(メタデータ) (2025-02-07T14:31:58Z) - RE-POSE: Synergizing Reinforcement Learning-Based Partitioning and Offloading for Edge Object Detection [3.2805151494259563]
エッジデバイス上でのリアルタイムオブジェクト検出は、その限られた計算リソースと、ディープニューラルネットワーク(DNN)ベースの検出モデルの高要求により、大きな課題を呈している。
本稿では,リソース制約のあるエッジ環境における精度-遅延トレードオフを最適化するフレームワークであるRE-POSEを紹介する。
論文 参考訳(メタデータ) (2025-01-16T10:56:45Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - LoRD-Net: Unfolded Deep Detection Network with Low-Resolution Receivers [104.01415343139901]
本稿では,1ビット計測から情報シンボルを復元する「LoRD-Net」というディープ検出器を提案する。
LoRD-Netは、関心のシグナルを回復するためのタスクベースのアーキテクチャである。
無線通信における1ビット信号回復のためのレシーバアーキテクチャの評価を行った。
論文 参考訳(メタデータ) (2021-02-05T04:26:05Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - MuCAN: Multi-Correspondence Aggregation Network for Video
Super-Resolution [63.02785017714131]
ビデオ超解像(VSR)は、複数の低解像度フレームを使用して、各フレームに対して高解像度の予測を生成することを目的としている。
フレーム間およびフレーム内は、時間的および空間的情報を利用するための鍵となるソースである。
VSRのための効果的なマルチ対応アグリゲーションネットワーク(MuCAN)を構築した。
論文 参考訳(メタデータ) (2020-07-23T05:41:27Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。