論文の概要: WMamba: Wavelet-based Mamba for Face Forgery Detection
- arxiv url: http://arxiv.org/abs/2501.09617v2
- Date: Tue, 21 Oct 2025 07:48:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:03.228553
- Title: WMamba: Wavelet-based Mamba for Face Forgery Detection
- Title(参考訳): WMamba:Face Forgery検出のためのウェーブレットベースのMamba
- Authors: Siran Peng, Tianshuo Zhang, Li Gao, Xiangyu Zhu, Haoyuan Zhang, Kai Pang, Zhen Lei,
- Abstract要約: We introduced WMamba, a novel wavelet-based feature extractor built on the Mamba architecture。
本稿では,細い顔の輪郭を適応的にモデル化するために,特殊な変形可能なカーネルを用いた動的輪郭畳み込み(DCConv)を提案する。
We show that WMamba achieves state-of-the-art (SOTA) performance, highlighting its effective in face forgery detection。
- 参考スコア(独自算出の注目度): 28.915927351945726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid evolution of deepfake generation technologies necessitates the development of robust face forgery detection algorithms. Recent studies have demonstrated that wavelet analysis can enhance the generalization abilities of forgery detectors. Wavelets effectively capture key facial contours, often slender, fine-grained, and globally distributed, that may conceal subtle forgery artifacts imperceptible in the spatial domain. However, current wavelet-based approaches fail to fully exploit the distinctive properties of wavelet data, resulting in sub-optimal feature extraction and limited performance gains. To address this challenge, we introduce WMamba, a novel wavelet-based feature extractor built upon the Mamba architecture. WMamba maximizes the utility of wavelet information through two key innovations. First, we propose Dynamic Contour Convolution (DCConv), which employs specially crafted deformable kernels to adaptively model slender facial contours. Second, by leveraging the Mamba architecture, our method captures long-range spatial relationships with linear complexity. This efficiency allows for the extraction of fine-grained, globally distributed forgery artifacts from small image patches. Extensive experiments show that WMamba achieves state-of-the-art (SOTA) performance, highlighting its effectiveness in face forgery detection.
- Abstract(参考訳): ディープフェイク生成技術の急速な進化は、堅牢な顔偽造検出アルゴリズムの開発を必要とする。
近年の研究では、ウェーブレット解析がフォージェリー検出器の一般化能力を高めることが示されている。
ウェーブレットは、しばしば細く、きめ細やかで、世界中に分布する、重要な顔の輪郭を効果的に捉え、空間領域では認識できない微妙な偽造品を隠蔽する可能性がある。
しかし、現在のウェーブレットベースのアプローチでは、ウェーブレットデータの特徴的な特性を完全に活用することができず、結果として準最適特徴抽出と限られた性能向上をもたらす。
この課題に対処するために,新しいウェーブレットベースの特徴抽出器であるWMambaを紹介した。
WMambaは2つの重要な革新を通じてウェーブレット情報の有用性を最大化する。
まず,細い顔の輪郭を適応的にモデル化するために,特殊な変形可能なカーネルを用いた動的輪郭畳み込み(DCConv)を提案する。
第2に,Mambaアーキテクチャを活用することにより,線形複雑度を伴う長距離空間関係を抽出する。
この効率性により、小さな画像パッチから細粒でグローバルに分散した偽造品を抽出することができる。
大規模な実験により、WMambaは最先端のSOTA(State-of-the-art)性能を達成し、偽造検出の有効性を強調している。
関連論文リスト
- OSDMamba: Enhancing Oil Spill Detection from Remote Sensing Images Using Selective State Space Model [8.370356454348554]
我々は,石油流出検出に特化して設計された最初のマンバ型アーキテクチャであるOSDMambaを提案する。
提案したOSDMambaは最先端のパフォーマンスを実現し、2つの公開データセットに対してOSDの8.9%と11.8%の改善を実現していることを示す。
論文 参考訳(メタデータ) (2025-06-22T12:07:44Z) - RD-UIE: Relation-Driven State Space Modeling for Underwater Image Enhancement [59.364418120895]
水中画像強調(UIE)は、海洋視覚応用のための重要な前処理ステップである。
実効UIE(RD-UIE)のための新しい関係駆動型マンバフレームワークを開発した。
水中強化ベンチマークの実験では、RD-UIEは最先端のアプローチであるWMambaよりも優れていた。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - Towards Scalable and Deep Graph Neural Networks via Noise Masking [59.058558158296265]
グラフニューラルネットワーク(GNN)は多くのグラフマイニングタスクで顕著に成功している。
計算とストレージのコストが高いため、大きなグラフにスケールすることは困難です。
既存のモデル単純化作業と互換性のあるプラグアンドプレイモジュールであるノイズマスキング(RMask)を用いたランダムウォークを提案する。
論文 参考訳(メタデータ) (2024-12-19T07:48:14Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - DiMSUM: Diffusion Mamba -- A Scalable and Unified Spatial-Frequency Method for Image Generation [4.391439322050918]
拡散モデルのための新しい状態空間アーキテクチャを提案する。
入力画像の局所的特徴に対する帰納バイアスを高めるために,空間情報と周波数情報を利用する。
論文 参考訳(メタデータ) (2024-11-06T18:59:17Z) - Wavelet-Driven Generalizable Framework for Deepfake Face Forgery Detection [0.0]
Wavelet-CLIPは、ウェーブレット変換とViT-L/14アーキテクチャに由来する機能を統合したディープフェイク検出フレームワークで、CLIP方式で事前トレーニングされている。
提案手法は,データ間一般化における平均AUC0.749,不明瞭なディープフェイクに対するロバスト性0.893を達成し,優れた性能を示す。
論文 参考訳(メタデータ) (2024-09-26T21:16:51Z) - MambaVT: Spatio-Temporal Contextual Modeling for robust RGB-T Tracking [51.28485682954006]
本研究では,マンバをベースとした純フレームワーク(MambaVT)を提案する。
具体的には、長距離クロスフレーム統合コンポーネントを考案し、ターゲットの外観変化にグローバルに適応する。
実験では、RGB-TトラッキングのためのMambaのビジョンの可能性が示され、MambaVTは4つの主要なベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-08-15T02:29:00Z) - WaveMamba: Spatial-Spectral Wavelet Mamba for Hyperspectral Image Classification [3.5302264121619094]
本稿では、ウェーブレット変換を空間スペクトルマンバアーキテクチャと統合し、HSI分類を強化する新しいアプローチであるWaveMambaを紹介する。
WaveMambaは既存のモデルを超え、ヒューストン大学のデータセットでは4.5%、パヴィア大学のデータセットでは2.0%の精度向上を実現している。
論文 参考訳(メタデータ) (2024-08-02T12:44:07Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - HSIMamba: Hyperpsectral Imaging Efficient Feature Learning with Bidirectional State Space for Classification [16.742768644585684]
HSIMambaは、双方向の逆畳み込みニューラルネットワークパスを使用して、スペクトル特徴をより効率的に抽出する新しいフレームワークである。
提案手法は,CNNの動作効率と,トランスフォーマに見られる注意機構の動的特徴抽出機能を組み合わせたものである。
このアプローチは、現在のベンチマークを超えて分類精度を改善し、トランスフォーマーのような高度なモデルで遭遇する計算の非効率性に対処する。
論文 参考訳(メタデータ) (2024-03-30T07:27:36Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - Wavelet Prior Attention Learning in Axial Inpainting Network [35.06912946192495]
Axial Inpainting Network (WAIN) におけるウェーブレット事前注意学習モデルを提案する。
WPAは、マルチスケールの周波数領域における高レベルの特徴集約をガイドし、テキストアーティファクトを緩和する。
積み重ねられたATは、水平軸と垂直軸の低レベルの特徴とともに、合理的な特徴をモデル化するのに役立つ。
論文 参考訳(メタデータ) (2022-06-07T08:45:27Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。