論文の概要: WMamba: Wavelet-based Mamba for Face Forgery Detection
- arxiv url: http://arxiv.org/abs/2501.09617v1
- Date: Thu, 16 Jan 2025 15:44:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-17 15:10:05.586502
- Title: WMamba: Wavelet-based Mamba for Face Forgery Detection
- Title(参考訳): WMamba:Face Forgery検出のためのウェーブレットベースのMamba
- Authors: Siran Peng, Tianshuo Zhang, Li Gao, Xiangyu Zhu, Haoyuan Zhang, Kai Pang, Zhen Lei,
- Abstract要約: ウェーブレット解析は、空間領域で認識できない微妙な偽造品を発見できる。
We introduced WMamba, a novel wavelet-based feature extractor built on the Mamba architecture。
We show that WMamba achieves state-of-the-art (SOTA) performance, highlighting its effectiveness and superiority in face forgery detection。
- 参考スコア(独自算出の注目度): 34.216401304665816
- License:
- Abstract: With the rapid advancement of deepfake generation technologies, the demand for robust and accurate face forgery detection algorithms has become increasingly critical. Recent studies have demonstrated that wavelet analysis can uncover subtle forgery artifacts that remain imperceptible in the spatial domain. Wavelets effectively capture important facial contours, which are often slender, fine-grained, and global in nature. However, existing wavelet-based approaches fail to fully leverage these unique characteristics, resulting in sub-optimal feature extraction and limited generalizability. To address this challenge, we introduce WMamba, a novel wavelet-based feature extractor built upon the Mamba architecture. WMamba maximizes the utility of wavelet information through two key innovations. First, we propose Dynamic Contour Convolution (DCConv), which employs specially crafted deformable kernels to adaptively model slender facial contours. Second, by leveraging the Mamba architecture, our method captures long-range spatial relationships with linear computational complexity. This efficiency allows for the extraction of fine-grained, global forgery artifacts from small image patches. Extensive experimental results show that WMamba achieves state-of-the-art (SOTA) performance, highlighting its effectiveness and superiority in face forgery detection.
- Abstract(参考訳): ディープフェイク生成技術の急速な進歩により、堅牢で正確な顔偽造検出アルゴリズムの需要が高まっている。
近年の研究では、ウェーブレット分析によって空間領域で認識できない微妙な偽造物が発見できることが示されている。
ウェーブレットは、しばしば細く、細かい粒状で、自然界のグローバルな重要な顔の輪郭を効果的に捉えます。
しかし、既存のウェーブレットベースのアプローチではこれらの特徴を完全に活用できず、結果として準最適特徴抽出と限定的な一般化が可能となった。
この課題に対処するために,新しいウェーブレットベースの特徴抽出器であるWMambaを紹介した。
WMambaは2つの重要な革新を通じてウェーブレット情報の有用性を最大化する。
まず,細い顔の輪郭を適応的にモデル化するために,特殊な変形可能なカーネルを用いた動的輪郭畳み込み(DCConv)を提案する。
第2に,Mambaアーキテクチャを活用することにより,線形計算複雑性による長距離空間関係を抽出する。
この効率性により、小さな画像パッチから細粒でグローバルな偽造品を抽出することができる。
WMambaがSOTA(State-of-the-art)性能を達成し,顔偽造検出の有効性と優位性を強調した。
関連論文リスト
- Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - DiMSUM: Diffusion Mamba -- A Scalable and Unified Spatial-Frequency Method for Image Generation [4.391439322050918]
拡散モデルのための新しい状態空間アーキテクチャを提案する。
入力画像の局所的特徴に対する帰納バイアスを高めるために,空間情報と周波数情報を利用する。
論文 参考訳(メタデータ) (2024-11-06T18:59:17Z) - Wavelet-Driven Generalizable Framework for Deepfake Face Forgery Detection [0.0]
Wavelet-CLIPは、ウェーブレット変換とViT-L/14アーキテクチャに由来する機能を統合したディープフェイク検出フレームワークで、CLIP方式で事前トレーニングされている。
提案手法は,データ間一般化における平均AUC0.749,不明瞭なディープフェイクに対するロバスト性0.893を達成し,優れた性能を示す。
論文 参考訳(メタデータ) (2024-09-26T21:16:51Z) - MambaVT: Spatio-Temporal Contextual Modeling for robust RGB-T Tracking [51.28485682954006]
本研究では,マンバをベースとした純フレームワーク(MambaVT)を提案する。
具体的には、長距離クロスフレーム統合コンポーネントを考案し、ターゲットの外観変化にグローバルに適応する。
実験では、RGB-TトラッキングのためのMambaのビジョンの可能性が示され、MambaVTは4つの主要なベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-08-15T02:29:00Z) - WaveMamba: Spatial-Spectral Wavelet Mamba for Hyperspectral Image Classification [3.5302264121619094]
本稿では、ウェーブレット変換を空間スペクトルマンバアーキテクチャと統合し、HSI分類を強化する新しいアプローチであるWaveMambaを紹介する。
WaveMambaは既存のモデルを超え、ヒューストン大学のデータセットでは4.5%、パヴィア大学のデータセットでは2.0%の精度向上を実現している。
論文 参考訳(メタデータ) (2024-08-02T12:44:07Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Towards More General Video-based Deepfake Detection through Facial Feature Guided Adaptation for Foundation Model [15.61920157541529]
内部にリッチな情報をエンコードしたファンデーションモデルを適用することにより,新しいディープフェイク検出手法を提案する。
近年のパラメータ効率の良い微調整技術に触発されて,新しいサイドネットワーク型デコーダを提案する。
提案手法は,見知らぬディープフェイクサンプルの同定に優れた有効性を示し,顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2024-04-08T14:58:52Z) - HSIMamba: Hyperpsectral Imaging Efficient Feature Learning with Bidirectional State Space for Classification [16.742768644585684]
HSIMambaは、双方向の逆畳み込みニューラルネットワークパスを使用して、スペクトル特徴をより効率的に抽出する新しいフレームワークである。
提案手法は,CNNの動作効率と,トランスフォーマに見られる注意機構の動的特徴抽出機能を組み合わせたものである。
このアプローチは、現在のベンチマークを超えて分類精度を改善し、トランスフォーマーのような高度なモデルで遭遇する計算の非効率性に対処する。
論文 参考訳(メタデータ) (2024-03-30T07:27:36Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - Generalizing Face Forgery Detection with High-frequency Features [63.33397573649408]
現在のCNNベースの検出器は、メソッド固有の色テクスチャに過度に適合するため、一般化に失敗する傾向にある。
フェースフォージェリ検出に高周波雑音を用いることを提案する。
1つは、複数のスケールで高周波ノイズを抽出するマルチスケールの高周波特徴抽出モジュールである。
2つ目は、低レベルRGB特徴抽出器を導く残差誘導空間注意モジュールで、新しい視点からフォージェリートレースにもっと集中する。
論文 参考訳(メタデータ) (2021-03-23T08:19:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。