論文の概要: Aletheia: Physics-Conditioned Localized Artifact Attention (PhyLAA-X) for End-to-End Generalizable and Robust Deepfake Video Detection
- arxiv url: http://arxiv.org/abs/2604.16486v1
- Date: Mon, 13 Apr 2026 08:14:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.021446
- Title: Aletheia: Physics-Conditioned Localized Artifact Attention (PhyLAA-X) for End-to-End Generalizable and Robust Deepfake Video Detection
- Title(参考訳): Aletheia: エンド・ツー・エンドの一般化とロバストなディープフェイクビデオ検出のための物理条件による局所的アーティファクト注意(PhyLAA-X)
- Authors: Devendra Ghori,
- Abstract要約: 局所的アーティファクト注意(LAA-X)を物理条件で拡張したPhyLAAA-Xについて紹介する。
PhyLAA-Xは、光フローカール、スペクトル反射、空間的上昇をLAA-Xの注意に注入する。
これによりネットワークはセマンティックな矛盾や物理的違反が共起する境界を学習せざるを得なくなる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art deepfake detectors achieve near-perfect in-domain accuracy yet degrade under cross-generator shifts, heavy compression, and adversarial perturbations. The core limitation remains the decoupling of semantic artifact learning from physical invariants: optical-flow discontinuities, specular-reflection inconsistencies, and cardiac-modulated reflectance (rPPG) are treated either as post-hoc features or ignored. We introduce PhyLAA-X, a novel physics-conditioned extension of Localized Artifact Attention (LAA-X). PhyLAA-X injects three end-to-end differentiable physics-derived feature volumes - optical-flow curl, specular-reflectance skewness, and spatially-upsampled rPPG power spectra - directly into the LAA-X attention computation via cross-attention gating and a resonance consistency loss. This forces the network to learn manipulation boundaries where semantic inconsistencies and physical violations co-occur - regions inherently harder for generative models to replicate consistently. PhyLAA-X is embedded across an efficient spatiotemporal ensemble (EfficientNet-B4+BiLSTM, ResNeXt-101+Transformer, Xception+causal Conv1D) with uncertainty-aware adaptive weighting. On FaceForensics++ (c23), Aletheia reaches 97.2% accuracy / 0.992 AUC-ROC; on Celeb-DF v2, 94.9% / 0.981; on DFDC, 90.8% / 0.966 - outperforming the strongest published baseline (LAA-Net [1]) by 4.1-7.3% in cross-generator settings and maintaining 79.4% accuracy under epsilon = 0.02 PGD-10 attacks. Single-backbone ablations confirm PhyLAA-X alone delivers a 4.2% cross-dataset AUC gain. The full production system is open-sourced at https://github.com/devghori1264/Aletheia (v1.2, April 2026) with pretrained weights, the adversarial corpus (referred to as ADC-2026 in this work), and complete reproducibility artifacts.
- Abstract(参考訳): 最先端のディープフェイク検出器は、クロスジェネレータシフト、重い圧縮、対向的な摂動の下でほぼ完璧なドメイン内精度を達成する。
光-流れの不連続性、分光-反射不整合、心変調反射(rPPG)はポストホックの特徴として扱われるか無視される。
我々はPhyLAA-Xを紹介した。これは新しい物理条件付き局所的アーティファクト注意(LAA-X)の拡張である。
PhyLAA-Xは、光学フローカール、スペクトル反射歪、空間的に増幅されたrPPGパワースペクトルの3つのエンド・ツー・エンドの物理起源の特徴ボリュームを、相互アテンションゲーティングと共振整合損失によって直接LAA-Xアテンション計算に注入する。
これにより、ネットワークは、意味的不整合と物理的違反が共起する領域である操作境界を学習せざるを得ない。
PhyLAA-X は効率的な時空間アンサンブル (EfficientNet-B4+BiLSTM, ResNeXt-101+Transformer, Xception+causal Conv1D) に埋め込まれ、不確実性を認識した適応重み付けを行う。
FaceForensics++ (c23)では、Aletheiaは97.2%の精度/0.992のAUC-ROC、Celeb-DF v2, 94.9% / 0.981、DFDCでは90.8% / 0.966に達する。
シングルバックのアブリゲーションにより、PhyLAA-Xだけで4.2%のAUCゲインが得られる。
完全な生産システムはhttps://github.com/devghori1264/Aletheia (v1.2, April 2026)でオープンソース化され、事前訓練された重量、対向コーパス(この作品ではADC-2026)、再現性のあるアーティファクトが完成している。
関連論文リスト
- Beyond Anatomy: Explainable ASD Classification from rs-fMRI via Functional Parcellation and Graph Attention Networks [6.923757075165361]
解剖学的脳解析は rs-fMRI に基づく自閉症スペクトラム障害 (ASD) の分類を支配している。
ABIDE Iデータセット上の解剖学的(AAL)と機能的(MSDL)パーセレーション戦略を比較したグラフベースのディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-03T02:05:20Z) - Plug-and-Play Diffusion Meets ADMM: Dual-Variable Coupling for Robust Medical Image Reconstruction [45.25461515976432]
画像再構成のための強力なパラダイムとして,DP(Plug-and-Play diffusion prior)フレームワークが登場した。
本稿では, バイアス・ハロシン化トレードオフを解消し, 収束を著しく加速した最先端の勾配を実現するための新しい手法を提案する。
論文 参考訳(メタデータ) (2026-02-26T16:58:43Z) - Residual Koopman Spectral Profiling for Predicting and Preventing Transformer Training Instability [40.24077350481118]
トランスフォーマーのトレーニングのばらつきは計算を無駄にするが、実践者は高価なランニングの開始後にのみ不安定を発見する。
我々はRKSP(Residual Koopman Spectral Profiling)について検討した。
我々の中心的な診断は、近単位スペクトル質量であり、単位円の近くに集中したモードの分画を定量化し、不安定なリスクを捉えます。
論文 参考訳(メタデータ) (2026-02-26T13:33:25Z) - Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage [65.51149575007149]
本稿では,Fun-DDPSについて述べる。Fun-DDPSは,関数空間拡散モデルと微分可能なニューラル演算子サロゲートを結合した生成フレームワークである。
Fun-DDPSは、ジョイントステートベースラインで観察される高周波アーティファクトから、物理的に一貫した実現をもたらす。
論文 参考訳(メタデータ) (2026-02-12T18:58:12Z) - Halt the Hallucination: Decoupling Signal and Semantic OOD Detection Based on Cascaded Early Rejection [7.227431306238601]
粗い論理による異常検出のための階層的フィルタリングを実現するカスケード早期退避(CER)フレームワークを提案する。
実験の結果、CERは計算オーバーヘッドを32%削減するだけでなく、CIFAR-100ベンチマークの大幅な性能向上も達成している。
論文 参考訳(メタデータ) (2026-02-06T02:55:35Z) - A Universal and Robust Framework for Multiple Gas Recognition Based-on Spherical Normalization-Coupled Mahalanobis Algorithm [16.05394499283827]
本研究では,開集合ガス認識のための共通後処理モジュールである球正規化結合マハラノビス (SNM) モジュールを提案する。
Vergaraデータセットの実験により、Transformer+SNM構成は、複数のターゲットガス間での判別において、ほぼ理論的な限界性能を達成することが示された。
論文 参考訳(メタデータ) (2025-12-28T05:33:05Z) - Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection [2.8547732086436306]
教師付きディープラーニングの基本的限界は「一般化崩壊」である
階層型2段階表現学習フレームワークであるLatent Sculptingを提案する。
我々は「浸潤」のシナリオについて88.89%の検知率を報告した。
論文 参考訳(メタデータ) (2025-12-19T11:37:02Z) - FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation [19.153777175873547]
FP-AbDiffはFokker-Planck Equation (FPE) 物理を誘導する最初の抗体生成装置である。
生成力学を物理法則と整合させることにより、FP-AbDiffは堅牢性と一般化性を高め、物理的に忠実で機能的に実行可能な抗体設計のための原則化されたアプローチを確立する。
論文 参考訳(メタデータ) (2025-11-05T01:44:37Z) - Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。