論文の概要: How Fragile Are Training-Free AI-Generated Image Detectors? A Controlled Audit of Score Direction, Preprocessing, and Compression
- arxiv url: http://arxiv.org/abs/2606.20488v1
- Date: Thu, 18 Jun 2026 17:05:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:40.008309
- Title: How Fragile Are Training-Free AI-Generated Image Detectors? A Controlled Audit of Score Direction, Preprocessing, and Compression
- Title(参考訳): トレーニング不要のAI生成画像検出器はどんなものか? スコアの方向、前処理、圧縮の制御された監査
- Authors: Jingwen Zhou, Mingzhe Wang,
- Abstract要約: オートエンコーダ・リコンストラクションスコア(AEROBLADE-style)とノイズ摂動特徴相似スコア(RIGID-style)の2つの代表的なトレーニングフリースコアを監査する。
監査は3つの注意深い結果をもたらす。
- 参考スコア(独自算出の注目度): 6.3999417080764225
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training-free detectors of AI-generated images promise generator-agnostic deployment without classifier training, yet their reported numbers are rarely compared under a single controlled protocol. We audit two representative training-free scores -- an autoencoder-reconstruction score (AEROBLADE-style) and a noise-perturbation feature-similarity score (RIGID-style) -- plus a naive feature-kNN control, on a common 1,500-image GenImage-derived benchmark spanning seven generators and JPEG compression at quality 70 and 50. The audit yields three cautionary findings. (i) Implementation details masquerade as method differences: replacing the LPIPS backbone (AlexNet -> VGG-16) changes overall AUROC by +0.085, and switching between resize-to-512 and native-resolution preprocessing flips per-generator conclusions by up to 0.38 AUROC. (ii) Score direction is not a property of the method but of its hyperparameters: the RIGID-style score is inverted (AUROC < 0.5) on SD1.5 and Wukong at noise level sigma=0.05, recovers to >0.5 for every generator at sigma=0.01, and collapses to 0.15 at sigma=0.3. (iii) Dataset format bias inflates robustness claims: without unified re-encoding, AUROC under JPEG-50 exceeds the clean condition for the AlexNet-backbone reconstruction score; after bias correction the residual anomaly localizes to a single generator (BigGAN). The audited scores have complementary per-generator failure sets, but naive z-score fusion does not beat the best single score, indicating that exploiting complementarity requires direction-aware combination.
- Abstract(参考訳): AI生成画像のトレーニング不要検出器は、分類器トレーニングなしでジェネレータに依存しないデプロイメントを約束するが、報告された数値は単一の制御プロトコルで比較されることは滅多にない。
我々は,7つのジェネレータとJPEG圧縮品質70~50にまたがる,1500イメージ由来の一般的なベンチマークにおいて,2つの代表的なトレーニングフリースコア – オートエンコーダ・リコンストラクションスコア(AEROBLADE-style)とノイズ摂動特徴相似スコア(RIGID-style) – を評価した。
監査は3つの注意深い結果をもたらす。
i)LPIPSバックボーン(AlexNet -> VGG-16)がAUROC全体を+0.085変更し、resize-to-512とネイティブ解像度の前処理フリップを0.38AUROCに切り替えた。
(ii)スコア方向はメソッドの特性ではなく,そのハイパーパラメータの性質である。SD1.5ではRIGID型スコアが逆転(AUROC < 0.5)し,Sigma=0.05ではWukongが,Sigma=0.01では各ジェネレータに対して0.5に回復し,Sigma=0.0.3では0.15に崩壊する。
JPEG-50のAUROCは、AlexNetバックボーン復元スコアのクリーンな条件を超え、バイアス補正後、残余異常が1つのジェネレータ(BigGAN)に局所化される。
監査されたスコアは、ジェネレータ毎の相補的な故障セットを持つが、素早いzスコア融合は最高のシングルスコアを達成せず、相補性を活用するには方向認識の組み合わせが必要であることを示している。
関連論文リスト
- How Much Capacity Does EEG Denoising Need? Ultra-Compact Networks reveal Benchmark Saturation and Metric-Utility Gap [0.0]
深層学習EEG(Deep Learning EEG Denoising Architectures)は、数万から数千万のパラメータに拡張されているが、実験変数としてモデルキャパシティを分離した以前の研究はない。
アーキテクチャ,損失,データ分割,トレーニングレシピの両ギャップに対処し,最小限の深さ分離可能な畳み込みU-Netで1.05Kから40.26Kパラメータまでのチャネル幅を網羅する。
論文 参考訳(メタデータ) (2026-06-07T12:17:25Z) - Amplifying, Not Learning: Fine-Tuned AI Text Detectors Amplify a Pretrained Direction [51.56484100374058]
テキスト検出器は、事前訓練された典型軸を増幅する。
タスク監督前の生エンコーダでは、3つのアーキテクチャでNYT-vs-HC3 AUROC 0.806/0.944/0.834を達成する。
RoBERTaベースでは、生のプロジェクションは微調整を超えるが、RoBERTaベースでは、フル微調整は、試験された流線型人口の双方で生よりも識別を小さくする。
論文 参考訳(メタデータ) (2026-05-20T19:08:38Z) - A Comparative Study of Modern Object Detectors for Robust Apple Detection in Orchard Imagery [0.0]
本研究は,AppleBBCH81データセットを用いた単一クラスリンゴ検出のベンチマークを確立する。
検証分割では、YOLOv10nが最も厳格なローカライゼーション性能を達成する。
YOLOv10nは最高F1スコアを獲得し、RT-DETR-Lは非常に高いリコールを達成できるが、精度は低い。
論文 参考訳(メタデータ) (2026-04-11T02:56:42Z) - VA-$π$: Variational Policy Alignment for Pixel-Aware Autoregressive Generation [65.22452273252428]
VA-$は自動回帰視覚生成を最適化するポストトレーニングフレームワークである。
ピクセル再構成と自己回帰モデリングを統一する。
FIDを14.36から7.65に削減し、ISをLlamaGen-XXLで86.55から116.70に改善する。
論文 参考訳(メタデータ) (2025-12-22T18:54:30Z) - CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal [84.71254539482369]
検証可能な報酬を伴うグループ相対的強化学習(RLVR)は、しばしば、すでに失敗している最も情報に富むデータを浪費する。
エラーを監督するマルチモーダル推論のための,障害中心のポストトレーニングフレームワークであるCAREを提案する。
CAREは正確さを改善し、スムーズさをトレーニングすると同時に、障害からの学習信号のシェアを明示的に増やします。
論文 参考訳(メタデータ) (2025-12-22T16:34:21Z) - I Detect What I Don't Know: Incremental Anomaly Learning with Stochastic Weight Averaging-Gaussian for Oracle-Free Medical Imaging [2.384534878752428]
異常ラベルを使わずに,信頼度の高い正規サンプル群を漸進的に拡張する,教師なしのオラクルフリーフレームワークを導入する。
凍結した事前訓練された視覚バックボーンは、小さな畳み込みアダプタで拡張され、無視できる計算オーバーヘッドを伴う高速なドメイン適応が保証される。
COVID-CXRでは、ROC-AUCは0.9489から0.9982に改善され、肺炎CXRでは0.6834から0.8968に上昇し、脳MRIではND-5では0.6041から0.7269に上昇する。
論文 参考訳(メタデータ) (2025-11-05T23:28:14Z) - Guided Score identity Distillation for Data-Free One-Step Text-to-Image Generation [62.30570286073223]
拡散に基づくテキスト・画像生成モデルは、テキスト記述と整合した画像を生成する能力を実証している。
本研究では, 実データにアクセスすることなく, 事前学習した拡散モデルの効率的な蒸留を可能にする, データフリーガイド蒸留法を提案する。
データフリー蒸留法は, 1ステップ生成装置で生成した合成画像のみをトレーニングすることにより, FIDとCLIPのスコアを急速に向上させ, 競争力のあるCLIPスコアを維持しつつ, 最先端のFID性能を実現する。
論文 参考訳(メタデータ) (2024-06-03T17:44:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。