論文の概要: Beyond Binary Classification: A Semi-supervised Approach to Generalized AI-generated Image Detection
- arxiv url: http://arxiv.org/abs/2511.19499v1
- Date: Sun, 23 Nov 2025 16:02:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.047671
- Title: Beyond Binary Classification: A Semi-supervised Approach to Generalized AI-generated Image Detection
- Title(参考訳): バイナリ分類を超えて:汎用AI生成画像検出のための半教師付きアプローチ
- Authors: Hong-Hanh Nguyen-Le, Van-Tuan Tran, Dinh-Thuc Nguyen, Nhien-An Le-Khac,
- Abstract要約: 現在の法医学における重大な脆弱性は、検出器がクロスジェネレータの一般化を達成できないことである。
本稿では,「フェイク」クラス内の潜在アーキテクチャパターンを発見することによって,バイナリ分類を強化する半教師付きアプローチを提案する。
- 参考スコア(独自算出の注目度): 1.189955933770711
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The rapid advancement of generators (e.g., StyleGAN, Midjourney, DALL-E) has produced highly realistic synthetic images, posing significant challenges to digital media authenticity. These generators are typically based on a few core architectural families, primarily Generative Adversarial Networks (GANs) and Diffusion Models (DMs). A critical vulnerability in current forensics is the failure of detectors to achieve cross-generator generalization, especially when crossing architectural boundaries (e.g., from GANs to DMs). We hypothesize that this gap stems from fundamental differences in the artifacts produced by these \textbf{distinct architectures}. In this work, we provide a theoretical analysis explaining how the distinct optimization objectives of the GAN and DM architectures lead to different manifold coverage behaviors. We demonstrate that GANs permit partial coverage, often leading to boundary artifacts, while DMs enforce complete coverage, resulting in over-smoothing patterns. Motivated by this analysis, we propose the \textbf{Tri}archy \textbf{Detect}or (TriDetect), a semi-supervised approach that enhances binary classification by discovering latent architectural patterns within the "fake" class. TriDetect employs balanced cluster assignment via the Sinkhorn-Knopp algorithm and a cross-view consistency mechanism, encouraging the model to learn fundamental architectural distincts. We evaluate our approach on two standard benchmarks and three in-the-wild datasets against 13 baselines to demonstrate its generalization capability to unseen generators.
- Abstract(参考訳): ジェネレータ(例えば、StyleGAN、Midjourney、DALL-E)の急速な進歩は、非常にリアルな合成画像を生み出し、デジタルメディアの信頼性に重大な課題を生んでいる。
これらのジェネレータは典型的にはいくつかの中核的なアーキテクチャファミリ(主にGAN(Generative Adversarial Networks)とDM(Diffusion Models))に基づいている。
現在の法医学における重大な脆弱性は、特にアーキテクチャの境界を越えた場合(例えば、GANからDMまで)、検出器がクロスジェネレータの一般化を達成できないことである。
このギャップは、これらの \textbf{distinct architectures} によって生成されるアーティファクトの根本的な違いに起因すると仮定する。
本稿では,GAN と DM アーキテクチャの異なる最適化目標が,多様体被覆挙動にどのように寄与するかを理論的に説明する。
GANは部分的カバレッジを許容し、しばしば境界アーティファクトにつながるが、DMは完全なカバレッジを強制し、結果として過度にスムースなパターンをもたらすことを示す。
この分析を動機として、"フェイク"クラス内の潜在アーキテクチャパターンを発見し、バイナリ分類を強化する半教師付きアプローチである、‘textbf{Tri}archy \textbf{Detect}or(TriDetect)’を提案する。
TriDetectでは、Sinkhorn-Knoppアルゴリズムとクロスビュー一貫性メカニズムを通じて、バランスの取れたクラスタ割り当てを採用している。
提案手法は,2つの標準ベンチマークと3つの標準データセットに対して,13のベースラインに対して評価し,未知のジェネレータへの一般化能力を実証する。
関連論文リスト
- OmniAID: Decoupling Semantic and Artifacts for Universal AI-Generated Image Detection in the Wild [40.585896860010656]
普遍的なAI生成画像検出器は、多様な生成モデルと多様なセマンティックコンテンツを同時に一般化する必要がある。
分離されたMixture-of-Expertsアーキテクチャを中心とした新しいフレームワークであるOmniAIDを提案する。
当社のモデルは既存のモノリシック検出器を超越し、最新の非破壊的脅威に対するAIGI認証の新しい堅牢な標準を確立します。
論文 参考訳(メタデータ) (2025-11-11T16:33:49Z) - Breaking Latent Prior Bias in Detectors for Generalizable AIGC Image Detection [11.907536189598577]
現在のAIGC検出器は、トレーニングに使用される同じジェネレータで生成された画像に対してほぼ完璧な精度を達成するが、目に見えないジェネレータからの出力に一般化するのに苦労する。
検出器は、堅牢な生成アーティファクトを学ぶのではなく、初期ノイズベクトルから発生するパターンに関連するショートカットを学習する。
そこで我々は, 発電機の出力多様体に残る逆数例を生成するオン・マニフォールド・逆数訓練(OMAT)を提案する。
論文 参考訳(メタデータ) (2025-06-01T07:20:45Z) - Towards Generalizable Forgery Detection and Reasoning [23.858913560970866]
We formulate detection and explanation as a unified forgery Detection and Reasoning task (FDR-Task)
マルチモーダル・フォージェリー推論データセット (MMFR-Dataset) は10つの生成モデルにわたる120K画像を含む大規模データセットであり, フォージェリー属性には378Kの推論アノテーションがある。
複数の生成モデルに対する実験により、FakeReasoningは堅牢な一般化を実現し、検出タスクと推論タスクの両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-03-27T06:54:06Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - Rethinking the Up-Sampling Operations in CNN-based Generative Network
for Generalizable Deepfake Detection [86.97062579515833]
我々は、アップサンプリング操作から生じる一般化された構造的アーティファクトをキャプチャし、特徴付ける手段として、NPR(Neighboring Pixel Relationships)の概念を紹介した。
tft28の異なる生成モデルによって生成されたサンプルを含む、オープンワールドデータセット上で包括的な分析を行う。
この分析は、新しい最先端のパフォーマンスを確立し、既存の手法よりも優れたtft11.6%の向上を示している。
論文 参考訳(メタデータ) (2023-12-16T14:27:06Z) - Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。
本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。
本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。