Fugu-MT 論文翻訳(概要): Fusing Global and Local Features for Generalized AI-Synthesized Image Detection

論文の概要: Fusing Global and Local Features for Generalized AI-Synthesized Image Detection

arxiv url: http://arxiv.org/abs/2203.13964v1
Date: Sat, 26 Mar 2022 01:55:37 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-29 14:42:36.011313
Title: Fusing Global and Local Features for Generalized AI-Synthesized Image Detection
Title（参考訳）: 一般化AI合成画像検出のためのグローバル・ローカル特徴の融合
Authors: Yan Ju, Shan Jia, Lipeng Ke, Hongfei Xue, Koki Nagano, Siwei Lyu
Abstract要約: 画像全体からのグローバル空間情報と,新しいパッチ選択モジュールによって選択されたパッチからの局所的な情報的特徴を結合する2分岐モデルを設計する。さまざまなオブジェクトと解像度を持つ19のモデルで合成された非常に多様なデータセットを収集し、モデルを評価する。
参考スコア（独自算出の注目度）: 31.35052580048599
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the development of the Generative Adversarial Networks (GANs) and DeepFakes, AI-synthesized images are now of such high quality that humans can hardly distinguish them from real images. It is imperative for media forensics to develop detectors to expose them accurately. Existing detection methods have shown high performance in generated images detection, but they tend to generalize poorly in the real-world scenarios, where the synthetic images are usually generated with unseen models using unknown source data. In this work, we emphasize the importance of combining information from the whole image and informative patches in improving the generalization ability of AI-synthesized image detection. Specifically, we design a two-branch model to combine global spatial information from the whole image and local informative features from multiple patches selected by a novel patch selection module. Multi-head attention mechanism is further utilized to fuse the global and local features. We collect a highly diverse dataset synthesized by 19 models with various objects and resolutions to evaluate our model. Experimental results demonstrate the high accuracy and good generalization ability of our method in detecting generated images.
Abstract（参考訳）: GAN(Generative Adversarial Networks)とDeepFakes(DeepFakes)の開発により、AI合成画像は高品質になり、人間が実際の画像と区別することがほとんどなくなった。メディアの鑑識はそれらを正確に露呈する検出器を開発することが不可欠である。既存の検出手法は、生成した画像の検出において高い性能を示してきたが、実際のシナリオでは、合成画像は、未知のソースデータを用いて、通常見えないモデルで生成される。本稿では,ai合成画像検出の一般化能力を向上させる上で,画像全体からの情報と情報パッチを組み合わせることの重要性を強調する。具体的には,新しいパッチ選択モジュールによって選択された複数のパッチから,画像全体からのグローバル空間情報と局所的な情報特徴を組み合わせた2分岐モデルを設計する。マルチヘッドアテンション機構は、グローバルな特徴とローカルな特徴を融合するためにさらに活用される。 19のモデルで合成された非常に多様なデータセットを,さまざまなオブジェクトと解像度で収集し,モデルを評価する。実験の結果, 生成画像の検出において, 高精度かつ良好な一般化が得られた。

関連論文リスト

NS-Net: Decoupling CLIP Semantic Information through NULL-Space for Generalizable AI-Generated Image Detection [14.7077339945096]
NS-Netは、CLIPの視覚的特徴から意味情報を分離する新しいフレームワークである。実験の結果、NS-Netは既存の最先端手法よりも優れており、検出精度は7.4%向上している。
論文参考訳（メタデータ） (2025-08-02T07:58:15Z)
MLEP: Multi-granularity Local Entropy Patterns for Universal AI-generated Image Detection [44.40575446607237]
AI生成画像(AIGI)を効果的に検出する手法が緊急に必要である。マルチグラニュラリティ局所エントロピーパターン (MLEP) を提案する。 MLEPは、画像のセマンティクスを著しく破壊し、潜在的なコンテンツバイアスを低減しながら、次元とスケールの画素関係を包括的にキャプチャする。
論文参考訳（メタデータ） (2025-04-18T14:50:23Z)
Learning Universal Features for Generalizable Image Forgery Localization [53.666188847170915]
GIFL(Generalizable Image Forgery Localization)へのアプローチを提案する。我々のモデルは、目に見える偽造物と見えない偽造物の両方を検出することができ、生成AIの時代において、偽情報に対抗するためのより実践的で効率的なソリューションを提供する。本手法は,特定の偽造物の痕跡ではなく,プリスタンコンテンツから一般的な特徴を学習することに焦点を当てる。
論文参考訳（メタデータ） (2025-04-10T05:20:29Z)
HFMF: Hierarchical Fusion Meets Multi-Stream Models for Deepfake Detection [4.908389661988192]
HFMFは総合的な2段階のディープフェイク検出フレームワークである。視覚変換器と畳み込みネットを階層的特徴融合機構を通じて統合する。私たちのアーキテクチャは、多様なデータセットベンチマークで優れたパフォーマンスを実現しています。
論文参考訳（メタデータ） (2025-01-10T00:20:29Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
Semi-Truths: A Large-Scale Dataset of AI-Augmented Images for Evaluating Robustness of AI-Generated Image detectors [62.63467652611788]
実画像27,600枚、223,400枚、AI拡張画像1,472,700枚を含むSEMI-TRUTHSを紹介する。それぞれの画像には、検出器のロバスト性の標準化と目標評価のためのメタデータが添付されている。以上の結果から,現状の検出器は摂動の種類や程度,データ分布,拡張方法に様々な感度を示すことが示唆された。
論文参考訳（メタデータ） (2024-11-12T01:17:27Z)
A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
ディープニューラルネットワークは、アンダーサンプル計測から高忠実度画像を再構成する大きな可能性を示している。我々のモデルは、離散化に依存しないアーキテクチャであるニューラル演算子に基づいている。我々の推論速度は拡散法よりも1,400倍速い。
論文参考訳（メタデータ） (2024-10-05T20:03:57Z)
Present and Future Generalization of Synthetic Image Detectors [0.6144680854063939]
この研究は系統的な分析を行い、その洞察を用いて、堅牢な合成画像検出器の訓練のための実践的ガイドラインを開発する。モデル一般化機能は、実際のデプロイメント条件を含む、さまざまな設定で評価される。現在の手法は特定のシナリオにおいて優れているが、単一の検出器が普遍的な効果を達成できないことを示す。
論文参考訳（メタデータ） (2024-09-21T12:46:17Z)
Contrasting Deepfakes Diffusion via Contrastive Learning and Global-Local Similarities [88.398085358514]
Contrastive Deepfake Embeddings (CoDE)は、ディープフェイク検出に特化した新しい埋め込み空間である。 CoDEは、グローバルローカルな類似性をさらに強化することで、対照的な学習を通じて訓練される。
論文参考訳（メタデータ） (2024-07-29T18:00:10Z)
Improving Interpretability and Robustness for the Detection of AI-Generated Images [6.116075037154215]
凍結したCLIP埋め込みに基づいて、既存の最先端AIGI検出手法を解析する。さまざまなAIジェネレータが生成する画像が実際の画像とどのように異なるかを示す。
論文参考訳（メタデータ） (2024-06-21T10:33:09Z)
GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文参考訳（メタデータ） (2024-02-03T03:13:50Z)
Rethinking the Up-Sampling Operations in CNN-based Generative Network for Generalizable Deepfake Detection [86.97062579515833]
我々は、アップサンプリング操作から生じる一般化された構造的アーティファクトをキャプチャし、特徴付ける手段として、NPR(Neighboring Pixel Relationships)の概念を紹介した。 tft28の異なる生成モデルによって生成されたサンプルを含む、オープンワールドデータセット上で包括的な分析を行う。この分析は、新しい最先端のパフォーマンスを確立し、既存の手法よりも優れたtft11.6%の向上を示している。
論文参考訳（メタデータ） (2023-12-16T14:27:06Z)
Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文参考訳（メタデータ） (2023-12-12T14:45:45Z)
Generalizable Synthetic Image Detection via Language-guided Contrastive Learning [22.4158195581231]
偽ニュースの拡散や偽のプロフィールの作成などの合成画像の真偽の使用は、画像の真正性に関する重要な懸念を提起する。本稿では,言語指導によるコントラスト学習と検出問題の新たな定式化による,シンプルで効果的な合成画像検出手法を提案する。提案したLanguAge-guided SynThEsis Detection (LASTED) モデルでは,画像生成モデルに対する一般化性が大幅に向上していることが示されている。
論文参考訳（メタデータ） (2023-05-23T08:13:27Z)
GLFF: Global and Local Feature Fusion for AI-synthesized Image Detection [29.118321046339656]
画像全体から複数スケールのグローバルな特徴と、AI合成画像検出のための情報パッチからの洗練されたローカル特徴を組み合わせることで、リッチで差別的な表現を学習するフレームワークを提案する。 GLFFは、マルチスケールの意味的特徴を抽出するグローバルブランチと、詳細なローカルアーティファクト抽出のための情報パッチを選択するローカルブランチの2つのブランチから情報を抽出する。
論文参考訳（メタデータ） (2022-11-16T02:03:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。