Fugu-MT 論文翻訳(概要): ReAlign: Generalizable Image Forgery Detection via Reasoning-Aligned Representation

論文の概要: ReAlign: Generalizable Image Forgery Detection via Reasoning-Aligned Representation

arxiv url: http://arxiv.org/abs/2605.16080v1
Date: Fri, 15 May 2026 15:43:44 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-18 21:22:26.345156
Title: ReAlign: Generalizable Image Forgery Detection via Reasoning-Aligned Representation
Title（参考訳）: ReAlign:Reasoning-Aligned Representationによる一般画像偽造検出
Authors: Qing Huang, Zhipei Xu, Xuanyu Zhang, Xiangyu Yu, Jian Zhang,
Abstract要約: AI生成画像(AIGI)の台頭は、デジタル認証の課題を増大させている。既存の方法は、LLMベースでもLLMベースでも、それぞれ異なる利点と限界を示している。高品質な推論テキストを軽量AIGI検出器に蒸留する新しいフレームワークであるReAlignを提案する。
参考スコア（独自算出の注目度）: 20.53808948318056
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The rise of AI-generated images (AIGIs) poses growing challenges for digital authenticity, prompting the need for efficient, generalizable image forgery detection systems. Existing methods, whether non-LLM-based or LLM-based, exhibit distinct advantages and limitations. While non-LLM-based models offer efficient low-level artifact detection, they often lack semantic understanding. Conversely, LLM-based methods provide strong semantic reasoning and explainability but are computationally intensive and less sensitive to subtle visual artifacts. Moreover, the true contribution of explanatory reasoning texts to forgery detection performance remains unclear. In this work, we investigate the intrinsic value and potential of LLM-generated reasoning texts, considering it a source of generalization and semantic-error sensitivity. Based on these findings, we propose ReAlign, a novel framework that distills high-quality reasoning texts generated by a GRPO-optimized LLM into a lightweight AIGI detector via contrastive learning. ReAlign effectively inherits the generalization ability and semantic sensitivity capability of reasoning textual representations, while remaining efficient and lightweight for deployment. Moreover, ReAlign adopts a tailored joint optimization strategy that integrates contrastive loss for image-text alignment and classification loss for accurate forgery discrimination. Experimental results on AIGCDetectBenchmark, AIGI-Holmes, and our newly constructed UltraSynth-10k demonstrate that ReAlign consistently outperforms existing state-of-the-art detectors in both accuracy and generalization, particularly when facing complex, high-fidelity forgeries from modern generative models.
Abstract（参考訳）: AI生成画像(AIGIs)の台頭は、デジタル認証の課題が増大し、効率的で一般化可能な画像偽造検出システムの必要性が高まっている。既存の方法は、LLMベースでもLLMベースでも、それぞれ異なる利点と限界を示している。非LLMベースのモデルは、効率的な低レベルのアーティファクト検出を提供するが、セマンティックな理解が欠けていることが多い。逆に、LLMベースの手法は、強い意味論的推論と説明可能性を提供するが、計算集約性があり、微妙な視覚的アーティファクトにはあまり敏感ではない。さらに, 説明的推論テキストの偽造検出性能への真の寄与は, いまだ不明である。本研究では,LLM生成推論テキストの本質的価値と可能性について,一般化とセマンティックエラー感度の源泉として検討する。これらの知見に基づいて,GRPO最適化LLMによって生成された高品質な推論テキストを,コントラスト学習による軽量AIGI検出器に蒸留する新しいフレームワークReAlignを提案する。 ReAlignは、テキスト表現の推論の一般化能力とセマンティック・セマンティック・セマンティック・セマンティック・セマンティクスの能力を効果的に継承する一方で、デプロイには効率的で軽量なままである。さらに、ReAlignは、画像テキストアライメントのためのコントラスト損失と、正確な偽造識別のための分類損失を統合した、調整された共同最適化戦略を採用している。 AIGCDetectBenchmark,AIGI-Holmes,および我々の新たに構築したUltraSynth-10kの実験結果は、ReAlignが既存の最先端検出器を精度と一般化の両方で一貫して上回っていることを示す。

関連論文リスト

GenShield: Unified Detection and Artifact Correction for AI-Generated Images [65.11434977803509]
GenShieldは、診断から修復までのクローズドループでAIGI検出とアーティファクト修正を実行するフレームワークである。大規模なアーティファクト-restored'ペアを備えた高品質データセットは、統一された評価パイプラインと共に構築される。
論文参考訳（メタデータ） (2026-05-15T16:06:20Z)
Boosting Robust AIGI Detection with LoRA-based Pairwise Training [55.076681464804636]
現在のAIGI検出器はクリーンなデータセットで良好に動作しますが、その検出性能は"野生"に展開すると低下します。本稿では,高度歪み下でのAIGIの堅牢な検出を実現するために,Lo-based Pairwise Training (RA) 戦略を提案する。
論文参考訳（メタデータ） (2026-04-14T05:35:32Z)
Generalizable Detection of AI Generated Images with Large Models and Fuzzy Decision Tree [30.175850837300317]
悪意のある使用とAI生成画像の普及は、デジタルコンテンツの信頼性に深刻な脅威をもたらす。既存の検出方法は、生成パイプライン内の一般的な操作ステップによって残された低レベルのアーティファクトを利用する。本稿では,ファジィ決定木を介して,軽量な人工物認識検出器とMLLMを統合したAI生成画像検出フレームワークを提案する。
論文参考訳（メタデータ） (2026-03-30T14:43:14Z)
Unveiling Perceptual Artifacts: A Fine-Grained Benchmark for Interpretable AI-Generated Image Detection [95.08316274158165]
X-AIGDは、低レベルの歪み、高レベルの意味論、認知レベルの反事実など、知覚的アーティファクトのピクセルレベルの分類されたアノテーションを提供する。既存のAIGI検出器は、最も基本的な歪みレベルであっても、知覚的アーティファクトに依存しない。モデル注意をアーティファクト領域と明確に整合させることは、検出器の解釈可能性と一般化を高めることができる。
論文参考訳（メタデータ） (2026-01-27T10:09:17Z)
INSIGHT: An Interpretable Neural Vision-Language Framework for Reasoning of Generative Artifacts [0.0]
現在の法医学システムは、現実世界の条件下で急速に低下している。ほとんどの検出器は不透明物として機能し、なぜ画像が合成物としてフラグ付けされるのかについての知見はほとんど得られない。本稿では,AI生成画像のロバスト検出と透過的説明のための統合フレームワークであるINSIGHTを紹介する。
論文参考訳（メタデータ） (2025-11-27T11:43:50Z)
Semantic Visual Anomaly Detection and Reasoning in AI-Generated Images [96.43608872116347]
AnomReasonは4倍のtextbfAnomAgentのような構造化アノテーションを備えた大規模ベンチマーク AnomReasonとAnomAgentは、AI生成画像の意味的妥当性の測定と改善の基盤となっている。
論文参考訳（メタデータ） (2025-10-11T14:09:24Z)
Self-Disguise Attack: Induce the LLM to disguise itself for AIGT detection evasion [16.94434185181644]
SDA(Self-Disguise Attack)は、大規模言語モデルがその出力を積極的に偽装できる新しいアプローチである。 SDA は,3 種類の LLM が生成するテキスト間での各種 AIGT 検出器の平均検出精度を効果的に低減することを示す。
論文参考訳（メタデータ） (2025-08-20T04:17:03Z)
LAID: Lightweight AI-Generated Image Detection in Spatial and Spectral Domains [6.676901499867856]
現在の最先端AIGI検出方法は、大規模で深いニューラルネットワークアーキテクチャに依存している。我々は、市販軽量ニューラルネットワークの検知性能と効率をベンチマークし、評価する最初のフレームワークであるLAIDを紹介する。本研究は, 競合条件下であっても, 軽量モデルが競合精度を達成できることを実証する。
論文参考訳（メタデータ） (2025-07-07T16:18:19Z)
Interpretable and Reliable Detection of AI-Generated Images via Grounded Reasoning in MLLMs [43.08776932101172]
私たちは、バウンディングボックスと記述キャプションを付加したAI生成画像のデータセットを構築します。次に、多段階最適化戦略によりMLLMを微調整する。得られたモデルは、AI生成画像の検出と視覚的欠陥のローカライズの両方において、優れた性能を達成する。
論文参考訳（メタデータ） (2025-06-08T08:47:44Z)
Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文参考訳（メタデータ） (2024-11-23T19:10:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。