論文の概要: SciFigDetect: A Benchmark for AI-Generated Scientific Figure Detection
- arxiv url: http://arxiv.org/abs/2604.08211v1
- Date: Thu, 09 Apr 2026 13:11:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.930347
- Title: SciFigDetect: A Benchmark for AI-Generated Scientific Figure Detection
- Title(参考訳): SciFigDetect:AIによる科学的フィギュア検出のベンチマーク
- Authors: You Hu, Chenzhuo Zhao, Changfa Mo, Haotian Liu, Xiaobai Li,
- Abstract要約: 我々は,AIによる科学的人物検出のための最初のベンチマークを示す。
その結果、現在の手法はゼロショット転送で劇的に失敗し、強力なジェネレータ固有のオーバーフィッティングを示し、一般的な後処理の腐敗の下でも脆弱であることがわかった。
このベンチマークが、堅牢で一般化可能な科学フィギュア法医学研究の基盤となることを願っている。
- 参考スコア(独自算出の注目度): 29.031594944403096
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern multimodal generators can now produce scientific figures at near-publishable quality, creating a new challenge for visual forensics and research integrity. Unlike conventional AI-generated natural images, scientific figures are structured, text-dense, and tightly aligned with scholarly semantics, making them a distinct and difficult detection target. However, existing AI-generated image detection benchmarks and methods are almost entirely developed for open-domain imagery, leaving this setting largely unexplored. We present the first benchmark for AI-generated scientific figure detection. To construct it, we develop an agent-based data pipeline that retrieves licensed source papers, performs multimodal understanding of paper text and figures, builds structured prompts, synthesizes candidate figures, and filters them through a review-driven refinement loop. The resulting benchmark covers multiple figure categories, multiple generation sources and aligned real--synthetic pairs. We benchmark representative detectors under zero-shot, cross-generator, and degraded-image settings. Results show that current methods fail dramatically in zero-shot transfer, exhibit strong generator-specific overfitting, and remain fragile under common post-processing corruptions. These findings reveal a substantial gap between existing AIGI detection capabilities and the emerging distribution of high-quality scientific figures. We hope this benchmark can serve as a foundation for future research on robust and generalizable scientific-figure forensics. The dataset is available at https://github.com/Joyce-yoyo/SciFigDetect.
- Abstract(参考訳): 現代のマルチモーダル・ジェネレータは、ほぼ公開可能な品質で科学的数値を生成できるようになり、視覚科学と研究の整合性に対する新たな挑戦を生み出した。
従来のAI生成の自然画像とは異なり、科学的人物は構造化されており、テキスト密度があり、学術的な意味論と密に一致している。
しかし、既存のAI生成画像検出ベンチマークと手法は、ほとんど完全にオープンドメインの画像のために開発されており、この設定はほとんど探索されていない。
我々は,AIによる科学的人物検出のための最初のベンチマークを示す。
そこで我々は,ライセンスされた資料を検索し,論文テキストと図形をマルチモーダルに理解し,構造化されたプロンプトを構築し,候補図形を合成し,レビュー駆動リファインメントループでフィルタリングするエージェントベースのデータパイプラインを開発した。
結果として得られたベンチマークは、複数のフィギュアカテゴリ、複数の生成元、整列した実合成ペアをカバーしている。
ゼロショット、クロスジェネレータ、劣化画像設定で代表検出器をベンチマークする。
その結果、現在の手法はゼロショット転送で劇的に失敗し、強力なジェネレータ固有のオーバーフィッティングを示し、一般的な後処理の腐敗の下でも脆弱であることがわかった。
これらの結果から,既存のAIGI検出能力と,高品質な科学的指標の分布の出現との間には,かなりのギャップがあることが示唆された。
このベンチマークが、堅牢で一般化可能な科学フィギュア法医学研究の基盤となることを願っている。
データセットはhttps://github.com/Joyce-yoyo/SciFigDetect.comで公開されている。
関連論文リスト
- Beyond Semantics: Uncovering the Physics of Fakes via Universal Physical Descriptors for Cross-Modal Synthetic Detection [34.95491424781195]
そこで本研究では,すべてのテストデータセットに対して一貫した離散パワーを示す5つの物理特徴を同定する特徴選択アルゴリズムを提案する。
提案手法は,Wukong や SDv1.4 などのデータセットに対して,ほぼ完全な精度 (99.8%) で,複数のGenimageベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2026-04-06T11:50:29Z) - RealHD: A High-Quality Dataset for Robust Detection of State-of-the-Art AI-Generated Images [14.691738115737962]
実画像とAI生成画像の両方を含む複数のカテゴリにわたる730,000以上の画像からなる高品質で大規模なデータセットを提案する。
生成された画像は最先端の方法で合成され、テキスト・ツー・イメージ・ジェネレーション(念入りに設計された1万以上のプロンプトによって誘導される)、画像のインペインティング、画像の精細化、顔のスワップなどが含まれる。
我々のデータセットは、検出方法を評価するための強力なベンチマークとして機能するだけでなく、AI生成画像検出技術の堅牢性向上にも寄与する。
論文 参考訳(メタデータ) (2026-02-11T05:38:40Z) - Seeing What Matters: Generalizable AI-generated Video Detection with Forensic-Oriented Augmentation [31.737159092430108]
我々は、異なる生成的アーキテクチャを研究し、バイアスがなく、障害に対して堅牢で、モデル間で共有される差別的特徴を探索し識別する。
本稿では,ウェーブレット分解に基づく新たなデータ拡張戦略を導入し,より関連する法医学的手がかりを活用するために,特定の周波数関連帯域を置き換える。
本手法は最先端検出器よりも精度が向上し, 非常に最近の生成モデルにおいても優れた結果が得られる。
論文 参考訳(メタデータ) (2025-06-20T07:36:59Z) - RAID: A Dataset for Testing the Adversarial Robustness of AI-Generated Image Detectors [57.81012948133832]
本稿では,72kの多種多様かつ高い変換可能な対向例からなるRAID(Robust Evaluation of AI- generated Image Detectors)を提案する。
提案手法は,未知の検出器に高い成功率で転送する逆画像を生成する。
以上の結果から,現在最先端のAI生成画像検出器は,敵の例によって容易に認識できることが示唆された。
論文 参考訳(メタデータ) (2025-06-04T14:16:00Z) - Zero-Shot Detection of AI-Generated Images [54.01282123570917]
AI生成画像を検出するゼロショットエントロピー検出器(ZED)を提案する。
機械によるテキスト検出の最近の研究に触発された私たちのアイデアは、分析対象の画像が実際の画像のモデルと比較してどれだけ驚くかを測定することである。
ZEDは精度の点でSoTAよりも平均3%以上改善されている。
論文 参考訳(メタデータ) (2024-09-24T08:46:13Z) - Improving Interpretability and Robustness for the Detection of AI-Generated Images [6.116075037154215]
凍結したCLIP埋め込みに基づいて、既存の最先端AIGI検出手法を解析する。
さまざまなAIジェネレータが生成する画像が実際の画像とどのように異なるかを示す。
論文 参考訳(メタデータ) (2024-06-21T10:33:09Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - Beyond the Spectrum: Detecting Deepfakes via Re-Synthesis [69.09526348527203]
ディープフェイク(Deepfakes)として知られる非常に現実的なメディアは、現実の目から人間の目まで区別できない。
本研究では,テスト画像を再合成し,検出のための視覚的手がかりを抽出する,新しい偽検出手法を提案する。
種々の検出シナリオにおいて,提案手法の摂動に対する有効性の向上,GANの一般化,堅牢性を示す。
論文 参考訳(メタデータ) (2021-05-29T21:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。