論文の概要: Toward Accountable AI-Generated Content on Social Platforms: Steganographic Attribution and Multimodal Harm Detection
- arxiv url: http://arxiv.org/abs/2604.10460v1
- Date: Sun, 12 Apr 2026 04:57:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.03051
- Title: Toward Accountable AI-Generated Content on Social Platforms: Steganographic Attribution and Multimodal Harm Detection
- Title(参考訳): ソーシャルプラットフォーム上の説明可能なAI生成コンテンツに向けて:ステレオ属性とマルチモーダルハーム検出
- Authors: Xinlei Guan, David Arosemena, Tejaswi Dhandu, Kuan Huang, Meng Xu, Miles Q. Li, Bingyu Shen, Ruiyang Qin, Umamaheswara Rao Tida, Boyang Li,
- Abstract要約: 生成AIは、コンテンツモデレーションとデジタル法医学における新しい課題を導入した。
良質なAI生成画像は、有害または誤解を招くテキストと組み合わせて、検出しにくい誤用を生成することができる。
本稿では,暗号署名された識別子を作成時に画像に埋め込むステガノグラフィー対応属性フレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.6362646650612085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid growth of generative AI has introduced new challenges in content moderation and digital forensics. In particular, benign AI-generated images can be paired with harmful or misleading text, creating difficult-to-detect misuse. This contextual misuse undermines the traditional moderation framework and complicates attribution, as synthetic images typically lack persistent metadata or device signatures. We introduce a steganography enabled attribution framework that embeds cryptographically signed identifiers into images at creation time and uses multimodal harmful content detection as a trigger for attribution verification. Our system evaluates five watermarking methods across spatial, frequency, and wavelet domains. It also integrates a CLIP-based fusion model for multimodal harmful-content detection. Experiments demonstrate that spread-spectrum watermarking, especially in the wavelet domain, provides strong robustness under blur distortions, and our multimodal fusion detector achieves an AUC-ROC of 0.99, enabling reliable cross-modal attribution verification. These components form an end-to-end forensic pipeline that enables reliable tracing of harmful deployments of AI-generated imagery, supporting accountability in modern synthetic media environments. Our code is available at GitHub: https://github.com/bli1/steganography
- Abstract(参考訳): 生成AIの急速な成長により、コンテンツモデレーションとデジタル法医学における新たな課題がもたらされた。
特に、良質なAI生成画像は有害または誤解を招くテキストと組み合わせて、検出しにくい誤用を生み出すことができる。
この文脈的誤用は、従来のモデレーションフレームワークを損なうものであり、合成画像は一般的に永続的なメタデータやデバイスシグネチャを欠いているため、帰属を複雑にする。
本稿では,暗号署名された識別子を生成時に画像に埋め込み,属性検証のトリガとして多モード有害なコンテンツ検出を利用するステガノグラフィー機能付き属性フレームワークを提案する。
本システムは,空間領域,周波数領域,ウェーブレット領域にまたがる5つの透かし手法を評価する。
マルチモーダル有害コンテンツ検出のためのCLIPベースの融合モデルも統合されている。
実験により,特にウェーブレット領域における拡散スペクトル透かしは,ぼやけた歪みの下で強い強靭性を示し,マルチモーダル核融合検出器は0.99のAUC-ROCを実現し,信頼性の高いクロスモーダル属性の検証を可能にした。
これらのコンポーネントはエンドツーエンドの法医学パイプラインを形成し、AI生成画像の有害なデプロイメントの信頼性の高いトレースを可能にし、現代の合成メディア環境における説明責任をサポートする。
私たちのコードはGitHubで入手可能です。
関連論文リスト
- Mitigating Memorization in Text-to-Image Diffusion via Region-Aware Prompt Augmentation and Multimodal Copy Detection [53.789057575175065]
領域認識型prompt Augmentation(RAPTA)とAttention-Driven Multimodal Copy Detection(ADMCD)を示す。
RAPTAはオブジェクト検出器を使用して、正常な領域を見つけ、それらを意味論的に接地したプロンプトの変種に変換する。
ADMCDは、ローカルパッチ、グローバルセマンティック、テクスチャキューを軽量トランスフォーマーで集約し、融合表現を生成する。
実験により、RAPTAは高い合成品質を維持しながら過度な適合を減少させ、ADMCDはコピーを確実に検出し、単一モードの指標より優れることが示された。
論文 参考訳(メタデータ) (2026-03-13T15:16:27Z) - Provenance of AI-Generated Images: A Vector Similarity and Blockchain-based Approach [3.632189127068905]
本稿では,AI生成画像と実(人間による)画像とを識別する組込み型AI画像検出フレームワークを提案する。
提案手法は,AI生成画像が他のAI生成コンテンツに近接していることを示す仮説に基づいている。
以上の結果から,中程度の摂動と高摂動が埋め込みシグネチャに最小限に影響を及ぼすことが確認された。
論文 参考訳(メタデータ) (2025-10-15T00:49:56Z) - Semantic Visual Anomaly Detection and Reasoning in AI-Generated Images [96.43608872116347]
AnomReasonは4倍のtextbfAnomAgentのような構造化アノテーションを備えた大規模ベンチマーク
AnomReasonとAnomAgentは、AI生成画像の意味的妥当性の測定と改善の基盤となっている。
論文 参考訳(メタデータ) (2025-10-11T14:09:24Z) - RAID: A Dataset for Testing the Adversarial Robustness of AI-Generated Image Detectors [57.81012948133832]
本稿では,72kの多種多様かつ高い変換可能な対向例からなるRAID(Robust Evaluation of AI- generated Image Detectors)を提案する。
提案手法は,未知の検出器に高い成功率で転送する逆画像を生成する。
以上の結果から,現在最先端のAI生成画像検出器は,敵の例によって容易に認識できることが示唆された。
論文 参考訳(メタデータ) (2025-06-04T14:16:00Z) - Provenance Detection for AI-Generated Images: Combining Perceptual Hashing, Homomorphic Encryption, and AI Detection Models [0.0]
我々は、セキュアでトランスフォーメーションに耐性のあるAIコンテンツ検出のためのフレームワークを開発する。
我々は、対角的に頑健な最先端の知覚ハッシュモデルDinoHashを開発した。
我々は,ユーザクエリとレジストリプライバシの両方の保護を確保するために,MP-FHE(Multi-Party Fully Homomorphic Encryption)方式を提案フレームワークに統合する。
論文 参考訳(メタデータ) (2025-03-14T08:42:18Z) - Explainable Synthetic Image Detection through Diffusion Timestep Ensembling [30.298198387824275]
本稿では,複数の雑音の時間ステップでアンサンブルを訓練することにより,中間雑音画像の特徴を直接活用する合成画像検出手法を提案する。
人間の理解を深めるために,メートル法に基づく説明文生成と改良モジュールを導入する。
本手法は, 正解率98.91%, 正解率95.89%, 正解率95.89%, 正解率98.91%, 正解率95.89%である。
論文 参考訳(メタデータ) (2025-03-08T13:04:20Z) - Beyond the Spectrum: Detecting Deepfakes via Re-Synthesis [69.09526348527203]
ディープフェイク(Deepfakes)として知られる非常に現実的なメディアは、現実の目から人間の目まで区別できない。
本研究では,テスト画像を再合成し,検出のための視覚的手がかりを抽出する,新しい偽検出手法を提案する。
種々の検出シナリオにおいて,提案手法の摂動に対する有効性の向上,GANの一般化,堅牢性を示す。
論文 参考訳(メタデータ) (2021-05-29T21:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。