Fugu-MT 論文翻訳(概要): IP-Bench: Benchmark for Image Protection Methods in Image-to-Video Generation Scenarios

論文の概要: IP-Bench: Benchmark for Image Protection Methods in Image-to-Video Generation Scenarios

arxiv url: http://arxiv.org/abs/2603.26154v1
Date: Fri, 27 Mar 2026 08:11:33 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-30 21:49:48.398018
Title: IP-Bench: Benchmark for Image Protection Methods in Image-to-Video Generation Scenarios
Title（参考訳）: IP-Bench: 画像対ビデオ生成シナリオにおける画像保護手法のベンチマーク
Authors: Xiaofeng Li, Leyi Sheng, Zhen Sun, Zongmin Zhang, Jiaheng Wei, Xinlei He,
Abstract要約: IP-Benchは、I2V生成シナリオにおける画像保護手法を評価するために設計された最初のシステマティックベンチマークである。本ベンチマークでは,6つの代表的保護手法と5つの最先端I2Vモデルについて検討する。全体として、IP-BenchはI2V生成シナリオにおける画像保護手法の体系的、再現可能、評価のフレームワークを確立している。
参考スコア（独自算出の注目度）: 13.66248113146474
License: http://creativecommons.org/licenses/by/4.0/
Abstract: With the rapid advancement of image-to-video (I2V) generation models, their potential for misuse in creating malicious content has become a significant concern. For instance, a single image can be exploited to generate a fake video, which can be used to attract attention and gain benefits. This phenomenon is referred to as an I2V generation misuse. Existing image protection methods suffer from the absence of a unified benchmark, leading to an incomplete evaluation framework. Furthermore, these methods have not been systematically assessed in I2V generation scenarios and against preprocessing attacks, which complicates the evaluation of their effectiveness in real-world deployment scenarios.To address this challenge, we propose IP-Bench (Image Protection Bench), the first systematic benchmark designed to evaluate protection methods in I2V generation scenarios. This benchmark examines 6 representative protection methods and 5 state-of-the-art I2V models. Furthermore, our work systematically evaluates protection methods' robustness with two robustness attack strategies under practical scenarios and analyzes their cross-model & cross-modality transferability. Overall, IP-Bench establishes a systematic, reproducible, and extensible evaluation framework for image protection methods in I2V generation scenarios.
Abstract（参考訳）: 画像・ビデオ生成モデル(I2V)の急速な進歩により、悪意のあるコンテンツの作成における誤用の可能性が懸念されている。例えば、ひとつのイメージを利用して偽のビデオを生成することで、注意を引き付け、利益を得ることができます。この現象はI2V世代誤用と呼ばれる。既存の画像保護手法は、統一されたベンチマークが欠如しており、不完全な評価フレームワークに繋がる。さらに、これらの手法は、I2V生成シナリオや前処理攻撃に対して体系的に評価されておらず、実際のデプロイメントシナリオにおける有効性の評価を複雑にし、この課題に対処するために、IP-Bench(画像保護ベンチ)という、I2V生成シナリオにおける保護手法の評価を目的とした最初の体系的なベンチマークを提案する。本ベンチマークでは,6つの代表的保護手法と5つの最先端I2Vモデルについて検討する。さらに,本研究は,実用シナリオ下で2つの堅牢性攻撃戦略を用いて保護手法の堅牢性を体系的に評価し,それらの相互モデルおよび相互モダリティ伝達可能性を解析する。全体として、IP-BenchはI2V生成シナリオにおける画像保護手法のための体系的で再現性があり拡張可能な評価フレームワークを確立する。

関連論文リスト

RunawayEvil: Jailbreaking the Image-to-Video Generative Models [59.21761412103083]
イメージ・トゥ・ビデオ(I2V)生成は、画像とテキスト入力から動的視覚コンテンツを合成し、創造的なコントロールを提供する。本稿では,動的進化機能を備えたI2VモデルのマルチモーダルジェイルブレイクフレームワークであるRunawayEvilを提案する。 RunawayEvil は Open-Sora 2.0 や CogVideoX などの商用 I2V モデルに対して,最先端の攻撃成功率を実現している。
論文参考訳（メタデータ） (2025-12-07T06:14:52Z)
ConceptGuard: Proactive Safety in Text-and-Image-to-Video Generation through Multimodal Risk Detection [27.47621607462884]
ConceptGuardは、マルチモーダルビデオ生成において、安全でないセマンティクスを積極的に検出し緩和するフレームワークである。コントラスト検出モジュールは、融合画像テキスト入力を構造化概念空間に投影することにより、潜伏する安全リスクを特定する。意味的抑制機構は、プロンプトのマルチモーダル条件を介在することにより、生成過程を安全でない概念から遠ざける。
論文参考訳（メタデータ） (2025-11-24T05:27:05Z)
T2V-OptJail: Discrete Prompt Optimization for Text-to-Video Jailbreak Attacks [67.91652526657599]
我々は、T2Vジェイルブレイク攻撃を離散最適化問題として定式化し、T2V-OptJailと呼ばれる共同目的ベース最適化フレームワークを提案する。いくつかのT2Vモデルに対して大規模な実験を行い、オープンソースモデルと実際の商用クローズドソースモデルの両方をカバーする。提案手法は,攻撃成功率の観点から既存手法よりも11.4%,10.0%向上する。
論文参考訳（メタデータ） (2025-05-10T16:04:52Z)
T2VShield: Model-Agnostic Jailbreak Defense for Text-to-Video Models [88.63040835652902]
テキストからビデオモデルへの攻撃はジェイルブレイク攻撃に弱いため、特別な方法で安全メカニズムをバイパスし、有害または安全でないコンテンツの生成につながる。我々は、ジェイルブレイクの脅威からテキストからビデオモデルを守るために設計された包括的でモデルに依存しない防衛フレームワークであるT2VShieldを提案する。本手法は,既存の防御の限界を特定するために,入力,モデル,出力の段階を体系的に解析する。
論文参考訳（メタデータ） (2025-04-22T01:18:42Z)
Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step [86.69947123512836]
CoT(Chain-of-Thought)推論は、複雑な理解タスクに取り組むために大規模なモデルで広く研究されている。自己回帰画像生成を促進するために,CoT推論の可能性について,初めて包括的調査を行った。本稿では,自動回帰画像生成に特化したPARMとPARM++を提案する。
論文参考訳（メタデータ） (2025-01-23T18:59:43Z)
MirrorCheck: Efficient Adversarial Defense for Vision-Language Models [55.73581212134293]
本稿では,視覚言語モデルにおける対角的サンプル検出のための,新しい,しかしエレガントなアプローチを提案する。本手法は,テキスト・トゥ・イメージ(T2I)モデルを用いて,ターゲットVLMが生成したキャプションに基づいて画像を生成する。異なるデータセットで実施した経験的評価により,本手法の有効性が検証された。
論文参考訳（メタデータ） (2024-06-13T15:55:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。