Fugu-MT 論文翻訳(概要): Vid-Freeze: Protecting Images from Malicious Image-to-Video Generation via Temporal Freezing

論文の概要: Vid-Freeze: Protecting Images from Malicious Image-to-Video Generation via Temporal Freezing

arxiv url: http://arxiv.org/abs/2509.23279v1
Date: Sat, 27 Sep 2025 12:26:34 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-30 22:32:19.138107
Title: Vid-Freeze: Protecting Images from Malicious Image-to-Video Generation via Temporal Freezing
Title（参考訳）: Vid-Freeze: 一時的な凍結による悪意ある画像から映像を保護する
Authors: Rohit Chowdhury, Aniruddha Bala, Rohan Jaiswal, Siddharth Roheda,
Abstract要約: Vid-Freezeは、新しい注意を抑える敵攻撃であり、画像に慎重に敵の摂動を追加する。本手法は, 動作合成を完全に破壊するI2Vモデルの注意機構を目標とした。その結果、免疫された画像は、スタンスチールまたはニアスタティックなビデオを生成し、悪意のあるコンテンツ生成を効果的にブロックする。
参考スコア（独自算出の注目度）: 2.48490797934472
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The rapid progress of image-to-video (I2V) generation models has introduced significant risks, enabling video synthesis from static images and facilitating deceptive or malicious content creation. While prior defenses such as I2VGuard attempt to immunize images, effective and principled protection to block motion remains underexplored. In this work, we introduce Vid-Freeze - a novel attention-suppressing adversarial attack that adds carefully crafted adversarial perturbations to images. Our method explicitly targets the attention mechanism of I2V models, completely disrupting motion synthesis while preserving semantic fidelity of the input image. The resulting immunized images generate stand-still or near-static videos, effectively blocking malicious content creation. Our experiments demonstrate the impressive protection provided by the proposed approach, highlighting the importance of attention attacks as a promising direction for robust and proactive defenses against misuse of I2V generation models.
Abstract（参考訳）: I2V(Image-to-Video)生成モデルの急速な進歩は、静的画像からのビデオ合成を可能にし、偽りや悪意のあるコンテンツ作成を容易にする、重大なリスクをもたらしている。 I2VGuardのような以前の防衛はイメージを免疫しようとするが、効果的で原則化されたブロック動作の保護はいまだに未調査のままである。本研究では,新たな注意抑制攻撃であるVid-Freezeを紹介する。本手法は,入力画像のセマンティックな忠実さを保ちながら,動作合成を完全に破壊するI2Vモデルの注意機構を明示的にターゲットする。その結果、免疫された画像は、スタンスチールまたはニアスタティックなビデオを生成し、悪意のあるコンテンツ生成を効果的にブロックする。本実験は,I2V 生成モデルの誤使用に対する堅牢かつ積極的な防御手段としてのアテンションアタックの重要性を強調し,提案手法による印象的な保護を実証するものである。

関連論文リスト

VCE: Safe Autoregressive Image Generation via Visual Contrast Exploitation [57.36681904639463]
自己回帰的テキスト・画像モデルを保護する方法はまだ未検討のままである。コンテンツセマンティクスから安全でない概念を正確に分離する新しいフレームワークであるVisual Contrast Exploitation (VCE)を提案する。提案手法は,安全でない概念を消去し,無関係な概念の整合性を保ちながら,最先端の成果を効果的に確保できることを実証する。
論文参考訳（メタデータ） (2025-09-21T09:00:27Z)
BadVideo: Stealthy Backdoor Attack against Text-to-Video Generation [37.055665794706336]
テキスト・ツー・ビデオ(T2V)生成モデルは急速に進歩し、エンターテイメント、教育、マーケティングといった分野に広く応用されている。我々は、T2V生成タスクにおいて、生成されたビデオはテキストプロンプトに明示的に指定されていないかなりの冗長な情報を含むことが多いことを観察する。我々は、T2V生成に適した最初のバックドアアタックフレームワークであるBadVideoを紹介した。
論文参考訳（メタデータ） (2025-04-23T17:34:48Z)
Tit-for-Tat: Safeguarding Large Vision-Language Models Against Jailbreak Attacks via Adversarial Defense [90.71884758066042]
大きな視覚言語モデル(LVLM)は、視覚入力による悪意のある攻撃に対する感受性という、ユニークな脆弱性を導入している。本稿では,脆弱性発生源からアクティブ防衛機構へ視覚空間を変換するための新しい手法であるESIIIを提案する。
論文参考訳（メタデータ） (2025-03-14T17:39:45Z)
AdvI2I: Adversarial Image Attack on Image-to-Image Diffusion models [33.29825481203704]
AdvI2Iは、入力画像を操作して拡散モデルを誘導し、NSFWコンテンツを生成する新しいフレームワークである。ジェネレータを最適化して敵画像を作成することで、AdvI2Iは既存の防御機構を回避できる。本稿では,AdvI2IとAdvI2I-Adaptiveの両方が,現行の安全対策を効果的に回避可能であることを示す。
論文参考訳（メタデータ） (2024-10-28T19:15:06Z)
Adversarial Prompt Tuning for Vision-Language Models [86.5543597406173]
AdvPT(Adversarial Prompt Tuning)は、視覚言語モデル(VLM)における画像エンコーダの対向ロバスト性を高める技術である。我々は,AdvPTが白箱攻撃や黒箱攻撃に対する抵抗性を向上し,既存の画像処理による防御技術と組み合わせることで相乗効果を示すことを示した。
論文参考訳（メタデータ） (2023-11-19T07:47:43Z)
DiffProtect: Generate Adversarial Examples with Diffusion Models for Facial Privacy Protection [64.77548539959501]
DiffProtectは最先端の方法よりも自然に見える暗号化画像を生成する。例えば、CelebA-HQとFFHQのデータセットで24.5%と25.1%の絶対的な改善が達成されている。
論文参考訳（メタデータ） (2023-05-23T02:45:49Z)
Temporal Shuffling for Defending Deep Action Recognition Models against Adversarial Attacks [67.58887471137436]
本研究では,動作認識モデルに対する対人攻撃に対して,入力ビデオの時間的シャッフルを用いた新しい防御手法を開発した。我々の知る限りでは、これは3D CNNに基づく映像行動認識モデルのための追加トレーニングなしで防御方法を設計する最初の試みである。
論文参考訳（メタデータ） (2021-12-15T06:57:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。