論文の概要: Privacy-Shielded Image Compression: Defending Against Exploitation from Vision-Language Pretrained Models
- arxiv url: http://arxiv.org/abs/2506.15201v1
- Date: Wed, 18 Jun 2025 07:29:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 19:35:51.572734
- Title: Privacy-Shielded Image Compression: Defending Against Exploitation from Vision-Language Pretrained Models
- Title(参考訳): プライバシ強化画像圧縮:ビジョンランゲージ事前訓練モデルによる爆発に対する防御
- Authors: Xuelin Shen, Jiayin Xu, Kangsheng Yin, Wenhan Yang,
- Abstract要約: 本稿では,画像圧縮段階での防御によりユーザのプライバシを保護し,悪用を防止することを目的とする。
本稿では,複数のデコードオプションでビットストリームを生成する,PSIC(Privacy-Shielded Image Compression)と呼ばれるフレキシブルな符号化手法を提案する。
提案手法はプラグアンドプレイであり,既存のLearned Image Compression(lic)モデルにシームレスに統合可能である。
- 参考スコア(独自算出の注目度): 32.92388946423273
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The improved semantic understanding of vision-language pretrained (VLP) models has made it increasingly difficult to protect publicly posted images from being exploited by search engines and other similar tools. In this context, this paper seeks to protect users' privacy by implementing defenses at the image compression stage to prevent exploitation. Specifically, we propose a flexible coding method, termed Privacy-Shielded Image Compression (PSIC), that can produce bitstreams with multiple decoding options. By default, the bitstream is decoded to preserve satisfactory perceptual quality while preventing interpretation by VLP models. Our method also retains the original image compression functionality. With a customizable input condition, the proposed scheme can reconstruct the image that preserves its full semantic information. A Conditional Latent Trigger Generation (CLTG) module is proposed to produce bias information based on customizable conditions to guide the decoding process into different reconstructed versions, and an Uncertainty-Aware Encryption-Oriented (UAEO) optimization function is designed to leverage the soft labels inferred from the target VLP model's uncertainty on the training data. This paper further incorporates an adaptive multi-objective optimization strategy to obtain improved encrypting performance and perceptual quality simultaneously within a unified training process. The proposed scheme is plug-and-play and can be seamlessly integrated into most existing Learned Image Compression (LIC) models. Extensive experiments across multiple downstream tasks have demonstrated the effectiveness of our design.
- Abstract(参考訳): 視覚言語事前訓練(VLP)モデルのセマンティック理解の改善により、公開画像が検索エンジンやその他のツールによって悪用されるのを防ぐことがますます困難になっている。
本研究は,画像圧縮段階での防御を実装し,ユーザプライバシを保護することを目的としている。
具体的には,複数のデコードオプションでビットストリームを生成する,PSIC(Privacy-Shielded Image Compression)と呼ばれるフレキシブルな符号化手法を提案する。
デフォルトでは、ビットストリームは、VLPモデルによる解釈を防止しつつ、良好な知覚品質を維持するためにデコードされる。
また,本手法では,元の画像圧縮機能も保持している。
カスタマイズ可能な入力条件により、提案手法は、その完全な意味情報を保持するイメージを再構成することができる。
復号処理を異なる再構成バージョンに導くためのカスタマイズ可能な条件に基づくバイアス情報を生成するために,条件付き遅延トリガー生成(CLTG)モジュールを提案し,トレーニングデータにターゲットVLPモデルの不確実性から推定されるソフトラベルを活用するために,不確実性認識暗号化(UAEO)最適化関数を設計した。
さらに, 適応型多目的最適化手法を導入し, 統合学習プロセスにおいて, 暗号化性能と知覚品質を同時に向上させる。
提案手法はプラグアンドプレイであり,既存のLearned Image Compression(lic)モデルにシームレスに統合可能である。
複数の下流タスクにわたる大規模な実験により、我々の設計の有効性が実証された。
関連論文リスト
- CALLIC: Content Adaptive Learning for Lossless Image Compression [64.47244912937204]
CALLICは、学習したロスレス画像圧縮のための新しい最先端(SOTA)を設定する。
本稿では,畳み込みゲーティング操作を利用したコンテンツ認識型自己回帰自己保持機構を提案する。
エンコーディング中、低ランク行列を用いて深度の畳み込みを含む事前学習層を分解し、レート誘導プログレッシブファインタニング(RPFT)による画像検査にインクリメンタルウェイトを適応させる。
推定エントロピーにより下位順にソートされたパッチを徐々に増加させたRPFTファインチューン,学習過程の最適化,適応時間の短縮を実現した。
論文 参考訳(メタデータ) (2024-12-23T10:41:18Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - PRO-Face S: Privacy-preserving Reversible Obfuscation of Face Images via
Secure Flow [69.78820726573935]
保護フローベースモデルを用いて,プライバシ保護による顔画像の可逆難読化(Reversible Obfuscation of Face image)を略してpro-Face Sと命名する。
本フレームワークでは、Invertible Neural Network(INN)を使用して、入力画像と、その事前難読化されたフォームとを処理し、事前難読化された画像と視覚的に近似したプライバシー保護された画像を生成する。
論文 参考訳(メタデータ) (2023-07-18T10:55:54Z) - EViT: Privacy-Preserving Image Retrieval via Encrypted Vision
Transformer in Cloud Computing [9.41257807502252]
本稿では,暗号化ビジョン変換器(EViT)という新しいパラダイムを提案する。
EViTは、画像のプライバシーを効果的に保護しつつ、大きなマージンによる検索精度において、現在のスキームよりも優れた暗号化と検索性能を実現する。
論文 参考訳(メタデータ) (2022-08-31T07:07:21Z) - ELIC: Efficient Learned Image Compression with Unevenly Grouped
Space-Channel Contextual Adaptive Coding [9.908820641439368]
本研究では,最先端の速度と圧縮能力を実現するための効率的なモデルであるELICを提案する。
優れたパフォーマンスで、提案モデルは極めて高速なプレビューデコーディングとプログレッシブデコーディングもサポートする。
論文 参考訳(メタデータ) (2022-03-21T11:19:50Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。