論文の概要: Privacy-Preserving Image Classification Using Vision Transformer
- arxiv url: http://arxiv.org/abs/2205.12041v1
- Date: Tue, 24 May 2022 12:51:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-25 15:16:52.095582
- Title: Privacy-Preserving Image Classification Using Vision Transformer
- Title(参考訳): vision transformerを用いたプライバシー保全画像分類
- Authors: Zheng Qi, AprilPyone MaungMaung, Yuma Kinoshita and Hitoshi Kiya
- Abstract要約: 暗号化画像と視覚変換器(ViT)を組み合わせたプライバシー保護画像分類手法を提案する。
ViTは画像パッチにパッチ埋め込みと位置埋め込みを利用するため、このアーキテクチャはブロックワイド画像変換の影響を低減することができる。
実験では,様々な攻撃に対する分類精度とロバスト性の観点から,プライバシー保護画像分類の手法が最先端の手法より優れていることを示す。
- 参考スコア(独自算出の注目度): 16.679394807198
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a privacy-preserving image classification method
that is based on the combined use of encrypted images and the vision
transformer (ViT). The proposed method allows us not only to apply images
without visual information to ViT models for both training and testing but to
also maintain a high classification accuracy. ViT utilizes patch embedding and
position embedding for image patches, so this architecture is shown to reduce
the influence of block-wise image transformation. In an experiment, the
proposed method for privacy-preserving image classification is demonstrated to
outperform state-of-the-art methods in terms of classification accuracy and
robustness against various attacks.
- Abstract(参考訳): 本稿では,暗号化画像と視覚変換器(ViT)を組み合わせたプライバシー保護画像分類手法を提案する。
提案手法は,視覚的情報のない画像をトレーニングとテストの両方のためにViTモデルに適用するだけでなく,高い分類精度を維持することができる。
ViTは画像パッチにパッチ埋め込みと位置埋め込みを利用するため、このアーキテクチャはブロックワイド画像変換の影響を低減することができる。
実験では,様々な攻撃に対する分類精度と堅牢性の観点から,プライバシー保護画像分類法が最先端の手法より優れていることを示す。
関連論文リスト
- Can Encrypted Images Still Train Neural Networks? Investigating Image Information and Random Vortex Transformation [51.475827684468875]
画像変換時の情報内容の変化を評価するために,画像情報量を測定する新しい枠組みを構築した。
また,Random Vortex Transformationと呼ばれる新しい画像暗号化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-25T09:14:53Z) - Efficient Fine-Tuning with Domain Adaptation for Privacy-Preserving
Vision Transformer [6.476298483207895]
視覚変換器(ViT)を用いたプライバシー保護型ディープニューラルネットワーク(DNN)の新しい手法を提案する。
本手法では, モデルトレーニングや視覚的に保護された画像によるテストだけでなく, 暗号化画像の使用による性能劣化を回避できる。
ドメイン適応法は、暗号化された画像でViTを効率よく微調整するために用いられる。
論文 参考訳(メタデータ) (2024-01-10T12:46:31Z) - Combined Use of Federated Learning and Image Encryption for
Privacy-Preserving Image Classification with Vision Transformer [14.505867475659276]
視覚変換器(ViT)を用いたプライバシー保護画像分類のためのFLと暗号化画像の組み合わせを提案する。
実験では,CIFAR-10およびCIFAR-100データセットの性能劣化を伴わずに,本手法をうまく動作させることが実証された。
論文 参考訳(メタデータ) (2023-01-23T03:41:02Z) - Generalizable Person Re-Identification via Viewpoint Alignment and
Fusion [74.30861504619851]
本研究は,3次元高密度ポーズ推定モデルとテクスチャマッピングモジュールを用いて,歩行者画像を標準視像にマッピングすることを提案する。
テクスチャマッピングモジュールの不完全性のため、標準ビュー画像は、原画像から識別的な詳細手がかりを失う可能性がある。
提案手法は,各種評価設定における既存手法よりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2022-12-05T16:24:09Z) - UIA-ViT: Unsupervised Inconsistency-Aware Method based on Vision
Transformer for Face Forgery Detection [52.91782218300844]
そこで我々は、UIA-ViTと呼ばれるビジョン変換器に基づく教師なし不整合認識手法を提案する。
自己注意機構により、パッチ埋め込み間の注意マップは自然に一貫性関係を表現し、一貫性表現学習に適した視覚変換器となる。
論文 参考訳(メタデータ) (2022-10-23T15:24:47Z) - Privacy-Preserving Image Classification Using ConvMixer with Adaptive
Permutation Matrix [13.890279045382623]
本稿では,ConvMixer構造を用いた暗号化画像を用いたプライバシー保護画像分類手法を提案する。
適応ネットワークを用いた従来の手法では,大きな画像は適用できない。
本研究では,適応ネットワークを使わずに,ブロックワイズされた画像をConvMixerに適用できる新しい手法を提案する。
論文 参考訳(メタデータ) (2022-08-04T09:55:31Z) - Modeling Image Composition for Complex Scene Generation [77.10533862854706]
本稿では,レイアウト・ツー・イメージ生成タスクにおける最先端結果を実現する手法を提案する。
本稿では,RGB画像をパッチトークンに圧縮した後,オブジェクト・トゥ・オブジェクト,オブジェクト・トゥ・パッチ,パッチ・トゥ・パッチの依存関係を探索するTransformer with Focal Attention (TwFA)を提案する。
論文 参考訳(メタデータ) (2022-06-02T08:34:25Z) - Privacy-Preserving Image Classification Using Isotropic Network [14.505867475659276]
本稿では,暗号化画像と視覚変換器などの等方性ネットワークを用いたプライバシー保護画像分類手法を提案する。
提案手法では,深層ニューラルネットワーク(DNN)に視覚情報のない画像を適用するだけでなく,高い分類精度を維持することができる。
論文 参考訳(メタデータ) (2022-04-16T03:15:54Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - Image Transformation Network for Privacy-Preserving Deep Neural Networks
and Its Security Evaluation [17.134566958534634]
プライバシー保護DNNのための画像生成のための変換ネットワークを提案する。
提案するネットワークは,視覚情報を強く保護するだけでなく,画像を用いた画像分類精度の維持にも有効である。
論文 参考訳(メタデータ) (2020-08-07T12:58:45Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。