論文の概要: NinjaDesc: Content-Concealing Visual Descriptors via Adversarial
Learning
- arxiv url: http://arxiv.org/abs/2112.12785v1
- Date: Thu, 23 Dec 2021 18:58:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-24 16:37:38.291111
- Title: NinjaDesc: Content-Concealing Visual Descriptors via Adversarial
Learning
- Title(参考訳): ninjadesc: 逆学習によるコンテントコンセリングビジュアル記述子
- Authors: Tony Ng, Hyo Jin Kim, Vincent Lee, Daniel Detone, Tsun-Yi Yang,
Tianwei Shen, Eddy Ilg, Vassileios Balntas, Krystian Mikolajczyk, Chris
Sweeney
- Abstract要約: 本稿では,マッチング精度を維持しつつ,画像再構成を防止する視覚記述子を訓練するための逆学習フレームワークを提案する。
我々は、特徴符号化ネットワークと画像再構成ネットワークを競合させ、特徴符号化ネットワークは、生成した記述子で画像再構成を妨害しようとする一方で、再構成者は、記述子からの入力画像の復元を試みる。
- 参考スコア(独自算出の注目度): 39.083687078653014
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In the light of recent analyses on privacy-concerning scene revelation from
visual descriptors, we develop descriptors that conceal the input image
content. In particular, we propose an adversarial learning framework for
training visual descriptors that prevent image reconstruction, while
maintaining the matching accuracy. We let a feature encoding network and image
reconstruction network compete with each other, such that the feature encoder
tries to impede the image reconstruction with its generated descriptors, while
the reconstructor tries to recover the input image from the descriptors. The
experimental results demonstrate that the visual descriptors obtained with our
method significantly deteriorate the image reconstruction quality with minimal
impact on correspondence matching and camera localization performance.
- Abstract(参考訳): 視覚ディスクリプタからのプライバシー保護シーンの啓示に関する最近の分析から,入力画像の内容を隠すディスクリプタを開発した。
特に,画像再構成を防止し,マッチング精度を維持しながら視覚記述子を訓練するための逆学習フレームワークを提案する。
我々は、特徴符号化ネットワークと画像再構成ネットワークを競合させ、特徴符号化ネットワークは生成した記述子で画像再構成を妨害しようとする一方で、再構成者は記述子からの入力画像の復元を試みる。
提案手法により得られた視覚ディスクリプタは,対応マッチングとカメラのローカライゼーション性能に最小限の影響を伴って画像再構成品質を著しく劣化させることを示した。
関連論文リスト
- Reconstructive Visual Instruction Tuning [64.91373889600136]
リコンストラクティブ・ビジュアル・インストラクション・チューニング(ROSS)は、視覚中心の監視信号を利用する大型マルチモーダル・モデル(LMM)のファミリーである。
入力画像の潜在表現を再構成し、正確なRGB値を直接回帰するのを避ける。
経験的に、ROSSは、異なるビジュアルエンコーダと言語モデルに対して、一貫して大幅に改善されている。
論文 参考訳(メタデータ) (2024-10-12T15:54:29Z) - $ε$-VAE: Denoising as Visual Decoding [61.29255979767292]
生成モデリングにおいて、トークン化は複雑なデータをコンパクトで構造化された表現に単純化し、より効率的で学習可能な空間を作り出す。
現在の視覚的トークン化手法は従来のオートエンコーダフレームワークに依存しており、エンコーダはデータを潜在表現に圧縮し、デコーダは元の入力を再構築する。
具体的には,デコーダを拡散処理に置き換え,ノイズを反復的に除去して元のイメージを復元し,エンコーダが提供する潜伏者によって誘導される。
再建(rFID)と生成品質(ジェネレーション品質)の両面からアプローチを評価する。
論文 参考訳(メタデータ) (2024-10-05T08:27:53Z) - Strong and Controllable Blind Image Decomposition [57.682079186903195]
ブラインド画像分解は、画像に存在するすべてのコンポーネントを分解することを目的としている。
ユーザーは著作権保護のために、透かしなどの特定の劣化を保ちたいかもしれない。
制御可能なブラインド画像分解ネットワークというアーキテクチャを設計する。
論文 参考訳(メタデータ) (2024-03-15T17:59:44Z) - Prompt-based Ingredient-Oriented All-in-One Image Restoration [0.0]
複数の画像劣化課題に対処する新しいデータ成分指向手法を提案する。
具体的には、エンコーダを用いて特徴をキャプチャし、デコーダを誘導するための劣化情報を含むプロンプトを導入する。
我々の手法は最先端技術と競争的に機能する。
論文 参考訳(メタデータ) (2023-09-06T15:05:04Z) - Label-Free Event-based Object Recognition via Joint Learning with Image
Reconstruction from Events [42.71383489578851]
本研究では,カテゴリラベルとペア画像が利用できない,ラベルのないイベントベースオブジェクト認識について検討する。
提案手法はまずイベントからイメージを再構成し,コントラスト言語-画像事前学習(CLIP)によるオブジェクト認識を行う。
画像の再構成にはカテゴリ情報が不可欠であるため,カテゴリ誘導アトラクション損失とカテゴリ非依存の反発損失を提案する。
論文 参考訳(メタデータ) (2023-08-18T08:28:17Z) - Neural Image Re-Exposure [86.42475408644822]
不適切なシャッターは、ぼやけた画像、ビデオの不連続、あるいはローリングシャッターアーティファクトにつながる可能性がある。
ニューラルネットワークに基づく画像再露法フレームワークを提案する。
視覚的潜在空間構築のためのエンコーダ、所望のシャッター戦略でニューラルフィルムに情報を集約する再露光モジュール、およびニューラルフィルムを所望の画像に「展開」するためのデコーダから構成される。
論文 参考訳(メタデータ) (2023-05-23T01:55:37Z) - CoReFace: Sample-Guided Contrastive Regularization for Deep Face
Recognition [3.1677775852317085]
特徴表現学習に画像レベルの正規化を適用するために,CoReFace(Contrastive Regularization for Face Recognition)を提案する。
具体的には、サンプル誘導型コントラスト学習を用いて、画像と画像の関係を直接調整する。
コントラスト学習を顔認識に統合するため,画像の画質劣化を回避するために,画像の代わりに埋め込みを拡大する。
論文 参考訳(メタデータ) (2023-04-23T14:33:24Z) - Restoration of Video Frames from a Single Blurred Image with Motion
Understanding [69.90724075337194]
単一モーション赤画像からクリーンな映像フレームを生成するための新しいフレームワークを提案する。
一つのぼやけた画像からの映像復元を逆問題として、クリーンな画像シーケンスとそれぞれの動きを潜伏要因として設定する。
提案手法は,空間トランスフォーマネットワークモジュールを用いたanblur-decoder構造に基づいている。
論文 参考訳(メタデータ) (2021-04-19T08:32:57Z) - Towards Fine-grained Visual Representations by Combining Contrastive
Learning with Image Reconstruction and Attention-weighted Pooling [0.0]
Contrastive Reconstruction、ConRecは、コントラストと自己再建損失を共同で最適化することによって画像表現を得る自己監督学習アルゴリズムです。
最先端のコントラスト学習手法(例)を紹介する。
SimCLR)は、その表現できめ細かい視覚的特徴を捉えるのに欠点がある。
論文 参考訳(メタデータ) (2021-04-09T12:12:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。