論文の概要: StegaPos: Preventing Crops and Splices with Imperceptible Positional
Encodings
- arxiv url: http://arxiv.org/abs/2104.12290v1
- Date: Sun, 25 Apr 2021 23:42:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 14:56:01.033080
- Title: StegaPos: Preventing Crops and Splices with Imperceptible Positional
Encodings
- Title(参考訳): StegaPos: 認識不能な位置エンコーディングによるクロップやスプライス防止
- Authors: Gokhan Egri, Todd Zickler
- Abstract要約: 本稿では,写真家が発行した画像の真正コピーである画像の識別モデルを提案する。
このモデルは、カメラマンと共存するエンコーダと、観察者が利用できるマッチングデコーダから構成されている。
エンコーダとデコーダを一緒に訓練すると,位置を知覚的にエンコードするモデルが生成される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a model for differentiating between images that are authentic
copies of ones published by photographers, and images that have been
manipulated by cropping, splicing or downsampling after publication. The model
comprises an encoder that resides with the photographer and a matching decoder
that is available to observers. The encoder learns to embed imperceptible
positional signatures into image values prior to publication. The decoder
learns to use these steganographic positional ("stegapos") signatures to
determine, for each small image patch, the 2D positional coordinates that were
held by the patch in its originally-published image. Crop, splice and
downsample edits become detectable by the inconsistencies they cause in the
hidden positional signatures. We find that training the encoder and decoder
together produces a model that imperceptibly encodes position, and that enables
superior performance on established benchmarks for splice detection and high
accuracy on a new benchmark for crop detection.
- Abstract(参考訳): 本稿では,写真家が発行した画像の真正コピーである画像と,出版後の収穫,スプライシング,ダウンサンプリングによって操作された画像とを区別するモデルを提案する。
モデルは、写真家と居住するエンコーダと、オブザーバーが利用できる一致するデコーダで構成される。
エンコーダは、出版前に知覚不能な位置シグネチャを画像値に埋め込むことを学習する。
デコーダは、これらのステガノグラフィ位置(ステガポス)シグネチャを使用して、小さな画像パッチ毎に、パッチによって最初に公開された画像に保持された2D位置座標を決定する。
クロップ、スプライス、ダウンサンプル編集は、隠れた位置のシグネチャで生じる不整合によって検出される。
我々は,エンコーダとデコーダを組み合わせることで,位置を知覚的にエンコードするモデルが生成され,確立されたスプライス検出ベンチマークにおいて優れた性能が得られ,作物検出のための新たなベンチマークにおいて精度が向上することを示す。
関連論文リスト
- LCM-Lookahead for Encoder-based Text-to-Image Personalization [82.56471486184252]
我々は,テキスト・ツー・イメージ・モデルのパーソナライズを導くために,ショートカット・メカニズムを利用する可能性を探る。
エンコーダをベースとしたパーソナライズ手法に焦点をあてて、ルックアヘッドのアイデンティティ損失を調整することで、より高いアイデンティティの忠実性を達成できることを実証する。
論文 参考訳(メタデータ) (2024-04-04T17:43:06Z) - StegGuard: Fingerprinting Self-supervised Pre-trained Encoders via Secrets Embeder and Extractor [20.88708866426335]
我々は、ステガノグラフィーを用いて、被疑者の事前訓練エンコーダの所有権を検証するための新しい指紋認証機構であるStegGuardを提案する。
StegGuardの批判的な視点は、事前訓練されたエンコーダによって実行されるイメージから埋め込みへの変換のユニークな特性が同等に露呈できるということである。
StegGuardは、さまざまな独立したエンコーダを確実に識別することができ、関連する攻撃を盗むモデルに対して堅牢である。
論文 参考訳(メタデータ) (2023-10-05T08:30:42Z) - Neural Distributed Image Compression with Cross-Attention Feature
Alignment [1.2234742322758418]
一対のステレオ画像は、重なり合う視野を持ち、同期および校正された一対のカメラによってキャプチャされる。
1つの画像は圧縮・送信され、もう1つの画像はデコーダでのみ利用できると仮定する。
提案アーキテクチャでは、入力画像をDNNを用いて潜時空間にマッピングし、潜時表現を定量化し、エントロピー符号化を用いて無害に圧縮する。
論文 参考訳(メタデータ) (2022-07-18T10:15:04Z) - Context Autoencoder for Self-Supervised Representation Learning [64.63908944426224]
符号化された表現空間で予測を行うことにより、符号化器を事前訓練する。
ネットワークはエンコーダ/レグレッサ/デコーダアーキテクチャである。
下流タスクにおける転送性能の向上によるCAEの有効性を実証する。
論文 参考訳(メタデータ) (2022-02-07T09:33:45Z) - DocEnTr: An End-to-End Document Image Enhancement Transformer [13.108797370734893]
文書画像は多くの劣化シナリオに影響され、認識と処理が困難になる。
本稿では,視覚変換器をベースとしたエンコーダデコーダアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-01-25T11:45:35Z) - Compact Binary Fingerprint for Image Copy Re-Ranking [0.0]
画像コピー検出はコンピュータビジョンと信号処理において困難で魅力的なトピックである。
SIFTなどのローカルキーポイントディスクリプタを使用して画像を表現する。
特徴量を定量化し、精度の低下を犠牲にして、大規模データベースに対して探索・マッチングを可能にする。
論文 参考訳(メタデータ) (2021-09-16T08:44:56Z) - EncoderMI: Membership Inference against Pre-trained Encoders in
Contrastive Learning [27.54202989524394]
コントラスト学習によって事前訓練された画像エンコーダに対する最初のメンバーシップ推論手法であるMIを提案する。
複数のデータセットで事前学習した画像エンコーダと、OpenAIが収集した4億(画像、テキスト)のペアで事前学習したContrastive Language- Image Pre-training (CLIP)画像エンコーダの評価を行った。
論文 参考訳(メタデータ) (2021-08-25T03:00:45Z) - Learnable Fourier Features for Multi-DimensionalSpatial Positional
Encoding [96.9752763607738]
本稿では,学習可能なフーリエ特徴に基づく位置符号化手法を提案する。
本研究では,多次元位置符号化のための学習可能な特徴表現が既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-05T04:40:18Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - Swapping Autoencoder for Deep Image Manipulation [94.33114146172606]
画像操作に特化して設計されたディープモデルであるSwapping Autoencoderを提案する。
キーとなるアイデアは、2つの独立したコンポーネントで画像をエンコードし、交換された組み合わせをリアルなイメージにマップするように強制することだ。
複数のデータセットの実験により、我々のモデルはより良い結果が得られ、最近の生成モデルと比較してかなり効率が良いことが示されている。
論文 参考訳(メタデータ) (2020-07-01T17:59:57Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。