論文の概要: M^3:Manipulation Mask Manufacturer for Arbitrary-Scale Super-Resolution Mask
- arxiv url: http://arxiv.org/abs/2407.03695v1
- Date: Thu, 4 Jul 2024 07:30:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-08 18:52:18.255125
- Title: M^3:Manipulation Mask Manufacturer for Arbitrary-Scale Super-Resolution Mask
- Title(参考訳): M^3:Manipulation Mask Manufacturer for Arbitrary-Scale Super-Resolution Mask
- Authors: Xinyu Yang, Xiaochen Ma, Xuekang Zhu, Bo Du, Lei Su, Bingkui Tong, Zeyu Lei, Jizhe Zhou,
- Abstract要約: インターネット上の画像(Baidu TiebaのPS Barなど)は様々な技術を用いて操作される。
操作された画像を原画像から抽出するだけで得られるマスクには、様々なノイズが含まれている。
変化検出の分野に触発されて、元の画像と操作された画像を、同じ画像の時間経過とともに変化として扱う。
- 参考スコア(独自算出の注目度): 32.13489910094028
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the field of image manipulation localization (IML), the small quantity and poor quality of existing datasets have always been major issues. A dataset containing various types of manipulations will greatly help improve the accuracy of IML models. Images on the internet (such as those on Baidu Tieba's PS Bar) are manipulated using various techniques, and creating a dataset from these images will significantly enrich the types of manipulations in our data. However, images on the internet suffer from resolution and clarity issues, and the masks obtained by simply subtracting the manipulated image from the original contain various noises. These noises are difficult to remove, rendering the masks unusable for IML models. Inspired by the field of change detection, we treat the original and manipulated images as changes over time for the same image and view the data generation task as a change detection task. However, due to clarity issues between images, conventional change detection models perform poorly. Therefore, we introduced a super-resolution module and proposed the Manipulation Mask Manufacturer (MMM) framework. It enhances the resolution of both the original and tampered images, thereby improving image details for better comparison. Simultaneously, the framework converts the original and tampered images into feature embeddings and concatenates them, effectively modeling the context. Additionally, we created the Manipulation Mask Manufacturer Dataset (MMMD), a dataset that covers a wide range of manipulation techniques. We aim to contribute to the fields of image forensics and manipulation detection by providing more realistic manipulation data through MMM and MMMD. Detailed information about MMMD and the download link can be found at: the code and datasets will be made available.
- Abstract(参考訳): 画像操作ローカライゼーション(IML)の分野では、既存のデータセットの少量と品質が常に大きな問題となっている。
さまざまな種類の操作を含むデータセットは、IMLモデルの精度を大幅に向上させる。
インターネット上の画像(Baidu TiebaのPS Barなど)はさまざまな技術を使って操作され、これらの画像からデータセットを作成することで、データ内の操作のタイプを著しく強化します。
しかし、インターネット上の画像は解像度や明快な問題に悩まされており、操作された画像を原画像から単純に取り除いたマスクには様々なノイズが含まれている。
これらのノイズは除去が難しく、IMLモデルではマスクが使用できない。
変化検出の分野に触発されて、原画像と操作された画像は、同じ画像の時間的変化として扱うとともに、データ生成タスクを変化検出タスクとして見る。
しかし、画像間の明瞭性の問題により、従来の変化検出モデルは性能が良くない。
そこで我々は,超解像モジュールを導入し,マニピュレーションマスク製造者(MMM)フレームワークを提案した。
これにより、原画像と改ざん画像の解像度が向上し、画像の細部が向上し、比較性が向上する。
同時に、このフレームワークはオリジナルの画像と改ざんされた画像を特徴埋め込みに変換し、それらを結合させ、コンテキストを効果的にモデル化する。
さらに、幅広い操作技術をカバーするデータセットであるManipulation Mask Manufacturer Dataset(MMMD)を作成しました。
我々は,MMMとMMMDによるより現実的な操作データを提供することで,画像の法医学と操作検出の分野に貢献することを目指している。
MMMDとダウンロードリンクの詳細は、以下の通りである。
関連論文リスト
- DiffSTR: Controlled Diffusion Models for Scene Text Removal [5.790630195329777]
Scene Text removed (STR) は、画像中のテキストの不正使用を防止することを目的としている。
STRは、バウンダリアーティファクト、一貫性のないテクスチャと色、正しいシャドウの保存など、いくつかの課題に直面している。
STRを塗装タスクとして扱う制御ネット拡散モデルを提案する。
拡散モデルを満たすためのマスク事前学習パイプラインを開発した。
論文 参考訳(メタデータ) (2024-10-29T04:20:21Z) - ColorMAE: Exploring data-independent masking strategies in Masked AutoEncoders [53.3185750528969]
Masked AutoEncoders (MAE)は、堅牢な自己管理フレームワークとして登場した。
データに依存しないColorMAEという手法を導入し、ランダムノイズをフィルタすることで異なる二元マスクパターンを生成する。
ランダムマスキングと比較して,下流タスクにおける戦略の優位性を示す。
論文 参考訳(メタデータ) (2024-07-17T22:04:00Z) - MaskCD: A Remote Sensing Change Detection Network Based on Mask Classification [29.15203530375882]
深層学習を用いたリモートセンシング(RS)画像からの変化(CD)を文献的に広く研究している。
入力画像対から分類マスクを適応的に生成し,変化領域を検出するMaskCDを提案する。
ピクセルワイズ表現を学習可能なマスク提案に復号することで、望まれる変更対象を再構築する。
論文 参考訳(メタデータ) (2024-04-18T11:05:15Z) - Manipulation Mask Generator: High-Quality Image Manipulation Mask
Generation Method Based on Modified Total Variation Noise Reduction [20.620232937684133]
本稿では,高品質な改ざん画像を取得するための改良された全変動雑音低減手法を提案する。
Baidu PS Barからオリジナル画像や改ざん画像を自動的にクロールします。
改良された全変動雑音低減法は,この問題の解決を目的としている。
論文 参考訳(メタデータ) (2023-10-23T15:40:00Z) - Improving Masked Autoencoders by Learning Where to Mask [65.89510231743692]
マスケ画像モデリングは視覚データに対する有望な自己教師型学習手法である。
本稿では,Gumbel-Softmax を用いて,対向学習マスク生成装置とマスク誘導画像モデリングプロセスとを相互接続するフレームワーク AutoMAE を提案する。
実験の結果,AutoMAEは,標準の自己監督型ベンチマークや下流タスクに対して,効果的な事前学習モデルを提供することがわかった。
論文 参考訳(メタデータ) (2023-03-12T05:28:55Z) - MAT: Mask-Aware Transformer for Large Hole Image Inpainting [79.67039090195527]
本稿では, 変圧器と畳み込みの利点を統一する, 大穴塗装の新しいモデルを提案する。
実験では、複数のベンチマークデータセット上で、新しいモデルの最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2022-03-29T06:36:17Z) - ObjectFormer for Image Manipulation Detection and Localization [118.89882740099137]
画像操作の検出とローカライズを行うObjectFormerを提案する。
画像の高周波特徴を抽出し,マルチモーダルパッチの埋め込みとしてRGB特徴と組み合わせる。
各種データセットについて広範な実験を行い,提案手法の有効性を検証した。
論文 参考訳(メタデータ) (2022-03-28T12:27:34Z) - Adversarial Masking for Self-Supervised Learning [81.25999058340997]
自己教師付き学習のためのマスク付き画像モデル(MIM)フレームワークであるADIOSを提案する。
対向目的物を用いてマスキング機能と画像エンコーダを同時に学習する。
さまざまなタスクやデータセットに対する最先端の自己教師付き学習(SSL)メソッドを一貫して改善する。
論文 参考訳(メタデータ) (2022-01-31T10:23:23Z) - Swapping Autoencoder for Deep Image Manipulation [94.33114146172606]
画像操作に特化して設計されたディープモデルであるSwapping Autoencoderを提案する。
キーとなるアイデアは、2つの独立したコンポーネントで画像をエンコードし、交換された組み合わせをリアルなイメージにマップするように強制することだ。
複数のデータセットの実験により、我々のモデルはより良い結果が得られ、最近の生成モデルと比較してかなり効率が良いことが示されている。
論文 参考訳(メタデータ) (2020-07-01T17:59:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。