論文の概要: Manipulation Mask Generator: High-Quality Image Manipulation Mask
Generation Method Based on Modified Total Variation Noise Reduction
- arxiv url: http://arxiv.org/abs/2310.15041v1
- Date: Mon, 23 Oct 2023 15:40:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 19:06:41.825657
- Title: Manipulation Mask Generator: High-Quality Image Manipulation Mask
Generation Method Based on Modified Total Variation Noise Reduction
- Title(参考訳): マニピュレーションマスク生成装置 : 修正全変動雑音低減に基づく高品質画像マニピュレーションマスク生成方法
- Authors: Xinyu Yang, Jizhe Zhou
- Abstract要約: 本稿では,高品質な改ざん画像を取得するための改良された全変動雑音低減手法を提案する。
Baidu PS Barからオリジナル画像や改ざん画像を自動的にクロールします。
改良された全変動雑音低減法は,この問題の解決を目的としている。
- 参考スコア(独自算出の注目度): 20.620232937684133
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In artificial intelligence, any model that wants to achieve a good result is
inseparable from a large number of high-quality data. It is especially true in
the field of tamper detection. This paper proposes a modified total variation
noise reduction method to acquire high-quality tampered images. We
automatically crawl original and tampered images from the Baidu PS Bar. Baidu
PS Bar is a website where net friends post countless tampered images.
Subtracting the original image with the tampered image can highlight the
tampered area. However, there is also substantial noise on the final print, so
these images can't be directly used in the deep learning model. Our modified
total variation noise reduction method is aimed at solving this problem.
Because a lot of text is slender, it is easy to lose text information after the
opening and closing operation. We use MSER (Maximally Stable Extremal Regions)
and NMS (Non-maximum Suppression) technology to extract text information. And
then use the modified total variation noise reduction technology to process the
subtracted image. Finally, we can obtain an image with little noise by adding
the image and text information. And the idea also largely retains the text
information. Datasets generated in this way can be used in deep learning
models, and they will help the model achieve better results.
- Abstract(参考訳): 人工知能では、良い結果を得たいどんなモデルでも、大量の高品質なデータとは区別がつかない。
特にタンパー検出の分野では真である。
本稿では,高品質改ざん画像を得るため,総変動雑音低減法を提案する。
Baidu PS Barからオリジナル画像や改ざん画像を自動的にクロールします。
Baidu PS Barは、ネット上の友人が無数の改ざんされた画像を投稿するウェブサイトだ。
原画像を改ざん画像で置換することで、改ざん領域をハイライトすることができる。
しかし、最終的な印刷物にはかなりのノイズがあり、これらの画像はディープラーニングモデルで直接使用することはできない。
改良された全変動雑音低減法は,この問題の解決を目的としている。
多くのテキストは細長いため、開閉操作の後にテキスト情報を失うことは容易である。
テキスト情報の抽出にはMSER(Maximally Stable Extremal Regions)とNMS(Non-maximum Suppression)技術を用いる。
そして、修正された全変動ノイズ低減技術を使用して、減算された画像を処理する。
最後に、画像とテキスト情報を付加することにより、ノイズの少ない画像を得ることができる。
そしてそのアイデアは、主にテキスト情報を保持する。
このように生成されたデータセットは、ディープラーニングモデルで使用することができ、モデルがよりよい結果を得るのに役立つだろう。
関連論文リスト
- Restore Anything with Masks: Leveraging Mask Image Modeling for Blind All-in-One Image Restoration [35.3663995646582]
オールインワン画像復元は、複数の劣化タイプを1つのモデルで処理することを目的としている。
本稿では,オールインワンブラインド画像復元のための簡易パイプラインを提案する。
論文 参考訳(メタデータ) (2024-09-28T16:33:43Z) - TurboEdit: Text-Based Image Editing Using Few-Step Diffusion Models [53.757752110493215]
テキストベースの一般的な編集フレームワーク – 編集フレンドリーなDDPM-noiseインバージョンアプローチ – に注目します。
高速サンプリング法への適用を解析し、その失敗を視覚的アーティファクトの出現と編集強度の不足という2つのクラスに分類する。
そこで我々は,新しいアーティファクトを導入することなく,効率よく編集の規模を拡大する疑似誘導手法を提案する。
論文 参考訳(メタデータ) (2024-08-01T17:27:28Z) - M^3:Manipulation Mask Manufacturer for Arbitrary-Scale Super-Resolution Mask [32.13489910094028]
インターネット上の画像(Baidu TiebaのPS Barなど)は様々な技術を用いて操作される。
操作された画像を原画像から抽出するだけで得られるマスクには、様々なノイズが含まれている。
変化検出の分野に触発されて、元の画像と操作された画像を、同じ画像の時間経過とともに変化として扱う。
論文 参考訳(メタデータ) (2024-07-04T07:30:41Z) - TiNO-Edit: Timestep and Noise Optimization for Robust Diffusion-Based Image Editing [12.504661526518234]
我々は、編集中のノイズパターンと拡散時間の最適化に焦点をあてたSDベースのTiNO-Editを提案する。
SDの潜在領域で動作する新しい損失関数のセットを提案し、最適化を大幅に高速化する。
本手法は,Textual InversionやDreamBoothなど,SDのバリエーションに容易に適用することができる。
論文 参考訳(メタデータ) (2024-04-17T07:08:38Z) - iEdit: Localised Text-guided Image Editing with Weak Supervision [53.082196061014734]
テキスト誘導画像編集のための新しい学習法を提案する。
ソースイメージに条件付けされた画像とテキスト編集プロンプトを生成する。
画像の忠実度、CLIPアライメントスコア、および生成された画像と実際の画像の両方を定性的に編集する点において、画像に対して好ましい結果を示す。
論文 参考訳(メタデータ) (2023-05-10T07:39:14Z) - An Edit Friendly DDPM Noise Space: Inversion and Manipulations [22.356884847119616]
そこで本研究では,DDPMの簡易な操作により,幅広い編集操作が可能となる潜在雑音空間を提案する。
この特性により,多様なDDPMサンプリング方式を用いて実画像のテキストベースの編集が可能となることを示す。
また,既存の拡散ベースの編集手法を用いて,その品質と多様性を向上させる方法を示す。
論文 参考訳(メタデータ) (2023-04-12T19:47:13Z) - Masked Image Training for Generalizable Deep Image Denoising [53.03126421917465]
本稿では,デノナイジングネットワークの一般化性能を高めるための新しい手法を提案する。
提案手法では,入力画像のランダムなピクセルをマスキングし,学習中に欠落した情報を再構成する。
提案手法は,他のディープラーニングモデルよりも優れた一般化能力を示し,実世界のシナリオに直接適用可能である。
論文 参考訳(メタデータ) (2023-03-23T09:33:44Z) - Uncovering the Disentanglement Capability in Text-to-Image Diffusion
Models [60.63556257324894]
画像生成モデルの重要な特性は、異なる属性をアンタングルする能力である。
本稿では,2つのテキスト埋め込みの混合重みをスタイルマッチングとコンテンツ保存に最適化した,シンプルで軽量な画像編集アルゴリズムを提案する。
実験により,提案手法は拡散モデルに基づく画像編集アルゴリズムよりも優れた性能で,幅広い属性を修正可能であることが示された。
論文 参考訳(メタデータ) (2022-12-16T19:58:52Z) - RePaint: Inpainting using Denoising Diffusion Probabilistic Models [161.74792336127345]
Free-form Inpaintingは任意のバイナリマスクで指定された領域のイメージに新しいコンテンツを追加するタスクである。
RePaint: A Denoising Probabilistic Model (DDPM) を用いた塗装手法を提案する。
本手法は,標準的なマスクと極端マスクを用いて,顔と汎用画像の塗装の両面で検証する。
論文 参考訳(メタデータ) (2022-01-24T18:40:15Z) - High-Resolution Image Inpainting with Iterative Confidence Feedback and
Guided Upsampling [122.06593036862611]
既存の画像塗装法は、実アプリケーションで大きな穴を扱う際に、しばしばアーティファクトを生成する。
本稿では,フィードバック機構を備えた反復インペイント手法を提案する。
実験により,本手法は定量評価と定性評価の両方において既存手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-05-24T13:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。