論文の概要: Inharmonious Region Localization via Recurrent Self-Reasoning
- arxiv url: http://arxiv.org/abs/2210.02036v1
- Date: Wed, 5 Oct 2022 05:50:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 14:11:40.662662
- Title: Inharmonious Region Localization via Recurrent Self-Reasoning
- Title(参考訳): Recurrent Self-Reasoning による不調和領域の局在
- Authors: Penghao Wu, Li Niu, Jing Liang, Liqing Zhang
- Abstract要約: 合成画像の品質向上のためには,不調和領域の局所化が重要でありながら課題である。
古典的なクラスタリングアルゴリズムにインスパイアされた我々は、ピクセルを2つのクラスタ、すなわち不調和なクラスタとバックグラウンドクラスタにグループ化することを目指している。
- 参考スコア(独自算出の注目度): 18.963031309495005
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic images created by image editing operations are prevalent, but the
color or illumination inconsistency between the manipulated region and
background may make it unrealistic. Thus, it is important yet challenging to
localize the inharmonious region to improve the quality of synthetic image.
Inspired by the classic clustering algorithm, we aim to group pixels into two
clusters: inharmonious cluster and background cluster by inserting a novel
Recurrent Self-Reasoning (RSR) module into the bottleneck of UNet structure.
The mask output from RSR module is provided for the decoder as attention
guidance. Finally, we adaptively combine the masks from RSR and the decoder to
form our final mask. Experimental results on the image harmonization dataset
demonstrate that our method achieves competitive performance both
quantitatively and qualitatively.
- Abstract(参考訳): 画像編集操作によって生成された合成画像は一般的であるが、操作された領域と背景の間の色や照明の不整合は非現実的である可能性がある。
したがって、合成画像の品質を向上させるために不調和領域を局在化することが重要である。
従来のクラスタリングアルゴリズムにインスパイアされた我々は,UNet構造のボトルネックに新たなRecurrent Self-Reasoning (RSR)モジュールを挿入することで,不調和クラスタとバックグラウンドクラスタの2つのクラスタに画素をグループ化する。
RSRモジュールからのマスク出力は、注意誘導としてデコーダに提供される。
最後に、RSRとデコーダのマスクを適応的に組み合わせ、最終マスクを形成する。
画像調和データセットの実験結果から,提案手法が定量的かつ定性的に競合性能を達成することを示す。
関連論文リスト
- Retinex-RAWMamba: Bridging Demosaicing and Denoising for Low-Light RAW Image Enhancement [71.13353154514418]
低照度画像の強化、特に生ドメインからsRGBドメインへのマッピングのようなクロスドメインタスクは、依然として大きな課題である。
RAWMambaと呼ばれる新しいMambaスキャニング機構を提案する。
また,Retinex の先行したRetinex Decomposition Module (RDM) も提案する。
論文 参考訳(メタデータ) (2024-09-11T06:12:03Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Masked Collaborative Contrast for Weakly Supervised Semantic
Segmentation [22.74105261883464]
Masked Collaborative Contrast (MCC) は、弱教師付きセマンティックセグメンテーションにおける意味領域を強調する。
MCCは暗黙のイメージモデリングと対照的な学習から着想を得て、セマンティック領域に向けてキーを誘導する新しいフレームワークを考案した。
論文 参考訳(メタデータ) (2023-05-15T09:46:28Z) - Joint Learning of Deep Texture and High-Frequency Features for
Computer-Generated Image Detection [24.098604827919203]
本稿では,CG画像検出のための深いテクスチャと高周波特徴を有する共同学習戦略を提案する。
セマンティックセグメンテーションマップを生成して、アフィン変換操作を誘導する。
原画像と原画像の高周波成分の組み合わせを、注意機構を備えたマルチブランチニューラルネットワークに供給する。
論文 参考訳(メタデータ) (2022-09-07T17:30:40Z) - Robust Real-World Image Super-Resolution against Adversarial Attacks [115.04009271192211]
準知覚不可能な雑音を持つ逆画像サンプルは、深層学習SRモデルを脅かす可能性がある。
本稿では,現実のSRに対して,潜在的な敵対的雑音をランダムに消去する頑健なディープラーニングフレームワークを提案する。
提案手法は敵攻撃に敏感であり,既存のモデルや防御よりも安定なSR結果を示す。
論文 参考訳(メタデータ) (2022-07-31T13:26:33Z) - FRIH: Fine-grained Region-aware Image Harmonization [49.420765789360836]
我々は,FRIH(Fentral-Aware Image Harmonization)のための新しいグローバルな2段階フレームワークを提案する。
提案アルゴリズムは,軽量モデルを用いて,iHarmony4データセット(PSNRは38.19dB)上で最高の性能を実現する。
論文 参考訳(メタデータ) (2022-05-13T04:50:26Z) - Image Inpainting by End-to-End Cascaded Refinement with Mask Awareness [66.55719330810547]
任意の欠落領域を塗りつぶすことは、様々なマスクされた領域で有効な特徴を学ぶことは非自明だから難しい。
符号化フェーズにおける欠落領域のマルチスケール特徴を学習する新しいマスク対応インペイントソリューションを提案する。
私たちのフレームワークは、3つの公開データセットに関する広範な実験を通じて定量的および定性的に検証されます。
論文 参考訳(メタデータ) (2021-04-28T13:17:47Z) - Convolutional Autoencoder for Blind Hyperspectral Image Unmixing [0.0]
スペクトルアンミックス(英: spectrum unmixing)は、混合ピクセルを2つの基本的代表、すなわちエンドメンバーとアブリダンスに分解する技法である。
本稿では,ハイパースペクトル画像にブラインドアンミックスを行う新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-11-18T17:41:31Z) - Residual-Sparse Fuzzy $C$-Means Clustering Incorporating Morphological
Reconstruction and Wavelet frames [146.63177174491082]
Fuzzy $C$-Means (FCM)アルゴリズムは、形態的再構成操作とタイトウェーブレットフレーム変換を組み込んでいる。
特徴集合とその理想値の間の残差に対して$ell_0$正規化項を付与することにより、改良されたFCMアルゴリズムを提案する。
合成, 医用, カラー画像に対する実験結果から, 提案アルゴリズムは効率的かつ効率的であり, 他のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-02-14T10:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。