論文の概要: Contrastive Semantic-Guided Image Smoothing Network
- arxiv url: http://arxiv.org/abs/2209.00977v1
- Date: Fri, 2 Sep 2022 12:18:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-05 12:33:03.828618
- Title: Contrastive Semantic-Guided Image Smoothing Network
- Title(参考訳): コントラスト意味誘導画像平滑化ネットワーク
- Authors: Jie Wang, Yongzhen Wang, Yidan Feng, Lina Gong, Xuefeng Yan, Haoran
Xie, Fu Lee Wang, Mingqiang Wei
- Abstract要約: CSGIS-Net(Contrastive Semantic-Guided Image Smoothing Network)を提案する。
強靭な画像の平滑化を促進するために、コントラスト的な事前とセマンティックを組み合わせる。
提案するネットワークは、最先端のアルゴリズムを大きなマージンで上回る。
- 参考スコア(独自算出の注目度): 23.117519864895183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image smoothing is a fundamental low-level vision task that aims to preserve
salient structures of an image while removing insignificant details. Deep
learning has been explored in image smoothing to deal with the complex
entanglement of semantic structures and trivial details. However, current
methods neglect two important facts in smoothing: 1) naive pixel-level
regression supervised by the limited number of high-quality smoothing
ground-truth could lead to domain shift and cause generalization problems
towards real-world images; 2) texture appearance is closely related to object
semantics, so that image smoothing requires awareness of semantic difference to
apply adaptive smoothing strengths. To address these issues, we propose a novel
Contrastive Semantic-Guided Image Smoothing Network (CSGIS-Net) that combines
both contrastive prior and semantic prior to facilitate robust image smoothing.
The supervision signal is augmented by leveraging undesired smoothing effects
as negative teachers, and by incorporating segmentation tasks to encourage
semantic distinctiveness. To realize the proposed network, we also enrich the
original VOC dataset with texture enhancement and smoothing labels, namely
VOC-smooth, which first bridges image smoothing and semantic segmentation.
Extensive experiments demonstrate that the proposed CSGIS-Net outperforms
state-of-the-art algorithms by a large margin. Code and dataset are available
at https://github.com/wangjie6866/CSGIS-Net.
- Abstract(参考訳): 画像スムーシングは、画像の健全な構造を保存しつつ、重要な詳細を除去することを目的とした、基本的な低レベルの視覚タスクである。
深層学習は、意味構造と自明な詳細の複雑な絡み合いに対処するために、画像の平滑化において研究されてきた。
しかし、現在の方法は平滑化において2つの重要な事実を無視している。
1) 高品質な平滑化グランドルースを限定したナイーブな画素レベル回帰は,領域シフトを引き起こし,実世界画像に対する一般化問題を引き起こす可能性がある。
2)テクスチャの出現はオブジェクトのセマンティクスと密接に関連しているため,画像の平滑化には適応的な平滑化強度を適用するために意味的差異の認識が必要である。
これらの課題に対処するために,コントラスト先行とセマンティックを併用し,より堅牢な画像平滑化を実現するContrastive Semantic-Guided Image Smoothing Network (CSGIS-Net)を提案する。
監督信号は、望ましくない平滑化効果を負の教師として活用し、セグメンテーションタスクを取り入れて意味的特徴性を促進することで強化される。
提案するネットワークを実現するために,画像の平滑化とセマンティックセグメンテーションを最初に橋渡しするVOCスムース(VOC-smooth)という,テクスチャ強化とスムースメントラベルを備えたVOCデータセットも強化した。
大規模な実験により、CSGIS-Netは最先端のアルゴリズムよりも大きなマージンで優れていることが示された。
コードとデータセットはhttps://github.com/wangjie6866/CSGIS-Netで公開されている。
関連論文リスト
- Enhanced Unsupervised Image-to-Image Translation Using Contrastive Learning and Histogram of Oriented Gradients [0.0]
本稿では,Contrastive Unpaired Translation (CUT)モデルに基づく,教師なし画像から画像への変換手法を提案する。
この新しいアプローチは、セマンティックラベルなしでも画像のセマンティック構造を確実に保存する。
本手法は,GTA5データセットから都市景観データセットのリアルな都市シーンへの合成ゲーム環境の変換について検討した。
論文 参考訳(メタデータ) (2024-09-24T12:44:27Z) - Edge Guided GANs with Multi-Scale Contrastive Learning for Semantic
Image Synthesis [139.2216271759332]
本稿では,難解なセマンティック画像合成タスクのための新しいECGANを提案する。
セマンティックラベルは詳細な構造情報を提供しておらず、局所的な詳細や構造を合成することは困難である。
畳み込み、ダウンサンプリング、正規化といった広く採用されているCNN操作は、通常、空間分解能の損失を引き起こす。
本稿では,同じセマンティッククラスに属する画素埋め込みを強制して,より類似した画像コンテンツを生成することを目的とした,新しいコントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2023-07-22T14:17:19Z) - Wavelet-based Unsupervised Label-to-Image Translation [9.339522647331334]
本稿では、自己教師付きセグメンテーション損失と全画像ウェーブレットに基づく識別を併用した、SIS(USIS)のための新しいアン教師付きパラダイムを提案する。
3つの挑戦的なデータセットで方法論を検証し、ペアモデルとアンペアモデルのパフォーマンスギャップを橋渡しする能力を実証する。
論文 参考訳(メタデータ) (2023-05-16T17:48:44Z) - Fully Context-Aware Image Inpainting with a Learned Semantic Pyramid [102.24539566851809]
画像中の任意の欠落する領域に対して、合理的で現実的なコンテンツを復元することは、重要な課題である。
最近の画像インパインティングモデルは鮮明な視覚的詳細を生成するために大きな進歩を遂げているが、それでもテクスチャのぼやけや構造的歪みにつながる可能性がある。
本研究では,画像中の局所的欠落コンテンツの回復に大きく貢献する,多スケールなセマンティック・セマンティック・ピラミッド・ネットワーク(SPN)を提案する。
論文 参考訳(メタデータ) (2021-12-08T04:33:33Z) - USIS: Unsupervised Semantic Image Synthesis [9.613134538472801]
セマンティック画像合成(USIS)のための新しい教師なしパラダイムを提案する。
USISは、自己教師付きセグメンテーションロスを使用して、視覚的に分離可能なセグメンテーションクラスで画像を出力することを学ぶ。
実画像の色とテクスチャの分布を高周波数情報を失うことなく一致させるため,ウェーブレットを用いた識別手法を提案する。
論文 参考訳(メタデータ) (2021-09-29T20:48:41Z) - Context-Aware Image Inpainting with Learned Semantic Priors [100.99543516733341]
欠落した内容を推定するために意味的に意味のある前文タスクを導入する。
本研究では,グローバルなセマンティクスと局所的な特徴を適応的に統合した文脈認識型画像インパインティングモデルを提案する。
論文 参考訳(メタデータ) (2021-06-14T08:09:43Z) - Image Inpainting Guided by Coherence Priors of Semantics and Textures [62.92586889409379]
セマンティクスとテクスチャ間のコヒーレンスプリエンスを導入することにより、セマンティクス的な方法で別々のテクスチャを完成させることに集中できる。
また,全体構造と詳細なテクスチャの観点から,セマンティクスとインペインテッドイメージの一貫性を制約する2つのコヒーレンス損失を提案する。
論文 参考訳(メタデータ) (2020-12-15T02:59:37Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Edge Guided GANs with Contrastive Learning for Semantic Image Synthesis [194.1452124186117]
本稿では,難解なセマンティック画像合成タスクのための新しいECGANを提案する。
我々のECGANは最先端の手法よりもはるかに優れた結果が得られる。
論文 参考訳(メタデータ) (2020-03-31T01:23:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。