論文の概要: Contrastive Semantic-Guided Image Smoothing Network
- arxiv url: http://arxiv.org/abs/2209.00977v1
- Date: Fri, 2 Sep 2022 12:18:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-05 12:33:03.828618
- Title: Contrastive Semantic-Guided Image Smoothing Network
- Title(参考訳): コントラスト意味誘導画像平滑化ネットワーク
- Authors: Jie Wang, Yongzhen Wang, Yidan Feng, Lina Gong, Xuefeng Yan, Haoran
Xie, Fu Lee Wang, Mingqiang Wei
- Abstract要約: CSGIS-Net(Contrastive Semantic-Guided Image Smoothing Network)を提案する。
強靭な画像の平滑化を促進するために、コントラスト的な事前とセマンティックを組み合わせる。
提案するネットワークは、最先端のアルゴリズムを大きなマージンで上回る。
- 参考スコア(独自算出の注目度): 23.117519864895183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image smoothing is a fundamental low-level vision task that aims to preserve
salient structures of an image while removing insignificant details. Deep
learning has been explored in image smoothing to deal with the complex
entanglement of semantic structures and trivial details. However, current
methods neglect two important facts in smoothing: 1) naive pixel-level
regression supervised by the limited number of high-quality smoothing
ground-truth could lead to domain shift and cause generalization problems
towards real-world images; 2) texture appearance is closely related to object
semantics, so that image smoothing requires awareness of semantic difference to
apply adaptive smoothing strengths. To address these issues, we propose a novel
Contrastive Semantic-Guided Image Smoothing Network (CSGIS-Net) that combines
both contrastive prior and semantic prior to facilitate robust image smoothing.
The supervision signal is augmented by leveraging undesired smoothing effects
as negative teachers, and by incorporating segmentation tasks to encourage
semantic distinctiveness. To realize the proposed network, we also enrich the
original VOC dataset with texture enhancement and smoothing labels, namely
VOC-smooth, which first bridges image smoothing and semantic segmentation.
Extensive experiments demonstrate that the proposed CSGIS-Net outperforms
state-of-the-art algorithms by a large margin. Code and dataset are available
at https://github.com/wangjie6866/CSGIS-Net.
- Abstract(参考訳): 画像スムーシングは、画像の健全な構造を保存しつつ、重要な詳細を除去することを目的とした、基本的な低レベルの視覚タスクである。
深層学習は、意味構造と自明な詳細の複雑な絡み合いに対処するために、画像の平滑化において研究されてきた。
しかし、現在の方法は平滑化において2つの重要な事実を無視している。
1) 高品質な平滑化グランドルースを限定したナイーブな画素レベル回帰は,領域シフトを引き起こし,実世界画像に対する一般化問題を引き起こす可能性がある。
2)テクスチャの出現はオブジェクトのセマンティクスと密接に関連しているため,画像の平滑化には適応的な平滑化強度を適用するために意味的差異の認識が必要である。
これらの課題に対処するために,コントラスト先行とセマンティックを併用し,より堅牢な画像平滑化を実現するContrastive Semantic-Guided Image Smoothing Network (CSGIS-Net)を提案する。
監督信号は、望ましくない平滑化効果を負の教師として活用し、セグメンテーションタスクを取り入れて意味的特徴性を促進することで強化される。
提案するネットワークを実現するために,画像の平滑化とセマンティックセグメンテーションを最初に橋渡しするVOCスムース(VOC-smooth)という,テクスチャ強化とスムースメントラベルを備えたVOCデータセットも強化した。
大規模な実験により、CSGIS-Netは最先端のアルゴリズムよりも大きなマージンで優れていることが示された。
コードとデータセットはhttps://github.com/wangjie6866/CSGIS-Netで公開されている。
関連論文リスト
- Dual Pyramid Generative Adversarial Networks for Semantic Image
Synthesis [94.76988562653845]
セマンティック画像合成の目標は、セマンティックラベルマップからフォトリアリスティック画像を生成することである。
しかし、現在の最先端のアプローチは、さまざまなスケールで画像で現実的なオブジェクトを生成するのに依然として苦労している。
本研究では,空間適応型正規化ブロックの条件付けを各スケールで同時に学習するDual Pyramid Generative Adversarial Network (DP-GAN)を提案する。
論文 参考訳(メタデータ) (2022-10-08T18:45:44Z) - Fully Context-Aware Image Inpainting with a Learned Semantic Pyramid [101.52141133449688]
画像中の任意の欠落する領域に対して、合理的で現実的なコンテンツを復元することは、重要な課題である。
最近の画像インパインティングモデルは鮮明な視覚的詳細を生成するために大きな進歩を遂げているが、それでもテクスチャのぼやけや構造的歪みにつながる可能性がある。
本研究では,画像中の局所的欠落コンテンツの回復に大きく貢献する,多スケールなセマンティック・セマンティック・ピラミッド・ネットワーク(SPN)を提案する。
論文 参考訳(メタデータ) (2021-12-08T04:33:33Z) - SAPNet: Segmentation-Aware Progressive Network for Perceptual
Contrastive Deraining [2.615176171489612]
単一画像のデライニングのためのコントラスト学習に基づくセグメンテーション・アウェア・プログレッシブ・ネットワーク(SAPNet)を提案する。
本モデルでは,オブジェクト検出とセマンティックセマンティックセグメンテーションを高い精度で支援する。
論文 参考訳(メタデータ) (2021-11-17T03:57:11Z) - USIS: Unsupervised Semantic Image Synthesis [9.613134538472801]
セマンティック画像合成(USIS)のための新しい教師なしパラダイムを提案する。
USISは、自己教師付きセグメンテーションロスを使用して、視覚的に分離可能なセグメンテーションクラスで画像を出力することを学ぶ。
実画像の色とテクスチャの分布を高周波数情報を失うことなく一致させるため,ウェーブレットを用いた識別手法を提案する。
論文 参考訳(メタデータ) (2021-09-29T20:48:41Z) - Context-Aware Image Inpainting with Learned Semantic Priors [100.99543516733341]
欠落した内容を推定するために意味的に意味のある前文タスクを導入する。
本研究では,グローバルなセマンティクスと局所的な特徴を適応的に統合した文脈認識型画像インパインティングモデルを提案する。
論文 参考訳(メタデータ) (2021-06-14T08:09:43Z) - LEUGAN:Low-Light Image Enhancement by Unsupervised Generative
Attentional Networks [4.584570928928926]
低照度画像強調タスクを処理するために,注意誘導型教師なし生成ネットワークを提案する。
具体的には,よりシャープなエッジを復元するエッジ補助モジュールと,よりリアルなカラーを復元するアテンション誘導モジュールの2つを含む。
実験では,提案アルゴリズムが最新手法に対して好適に動作することを検証した。
論文 参考訳(メタデータ) (2020-12-24T16:49:19Z) - Image Inpainting Guided by Coherence Priors of Semantics and Textures [62.92586889409379]
セマンティクスとテクスチャ間のコヒーレンスプリエンスを導入することにより、セマンティクス的な方法で別々のテクスチャを完成させることに集中できる。
また,全体構造と詳細なテクスチャの観点から,セマンティクスとインペインテッドイメージの一貫性を制約する2つのコヒーレンス損失を提案する。
論文 参考訳(メタデータ) (2020-12-15T02:59:37Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Edge Guided GANs with Contrastive Learning for Semantic Image Synthesis [194.1452124186117]
コントラスト学習(ECGAN)を用いた新しいエッジガイド生成対向ネットワークを提案する。
合成画像の品質は、未解決の3つの課題により、決して満足できない。
論文 参考訳(メタデータ) (2020-03-31T01:23:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。