論文の概要: Improving Performance of Semantic Segmentation CycleGANs by Noise
Injection into the Latent Segmentation Space
- arxiv url: http://arxiv.org/abs/2201.06415v1
- Date: Mon, 17 Jan 2022 14:10:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-19 17:46:55.699123
- Title: Improving Performance of Semantic Segmentation CycleGANs by Noise
Injection into the Latent Segmentation Space
- Title(参考訳): 潜在セグメンテーション空間への雑音注入による意味セグメンテーションサイクルガンの性能向上
- Authors: Jonas L\"ohdefink, Tim Fingscheidt
- Abstract要約: セマンティックセグメンテーションとサイクル一貫性の概念を組み合わせることで,マルチタスクトレーニングプロトコルを実現する。
本稿では,潜伏分節領域の透かしとして表現する,いわゆるステガノグラフィー効果に対処するノイズ注入法を提案する。
ノイズ注入は透かしの生成を著しく減らし,高い関連クラスを認識できるようにする。
- 参考スコア(独自算出の注目度): 35.71822843703423
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, semantic segmentation has taken benefit from various works
in computer vision. Inspired by the very versatile CycleGAN architecture, we
combine semantic segmentation with the concept of cycle consistency to enable a
multitask training protocol. However, learning is largely prevented by the
so-called steganography effect, which expresses itself as watermarks in the
latent segmentation domain, making image reconstruction a too easy task. To
combat this, we propose a noise injection, based either on quantization noise
or on Gaussian noise addition to avoid this disadvantageous information flow in
the cycle architecture. We find that noise injection significantly reduces the
generation of watermarks and thus allows the recognition of highly relevant
classes such as "traffic signs", which are hardly detected by the ERFNet
baseline. We report mIoU and PSNR results on the Cityscapes dataset for
semantic segmentation and image reconstruction, respectively. The proposed
methodology allows to achieve an mIoU improvement on the Cityscapes validation
set of 5.7% absolute over the same CycleGAN without noise injection, and still
an absolute 4.9% over the ERFNet non-cyclic baseline.
- Abstract(参考訳): 近年、セマンティックセグメンテーションはコンピュータビジョンの様々な作品から恩恵を受けている。
非常に多用途なCycleGANアーキテクチャにヒントを得て、セマンティックセグメンテーションとサイクル一貫性の概念を組み合わせることで、マルチタスクトレーニングプロトコルを実現する。
しかし、学習はいわゆるステガノグラフィー効果(steganography effect)によって妨げられ、潜在分節領域の透かしとして表現されるため、画像再構成が容易すぎる。
そこで本研究では, この不利な情報の流れを回避するため, 量子化雑音やガウス雑音付加に基づく雑音注入を提案する。
ノイズインジェクションは透かしの生成を著しく減らし,ERFNetベースラインではほとんど検出されない「交通標識」のような高関連クラスの認識を可能にする。
セマンティックセグメンテーションと画像再構成のためのCityscapesデータセット上でmIoUとPSNRの結果を報告する。
提案手法は,同一のCycleGANをノイズ注入せずに5.7%,ERFNetの非循環ベースライン上では4.9%で,Cityscapes検証セットのmIoU改善を実現する。
関連論文リスト
- DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Focus on Content not Noise: Improving Image Generation for Nuclei
Segmentation by Suppressing Steganography in CycleGAN [1.564260789348333]
本稿では,DCTに基づく低域通過フィルタリングを用いて,ステガノグラフィーと呼ばれる隠れショートカット情報を生成画像から除去することを提案する。
我々はF1スコアの5.4ポイントをバニラサイクロンと比較して改善した。
論文 参考訳(メタデータ) (2023-08-03T13:58:37Z) - Multi-Class Segmentation from Aerial Views using Recursive Noise Diffusion [16.86600007830682]
本稿では,エンドツーエンドのセマンティックセマンティックセマンティクス拡散モデルを提案する。
提案手法はUAVidデータセット上で有望な結果を得る。
このメソッドの最初のイテレーションであるため、将来の改善には大いに期待できます。
論文 参考訳(メタデータ) (2022-12-01T18:59:26Z) - Deep Semantic Statistics Matching (D2SM) Denoising Network [70.01091467628068]
本稿では,Deep Semantic Statistics Matching (D2SM) Denoising Networkを紹介する。
事前訓練された分類ネットワークの意味的特徴を利用して、意味的特徴空間における明瞭な画像の確率的分布と暗黙的に一致させる。
識別画像のセマンティックな分布を学習することで,ネットワークの認知能力を大幅に向上させることを実証的に見出した。
論文 参考訳(メタデータ) (2022-07-19T14:35:42Z) - SAR Despeckling using a Denoising Diffusion Probabilistic Model [52.25981472415249]
スペックルの存在は画像品質を劣化させ、SAR画像理解アプリケーションの性能に悪影響を及ぼす。
本稿では,SAR脱種のための拡散確率モデルであるSAR-DDPMを紹介する。
提案手法は, 最先端の切り離し法と比較して, 定量化と定性化の両面で有意な改善を実現している。
論文 参考訳(メタデータ) (2022-06-09T14:00:26Z) - Poisson2Sparse: Self-Supervised Poisson Denoising From a Single Image [34.27748767631027]
本稿では,単一画像の自己教師型学習手法を提案する。
繰り返しニューラルネットワークを用いた画像復調のための従来の反復最適化アルゴリズムを近似する。
提案手法はPSNRとSSIMの両面で最先端の手法より優れている。
論文 参考訳(メタデータ) (2022-06-04T00:08:58Z) - Synergy Between Semantic Segmentation and Image Denoising via Alternate
Boosting [102.19116213923614]
ノイズ除去とセグメンテーションを交互に行うためのブーストネットワークを提案する。
我々は,ノイズによるセグメンテーション精度の低下に対処するだけでなく,画素別意味情報によってデノージング能力が向上することを示す。
実験の結果,デノイド画像の品質が大幅に向上し,セグメンテーション精度がクリーン画像に近いことを示した。
論文 参考訳(メタデータ) (2021-02-24T06:48:45Z) - Reconstructing the Noise Manifold for Image Denoising [56.562855317536396]
本稿では,画像ノイズ空間の構造を明示的に活用するcGANを提案する。
画像ノイズの低次元多様体を直接学習することにより、この多様体にまたがる情報のみをノイズ画像から除去する。
我々の実験に基づいて、我々のモデルは既存の最先端アーキテクチャを大幅に上回っている。
論文 参考訳(メタデータ) (2020-02-11T00:31:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。