論文の概要: Neural Networks with Divisive normalization for image segmentation with
application in cityscapes dataset
- arxiv url: http://arxiv.org/abs/2203.13558v1
- Date: Fri, 25 Mar 2022 10:26:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-28 20:20:56.025663
- Title: Neural Networks with Divisive normalization for image segmentation with
application in cityscapes dataset
- Title(参考訳): 画像分割のための分割正規化付きニューラルネットワークと都市景観データセットへの応用
- Authors: Pablo Hern\'andez-C\'amara, Valero Laparra, Jes\'us Malo (Image
Processing Lab., Universitat de Val\`encia)
- Abstract要約: 現在のディープネットワークにおける分割正規化を含めることで、画像の非表現的変化に対してより不変となることを示す。
実験により、U-Netアーキテクチャに分割正規化を組み込むことで、従来のU-Netに対してより良いセグメンテーション結果が得られることが示された。
- 参考スコア(独自算出の注目度): 2.960890352853005
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One of the key problems in computer vision is adaptation: models are too
rigid to follow the variability of the inputs. The canonical computation that
explains adaptation in sensory neuroscience is divisive normalization, and it
has appealing effects on image manifolds. In this work we show that including
divisive normalization in current deep networks makes them more invariant to
non-informative changes in the images. In particular, we focus on U-Net
architectures for image segmentation. Experiments show that the inclusion of
divisive normalization in the U-Net architecture leads to better segmentation
results with respect to conventional U-Net. The gain increases steadily when
dealing with images acquired in bad weather conditions. In addition to the
results on the Cityscapes and Foggy Cityscapes datasets, we explain these
advantages through visualization of the responses: the equalization induced by
the divisive normalization leads to more invariant features to local changes in
contrast and illumination.
- Abstract(参考訳): コンピュータビジョンにおける重要な問題の1つは適応である:モデルは入力の可変性に従うには厳密すぎる。
感覚神経科学における適応を説明する標準計算は分裂正規化であり、画像多様体に魅力的な効果を持つ。
本研究では,現在のディープネットワークにおける分割正規化を含むことにより,画像の非インフォーマティブな変化に対してより不変となることを示す。
特に、イメージセグメンテーションのためのU-Netアーキテクチャに焦点を当てる。
実験により、U-Netアーキテクチャに分割正規化を組み込むことで、従来のU-Netに対してより良いセグメンテーション結果が得られることが示された。
悪天候下で取得した画像を扱う場合、利上げは着実に増加する。
Cityscapes と Foggy Cityscapes のデータセットの結果に加えて、これらの利点は反応の可視化によって説明される: 分割正規化によって誘導される等化は、対照的な点と照明の局所的な変化に、より不変な特徴をもたらす。
関連論文リスト
- The Overfocusing Bias of Convolutional Neural Networks: A Saliency-Guided Regularization Approach [11.524573224123905]
CNNは入力画像の狭い特定の領域に基づいて決定を行う。
この振る舞いはモデルの一般化能力を著しく損なう可能性がある。
この問題に対処するために、SGDrop(Saliency Guided Dropout)を紹介します。
論文 参考訳(メタデータ) (2024-09-25T21:30:16Z) - Image Segmentation via Divisive Normalization: dealing with environmental diversity [0.8796261172196743]
ディバイシブ・ノーマライゼーションを付加したセグメンテーションU-ネットをトレーニング条件から遠ざかるようにした。
シーンは、そのラディアンスレベルとダイナミックレンジ(昼夜)に応じて分類し、無彩色/彩色コントラストに応じて分類する。
その結果、ディバイシブ正規化を伴うニューラルネットワークは、すべてのシナリオでより良い結果が得られることがわかった。
論文 参考訳(メタデータ) (2024-07-25T07:38:27Z) - Deformable Convolution Based Road Scene Semantic Segmentation of Fisheye Images in Autonomous Driving [4.720434481945155]
本研究では,近代的変形可能な畳み込みニューラルネットワーク(DCNN)のセマンティックセグメンテーションタスクへの応用について検討する。
実験では,WoodScapeの魚眼画像データセットを10種類の異なるクラスに分割し,複雑な空間関係を捉えるデフォルマブルネットワークの能力を評価する。
変形可能なCNNの統合によるmIoUスコアの大幅な改善は、魚眼画像に存在する幾何歪みを扱う上での有効性を示す。
論文 参考訳(メタデータ) (2024-07-23T17:02:24Z) - Distractors-Immune Representation Learning with Cross-modal Contrastive Regularization for Change Captioning [71.14084801851381]
変更キャプションは、類似した画像間のセマンティックな変化を簡潔に記述することを目的としている。
既存のほとんどの手法は、それらの違いを直接キャプチャし、エラーを起こしやすい特徴を得るリスクを負う。
本稿では,2つの画像表現の対応するチャネルを関連づけるイントラクタ免疫表現学習ネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T13:00:33Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Accurate Image Restoration with Attention Retractable Transformer [50.05204240159985]
画像復元のためのアテンション・リトラクタブル・トランス (ART) を提案する。
ARTはネットワーク内の密集モジュールと疎開モジュールの両方を提示する。
画像超解像、デノナイジング、JPEG圧縮アーティファクト削減タスクについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-10-04T07:35:01Z) - Graph Reasoning Transformer for Image Parsing [67.76633142645284]
本稿では,画像解析のためのグラフ推論変換器(GReaT)を提案する。
従来の変圧器と比較して、GReaTは高い相互作用効率とより目的のある相互作用パターンを有する。
その結果、GReaTは、最先端のトランスフォーマーベースラインにわずかに計算オーバーヘッドを伴って、一貫した性能向上を実現していることがわかった。
論文 参考訳(メタデータ) (2022-09-20T08:21:37Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z) - Attentive Normalization for Conditional Image Generation [126.08247355367043]
我々は、従来のインスタンス正規化の拡張である注意的正規化(AN)により、長距離依存を特徴づける。
自己注意型GANと比較して、注意的正規化はすべての位置の相関を測る必要がない。
クラス条件の画像生成とセマンティックインパインティングの実験により,提案モジュールの有効性が検証された。
論文 参考訳(メタデータ) (2020-04-08T06:12:25Z) - $\P$ILCRO: Making Importance Landscapes Flat Again [7.047473967702792]
本稿は、既存の畳み込みアーキテクチャの大部分が、初期化において、特定の特徴のランドスケープを定義していることを示す。
画素単位のランドスケープ曲線正規化対象物に対する P-objective または PILCRO を導出する。
一般的なコンピュータビジョンネットワークのP正規化バージョンは、平坦なランドスケープを持ち、より高速なトレーニングを行い、その結果、精度が向上し、テスト時のノイズに対してより堅牢であることを示す。
論文 参考訳(メタデータ) (2020-01-27T11:20:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。