論文の概要: Image Segmentation via Divisive Normalization: dealing with environmental diversity
- arxiv url: http://arxiv.org/abs/2407.17829v1
- Date: Thu, 25 Jul 2024 07:38:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-26 14:57:53.997051
- Title: Image Segmentation via Divisive Normalization: dealing with environmental diversity
- Title(参考訳): ディバイシブノーマライゼーションによるイメージセグメンテーション--環境多様性を扱う
- Authors: Pablo Hernández-Cámara, Jorge Vila-Tomás, Paula Dauden-Oliver, Nuria Alabau-Bosque, Valero Laparra, Jesús Malo,
- Abstract要約: ディバイシブ・ノーマライゼーションを付加したセグメンテーションU-ネットをトレーニング条件から遠ざかるようにした。
シーンは、そのラディアンスレベルとダイナミックレンジ(昼夜)に応じて分類し、無彩色/彩色コントラストに応じて分類する。
その結果、ディバイシブ正規化を伴うニューラルネットワークは、すべてのシナリオでより良い結果が得られることがわかった。
- 参考スコア(独自算出の注目度): 0.8796261172196743
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous driving is a challenging scenario for image segmentation due to the presence of uncontrolled environmental conditions and the eventually catastrophic consequences of failures. Previous work suggested that a biologically motivated computation, the so-called Divisive Normalization, could be useful to deal with image variability, but its effects have not been systematically studied over different data sources and environmental factors. Here we put segmentation U-nets augmented with Divisive Normalization to work far from training conditions to find where this adaptation is more critical. We categorize the scenes according to their radiance level and dynamic range (day/night), and according to their achromatic/chromatic contrasts. We also consider video game (synthetic) images to broaden the range of environments. We check the performance in the extreme percentiles of such categorization. Then, we push the limits further by artificially modifying the images in perceptually/environmentally relevant dimensions: luminance, contrasts and spectral radiance. Results show that neural networks with Divisive Normalization get better results in all the scenarios and their performance remains more stable with regard to the considered environmental factors and nature of the source. Finally, we explain the improvements in segmentation performance in two ways: (1) by quantifying the invariance of the responses that incorporate Divisive Normalization, and (2) by illustrating the adaptive nonlinearity of the different layers that depends on the local activity.
- Abstract(参考訳): 自律運転は、制御されていない環境条件の存在と、最終的には失敗の破滅的な結果によって、イメージセグメンテーションの難しいシナリオである。
これまでの研究では、生物学的に動機づけられた計算、いわゆるディビジョン正規化(Divisive Normalization)は、画像の可変性を扱うのに有用であるが、その効果は異なるデータソースや環境要因に対して体系的に研究されていないことが示唆された。
ここでは、Divisive Normalizationで強化されたセグメンテーションU-netをトレーニング条件から遠く離れたところで動作させ、この適応がより重要かを見つける。
シーンは、その放射レベルとダイナミックレンジ(昼夜)、および無彩色/彩色コントラストに基づいて分類する。
また、環境の範囲を広げるために、ビデオゲーム(合成)の画像も検討する。
このような分類の極端なパーセンタイルのパフォーマンスを確認します。
そして、その限界をさらに推し進めるために、知覚的/環境的に関係のある次元(輝度、コントラスト、スペクトル放射率)で画像を人工的に修正する。
その結果、ディバイシブ正規化を伴うニューラルネットワークは、すべてのシナリオにおいてより良い結果を得ることができ、その特性は、ソースの考慮された環境要因や性質に関して、より安定したままであることがわかった。
最後に,(1)分割正規化を含む応答の不変性を定量化し,(2)局所的な活動に依存する異なるレイヤの適応的非線形性を示すことによって,分割性能の向上を2つの方法で説明する。
関連論文リスト
- Distractors-Immune Representation Learning with Cross-modal Contrastive Regularization for Change Captioning [71.14084801851381]
変更キャプションは、類似した画像間のセマンティックな変化を簡潔に記述することを目的としている。
既存のほとんどの手法は、それらの違いを直接キャプチャし、エラーを起こしやすい特徴を得るリスクを負う。
本稿では,2つの画像表現の対応するチャネルを関連づけるイントラクタ免疫表現学習ネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T13:00:33Z) - Transparency Distortion Robustness for SOTA Image Segmentation Tasks [4.1119273264193685]
本研究では,空間的に異なる歪みを持つ既存のデータセットを合成的に拡張する手法を提案する。
実験により, これらの歪み効果は, 最先端セグメンテーションモデルの性能を低下させることが示された。
論文 参考訳(メタデータ) (2024-05-21T15:30:25Z) - Deep Intrinsic Decomposition with Adversarial Learning for Hyperspectral
Image Classification [9.051982753583232]
本研究は,超スペクトル画像分類のための逆学習,すなわちAdverDecomを用いた新しい内在的分解法を開発した。
異なる環境カテゴリーを識別するために識別ネットワークを構築する。
実験は3つの一般的な実世界のデータセット上で行われる。
論文 参考訳(メタデータ) (2023-10-28T00:41:25Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Causal Transportability for Visual Recognition [70.13627281087325]
画像とラベルの関連性は、設定間では転送できないため、標準分類器がフェールすることを示す。
次に、すべての共起源を摂食する因果効果が、ドメイン間で不変であることを示す。
これにより、画像分類における因果効果を推定するアルゴリズムを開発する動機付けとなる。
論文 参考訳(メタデータ) (2022-04-26T15:02:11Z) - Neural Networks with Divisive normalization for image segmentation with
application in cityscapes dataset [2.960890352853005]
現在のディープネットワークにおける分割正規化を含めることで、画像の非表現的変化に対してより不変となることを示す。
実験により、U-Netアーキテクチャに分割正規化を組み込むことで、従来のU-Netに対してより良いセグメンテーション結果が得られることが示された。
論文 参考訳(メタデータ) (2022-03-25T10:26:39Z) - Non-Homogeneous Haze Removal via Artificial Scene Prior and
Bidimensional Graph Reasoning [52.07698484363237]
本研究では,人工シーンの前置と2次元グラフ推論による不均質なヘイズ除去ネットワーク(nhrn)を提案する。
本手法は,単一画像デハジングタスクとハイザイ画像理解タスクの両方において,最先端アルゴリズムよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-04-05T13:04:44Z) - Discriminative Residual Analysis for Image Set Classification with
Posture and Age Variations [27.751472312581228]
識別残差分析(DRA)は分類性能を向上させるために提案される。
DRAは、残差表現を識別部分空間にキャストする強力な射影を得ようとする。
2つの正則化アプローチは、可能な小さなサンプルサイズ問題に対処するために使用される。
論文 参考訳(メタデータ) (2020-08-23T08:53:06Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z) - Phase Consistent Ecological Domain Adaptation [76.75730500201536]
意味的セグメンテーション(意味的セグメンテーション)の課題に焦点をあてる。そこでは、注釈付き合成データが多用されるが、実際のデータへのアノテートは困難である。
視覚心理学に触発された最初の基準は、2つの画像領域間の地図が位相保存であることである。
第2の基準は、照明剤や撮像センサーの特性に関わらず、その画像に現れる環境統計、またはシーン内の規則を活用することを目的としている。
論文 参考訳(メタデータ) (2020-04-10T06:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。