論文の概要: Transferring Styles for Reduced Texture Bias and Improved Robustness in Semantic Segmentation Networks
- arxiv url: http://arxiv.org/abs/2507.10239v1
- Date: Mon, 14 Jul 2025 13:02:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:24.960066
- Title: Transferring Styles for Reduced Texture Bias and Improved Robustness in Semantic Segmentation Networks
- Title(参考訳): セマンティックセグメンテーションネットワークにおけるテクスチャバイアス低減のための転送スタイルとロバスト性の改善
- Authors: Ben Hamscher, Edgar Heinert, Annika Mütze, Kira Maag, Matthias Rottmann,
- Abstract要約: 最近の研究では、画像分類におけるディープニューラルネットワーク(DNN)の形状とテクスチャバイアスについて研究している。
本研究では, 画像分類におけるテクスチャバイアスを低減し, 画像劣化に対するロバスト性を向上することを示す。
本研究では, セマンティックセグメンテーションにおいて, テクスチャの偏りを低減し, 画像の汚損や敵の攻撃に対して強固に頑健さを増すことを示した。
- 参考スコア(独自算出の注目度): 4.2875024530011085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent research has investigated the shape and texture biases of deep neural networks (DNNs) in image classification which influence their generalization capabilities and robustness. It has been shown that, in comparison to regular DNN training, training with stylized images reduces texture biases in image classification and improves robustness with respect to image corruptions. In an effort to advance this line of research, we examine whether style transfer can likewise deliver these two effects in semantic segmentation. To this end, we perform style transfer with style varying across artificial image areas. Those random areas are formed by a chosen number of Voronoi cells. The resulting style-transferred data is then used to train semantic segmentation DNNs with the objective of reducing their dependence on texture cues while enhancing their reliance on shape-based features. In our experiments, it turns out that in semantic segmentation, style transfer augmentation reduces texture bias and strongly increases robustness with respect to common image corruptions as well as adversarial attacks. These observations hold for convolutional neural networks and transformer architectures on the Cityscapes dataset as well as on PASCAL Context, showing the generality of the proposed method.
- Abstract(参考訳): 最近の研究では、その一般化能力と堅牢性に影響を与える画像分類におけるディープニューラルネットワーク(DNN)の形状とテクスチャバイアスについて研究している。
画像分類におけるテクスチャバイアスを低減し,画像劣化に対するロバスト性を向上させることが,通常のDNNトレーニングと比較して示されている。
本研究の進め方として,スタイル伝達がセマンティックセグメンテーションにおけるこれらの2つの効果を同様にもたらすことができるかどうかを検討する。
この目的のために、我々は、人工画像領域で異なるスタイルでスタイル転送を行う。
これらのランダム領域は、選択された多数のボロノイ細胞によって形成される。
得られたスタイル変換データは、テクスチャキューへの依存を減らすとともに、形状に基づく特徴への依存を高めることを目的として、セマンティックセグメンテーションDNNのトレーニングに使用される。
本研究では, セマンティックセグメンテーションにおいて, テクスチャの偏りを低減し, 画像の汚損や敵の攻撃に対して強固に頑健さを増すことを示した。
これらの観測は、Cityscapesデータセット上の畳み込みニューラルネットワークとトランスフォーマーアーキテクチャ、およびPASCALコンテキストに保持され、提案手法の汎用性を示している。
関連論文リスト
- Unwarping Screen Content Images via Structure-texture Enhancement Network and Transformation Self-estimation [2.404130767806698]
画面コンテンツ画像(SCI)に対する変換自己推定を用いた構造テクスチャ拡張ネットワーク(STEN)を提案する。
STENはB-スプラインの暗黙的ニューラル表現モジュールと変換誤差推定と自己補正アルゴリズムを統合している。
パブリックなSCIデータセットの実験は、我々のアプローチが最先端の手法を大きく上回っていることを示している。
論文 参考訳(メタデータ) (2025-04-21T13:59:44Z) - Classification and regression of trajectories rendered as images via 2D Convolutional Neural Networks [0.0]
コンピュータビジョンの最近の進歩は、2次元畳み込み層(CNN)を持つ人工ニューラルネットワークによる画像として表現された軌跡の処理を容易にしている。
本研究では,CNNを用いた合成軌道の分類と回帰問題の解法について検討した。
その結果,移動方向が重要となるアプリケーションにおいて,モデル深度や動作履歴に応じて適切な画像解像度を選択することの重要性を強調した。
論文 参考訳(メタデータ) (2024-09-27T15:27:04Z) - Reducing Texture Bias of Deep Neural Networks via Edge Enhancing Diffusion [4.599829659954009]
セマンティックセグメンテーションにおけるCNNのテクスチャバイアスについて検討する。
我々は、テクスチャバイアスを減らすために、テクスチャの少ない前処理画像にCNNを訓練する。
我々はCNNの強いテクスチャ依存性と変換器の適度なテクスチャ依存性を観察する。
論文 参考訳(メタデータ) (2024-02-14T19:10:40Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Segmentation of Roads in Satellite Images using specially modified U-Net
CNNs [0.0]
本研究の目的は,道路画像の特定を行う都市景観の衛星画像の分類器を構築することである。
従来のコンピュータビジョンアルゴリズムとは異なり、畳み込みニューラルネットワーク(CNN)はこのタスクに対して正確で信頼性の高い結果を提供する。
論文 参考訳(メタデータ) (2021-09-29T19:08:32Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z) - Does enhanced shape bias improve neural network robustness to common
corruptions? [14.607217936005817]
最近の研究は、ImageNetで訓練されたCNNがテクスチャをエンコードする機能に偏っていることを示している。
異なる画像スタイルでトレーニングデータを増強すると、このテクスチャバイアスが減少し、形状バイアスが増加することが示されている。
自然画像や明示的なエッジ情報,スタイライゼーションに基づいて,入力を構成するさまざまな方法に関する体系的な研究を行う。
論文 参考訳(メタデータ) (2021-04-20T07:06:53Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z) - Transferring and Regularizing Prediction for Semantic Segmentation [115.88957139226966]
本稿では,セマンティックセグメンテーションの本質的特性を利用して,モデル伝達におけるそのような問題を緩和する。
本稿では,モデル転送を教師なし方式で正規化するための制約として固有特性を課す予測伝達の正規化器(RPT)を提案する。
GTA5とSynTHIA(synthetic data)で訓練されたモデルの都市景観データセット(アーバンストリートシーン)への転送に関するRTPの提案を検証するため、大規模な実験を行った。
論文 参考訳(メタデータ) (2020-06-11T16:19:41Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。