論文の概要: BTSeg: Barlow Twins Regularization for Domain Adaptation in Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2308.16819v2
- Date: Mon, 20 Nov 2023 12:34:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 04:51:56.714203
- Title: BTSeg: Barlow Twins Regularization for Domain Adaptation in Semantic
Segmentation
- Title(参考訳): BTSeg: セマンティックセグメンテーションにおけるドメイン適応のためのBarlow Twins正規化
- Authors: Johannes K\"unzel, Anna Hilsmann, Peter Eisert
- Abstract要約: セマンティックセグメンテーションモデルを強化した,革新的な半教師付きトレーニング手法であるBTSegを紹介する。
提案手法では,同じ場所で撮影された画像について,同じシーンの多様体表現として,異なる悪条件下での撮影について検討する。
ACDCデータセットに対する我々のアプローチを評価し、現在の最先端手法と比較して好適に機能する。
- 参考スコア(独自算出の注目度): 3.95944314850151
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic image segmentation is particularly vital for the advancement of
autonomous vehicle technologies. However, this domain faces substantial
challenges under adverse conditions like rain or darkness, which remain
underrepresented in most datasets. The generation of additional training data
for these scenarios is not only costly but also fraught with potential
inaccuracies, largely attributable to the aleatoric uncertainty inherent in
such conditions.
We introduce BTSeg, an innovative, semi-supervised training approach
enhancing semantic segmentation models in order to effectively handle a range
of adverse conditions without requiring the creation of extensive new datasets.
BTSeg employs a novel application of the Barlow Twins loss, a concept borrowed
from unsupervised learning. The original Barlow Twins approach uses stochastic
augmentations in order to learn useful representations from unlabeled data
without the need for external labels. In our approach, we regard images
captured at identical locations but under varying adverse conditions as
manifold representation of the same scene (which could be interpreted as
"natural augmentations"), thereby enabling the model to conceptualize its
understanding of the environment.
We evaluate our approach on the ACDC dataset, where it performs favorably
when compared to the current state-of-the-art methods, while also being simpler
to implement and train. For the new challenging ACG benchmark it shows
cutting-edge performance, demonstrating its robustness and generalization
capabilities. We will make the code publicly available post-acceptance.
- Abstract(参考訳): セマンティックイメージセグメンテーションは、自動運転車技術の進歩に特に不可欠である。
しかし、このドメインは雨や暗闇といった悪条件下では大きな課題に直面している。
これらのシナリオのための追加のトレーニングデータの生成にはコストがかかるだけでなく、潜在的な不正確さも伴う。
btsegは,広範囲なデータセットの作成を必要とせず,さまざまな悪条件を効果的に処理するために意味セグメンテーションモデルを拡張する,革新的な半教師付きトレーニング手法である。
BTSegは、教師なし学習から借用された概念であるBarlow Twins Losの新たな応用を採用している。
オリジナルのバーロウ双生児のアプローチは、外部ラベルを必要とせずにラベルのないデータから有用な表現を学ぶために確率的拡張を用いる。
提案手法では,同一地点で撮影された映像を同一場面の多様体表現(「自然な増補」と解釈できる)と見なすことにより,環境の理解を概念化することができる。
我々はACDCデータセットに対する我々のアプローチを評価し、現在の最先端手法と比較して好適に機能すると同時に、実装やトレーニングも簡単である。
新しい挑戦的なACGベンチマークでは、最先端のパフォーマンスを示し、堅牢性と一般化能力を示している。
受理後、コードを公開します。
関連論文リスト
- Physically Feasible Semantic Segmentation [58.17907376475596]
最先端セマンティックセグメンテーションモデルは通常、データ駆動方式で最適化される。
本手法は,空間的クラス関係を規定する明示的な物理的制約を抽出する。
PhyFeaは、使用する最先端ネットワーク毎にmIoUが大幅に向上する。
論文 参考訳(メタデータ) (2024-08-26T22:39:08Z) - Condition-Invariant Semantic Segmentation [77.10045325743644]
我々は現在最先端のドメイン適応アーキテクチャ上で条件不変セマンティック(CISS)を実装している。
本手法は,通常の都市景観$to$ACDCベンチマークにおいて,2番目に高い性能を実現する。
CISSはBDD100K-nightやACDC-nightのようなトレーニング中に見えない領域によく一般化している。
論文 参考訳(メタデータ) (2023-05-27T03:05:07Z) - FREDOM: Fairness Domain Adaptation Approach to Semantic Scene
Understanding [27.05038930059941]
セマンティックシーンにおけるドメイン適応は近年著しく改善されている。
フェアネスは、セグメンテーションモデルを人間関連の現実世界アプリケーションにデプロイする際の最も重要な側面の1つである。
本稿では,FREDOM(Fairness Domain Adaptation)を用いたシーンセグメンテーション手法を提案する。
論文 参考訳(メタデータ) (2023-04-04T21:35:10Z) - Contrastive Model Adaptation for Cross-Condition Robustness in Semantic
Segmentation [58.17907376475596]
意味的セグメンテーションのための正規-逆条件モデル適応について検討する。
提案手法は, コントラスト学習を通じて条件不変の特徴を学習するために, このような画像ペアを利用する。
いくつかの正規-逆適応ベンチマークにおけるモデル適応のための最先端セマンティックセマンティックセマンティクス性能を実現する。
論文 参考訳(メタデータ) (2023-03-09T11:48:29Z) - Consistency Regularization for Domain Adaptation [17.067348505083327]
教師なし領域適応(UDA)は、実際の画像にモデルを訓練し適応するために、よりアクセスしやすいデータをどのように利用できるかを研究することで、この問題を解決しようとする。
近年のUDA法は,学生と教師のネットワークを用いた画素単位の分類損失の学習による自己学習を適用している。
本稿では,ネットワークの出力要素間の画素間関係をモデル化し,半教師付きUDAに整合性正規化項を追加することを提案する。
論文 参考訳(メタデータ) (2022-08-23T17:07:06Z) - Refign: Align and Refine for Adaptation of Semantic Segmentation to
Adverse Conditions [78.71745819446176]
Refignは、ドメイン間の通信を利用する自己学習ベースのUDAメソッドへの汎用的な拡張である。
Refign は,(1) 不確実性を認識した高密度マッチングネットワークを用いて,正常条件画像と対応する悪条件画像とを整列させ,(2) 適応ラベル補正機構を用いて正常予測で悪条件予測を精査する。
このアプローチでは、追加のトレーニングパラメータや、トレーニングのみの計算オーバーヘッドの最小化は導入されず、任意の自己学習ベースのUDAメソッドを改善するためにドロップイン拡張として使用することができる。
論文 参考訳(メタデータ) (2022-07-14T11:30:38Z) - Transfer beyond the Field of View: Dense Panoramic Semantic Segmentation
via Unsupervised Domain Adaptation [30.104947024614127]
パノラマ的セマンティックセグメンテーションのための教師なしドメイン適応のタスクを形式化する。
DensePASSはドメイン横断条件下でのパノラマセグメンテーションのための新しいデータセットである。
P2PDAはPinhole-to-Panoramicセマンティックセグメンテーションのための汎用フレームワークである。
論文 参考訳(メタデータ) (2021-10-21T11:22:05Z) - Self-supervised Augmentation Consistency for Adapting Semantic
Segmentation [56.91850268635183]
本稿では,実用的かつ高精度な意味セグメンテーションのためのドメイン適応手法を提案する。
私たちは標準データ拡張技術である$-$フォトメトリックノイズ、フリップとスケーリング$-$を採用し、セマンティック予測の一貫性を保証する。
適応後の最先端セグメンテーション精度を大幅に改善し、バックボーンアーキテクチャと適応シナリオの異なる選択に整合性を持たせる。
論文 参考訳(メタデータ) (2021-04-30T21:32:40Z) - Transferring and Regularizing Prediction for Semantic Segmentation [115.88957139226966]
本稿では,セマンティックセグメンテーションの本質的特性を利用して,モデル伝達におけるそのような問題を緩和する。
本稿では,モデル転送を教師なし方式で正規化するための制約として固有特性を課す予測伝達の正規化器(RPT)を提案する。
GTA5とSynTHIA(synthetic data)で訓練されたモデルの都市景観データセット(アーバンストリートシーン)への転送に関するRTPの提案を検証するため、大規模な実験を行った。
論文 参考訳(メタデータ) (2020-06-11T16:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。