論文の概要: BTSeg: Barlow Twins Regularization for Domain Adaptation in Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2308.16819v2
- Date: Mon, 20 Nov 2023 12:34:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 04:51:56.714203
- Title: BTSeg: Barlow Twins Regularization for Domain Adaptation in Semantic
Segmentation
- Title(参考訳): BTSeg: セマンティックセグメンテーションにおけるドメイン適応のためのBarlow Twins正規化
- Authors: Johannes K\"unzel, Anna Hilsmann, Peter Eisert
- Abstract要約: セマンティックセグメンテーションモデルを強化した,革新的な半教師付きトレーニング手法であるBTSegを紹介する。
提案手法では,同じ場所で撮影された画像について,同じシーンの多様体表現として,異なる悪条件下での撮影について検討する。
ACDCデータセットに対する我々のアプローチを評価し、現在の最先端手法と比較して好適に機能する。
- 参考スコア(独自算出の注目度): 3.95944314850151
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic image segmentation is particularly vital for the advancement of
autonomous vehicle technologies. However, this domain faces substantial
challenges under adverse conditions like rain or darkness, which remain
underrepresented in most datasets. The generation of additional training data
for these scenarios is not only costly but also fraught with potential
inaccuracies, largely attributable to the aleatoric uncertainty inherent in
such conditions.
We introduce BTSeg, an innovative, semi-supervised training approach
enhancing semantic segmentation models in order to effectively handle a range
of adverse conditions without requiring the creation of extensive new datasets.
BTSeg employs a novel application of the Barlow Twins loss, a concept borrowed
from unsupervised learning. The original Barlow Twins approach uses stochastic
augmentations in order to learn useful representations from unlabeled data
without the need for external labels. In our approach, we regard images
captured at identical locations but under varying adverse conditions as
manifold representation of the same scene (which could be interpreted as
"natural augmentations"), thereby enabling the model to conceptualize its
understanding of the environment.
We evaluate our approach on the ACDC dataset, where it performs favorably
when compared to the current state-of-the-art methods, while also being simpler
to implement and train. For the new challenging ACG benchmark it shows
cutting-edge performance, demonstrating its robustness and generalization
capabilities. We will make the code publicly available post-acceptance.
- Abstract(参考訳): セマンティックイメージセグメンテーションは、自動運転車技術の進歩に特に不可欠である。
しかし、このドメインは雨や暗闇といった悪条件下では大きな課題に直面している。
これらのシナリオのための追加のトレーニングデータの生成にはコストがかかるだけでなく、潜在的な不正確さも伴う。
btsegは,広範囲なデータセットの作成を必要とせず,さまざまな悪条件を効果的に処理するために意味セグメンテーションモデルを拡張する,革新的な半教師付きトレーニング手法である。
BTSegは、教師なし学習から借用された概念であるBarlow Twins Losの新たな応用を採用している。
オリジナルのバーロウ双生児のアプローチは、外部ラベルを必要とせずにラベルのないデータから有用な表現を学ぶために確率的拡張を用いる。
提案手法では,同一地点で撮影された映像を同一場面の多様体表現(「自然な増補」と解釈できる)と見なすことにより,環境の理解を概念化することができる。
我々はACDCデータセットに対する我々のアプローチを評価し、現在の最先端手法と比較して好適に機能すると同時に、実装やトレーニングも簡単である。
新しい挑戦的なACGベンチマークでは、最先端のパフォーマンスを示し、堅牢性と一般化能力を示している。
受理後、コードを公開します。
関連論文リスト
- Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - Semi-supervised Semantic Segmentation with Directional Context-aware
Consistency [66.49995436833667]
我々は、ラベル付きデータの小さなセットに、全くラベル付けされていない画像のより大きなコレクションを提供する半教師付きセグメンテーション問題に焦点をあてる。
好ましいハイレベル表現は、自己認識を失わずにコンテキスト情報をキャプチャするべきである。
我々は,DCロス(Directional Contrastive Loss)を画素対ピクセルの整合性を達成するために提示する。
論文 参考訳(メタデータ) (2021-06-27T03:42:40Z) - Weakly supervised segmentation with cross-modality equivariant
constraints [7.757293476741071]
弱い教師付き学習は、セマンティックセグメンテーションにおける大きなラベル付きデータセットの必要性を軽減するための魅力的な代替手段として登場した。
本稿では,マルチモーダル画像シナリオにおける自己スーパービジョンを活用した新しい学習戦略を提案する。
私たちのアプローチは、同じ学習条件下で関連する最近の文学を上回ります。
論文 参考訳(メタデータ) (2021-04-06T13:14:20Z) - An Efficient Method for the Classification of Croplands in Scarce-Label
Regions [0.0]
衛星時系列画像による農地分類の主な課題は、地表面データ不足と、未開発地域における高品質のハイパースペクトル画像の到達不能である。
ラベルなしの中解像度衛星画像は豊富だが、その恩恵を受けるにはオープンな問題だ。
自監督タスクを用いた作物分類におけるその可能性の活用方法を示す。
論文 参考訳(メタデータ) (2021-03-17T12:10:11Z) - Transferring and Regularizing Prediction for Semantic Segmentation [115.88957139226966]
本稿では,セマンティックセグメンテーションの本質的特性を利用して,モデル伝達におけるそのような問題を緩和する。
本稿では,モデル転送を教師なし方式で正規化するための制約として固有特性を課す予測伝達の正規化器(RPT)を提案する。
GTA5とSynTHIA(synthetic data)で訓練されたモデルの都市景観データセット(アーバンストリートシーン)への転送に関するRTPの提案を検証するため、大規模な実験を行った。
論文 参考訳(メタデータ) (2020-06-11T16:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。