Fugu-MT 論文翻訳(概要): BTSeg: Barlow Twins Regularization for Domain Adaptation in Semantic Segmentation

論文の概要: BTSeg: Barlow Twins Regularization for Domain Adaptation in Semantic Segmentation

arxiv url: http://arxiv.org/abs/2308.16819v2
Date: Mon, 20 Nov 2023 12:34:56 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-23 04:51:56.714203
Title: BTSeg: Barlow Twins Regularization for Domain Adaptation in Semantic Segmentation
Title（参考訳）: BTSeg: セマンティックセグメンテーションにおけるドメイン適応のためのBarlow Twins正規化
Authors: Johannes K\"unzel, Anna Hilsmann, Peter Eisert
Abstract要約: セマンティックセグメンテーションモデルを強化した,革新的な半教師付きトレーニング手法であるBTSegを紹介する。提案手法では,同じ場所で撮影された画像について,同じシーンの多様体表現として,異なる悪条件下での撮影について検討する。 ACDCデータセットに対する我々のアプローチを評価し、現在の最先端手法と比較して好適に機能する。
参考スコア（独自算出の注目度）: 3.95944314850151
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Semantic image segmentation is particularly vital for the advancement of autonomous vehicle technologies. However, this domain faces substantial challenges under adverse conditions like rain or darkness, which remain underrepresented in most datasets. The generation of additional training data for these scenarios is not only costly but also fraught with potential inaccuracies, largely attributable to the aleatoric uncertainty inherent in such conditions. We introduce BTSeg, an innovative, semi-supervised training approach enhancing semantic segmentation models in order to effectively handle a range of adverse conditions without requiring the creation of extensive new datasets. BTSeg employs a novel application of the Barlow Twins loss, a concept borrowed from unsupervised learning. The original Barlow Twins approach uses stochastic augmentations in order to learn useful representations from unlabeled data without the need for external labels. In our approach, we regard images captured at identical locations but under varying adverse conditions as manifold representation of the same scene (which could be interpreted as "natural augmentations"), thereby enabling the model to conceptualize its understanding of the environment. We evaluate our approach on the ACDC dataset, where it performs favorably when compared to the current state-of-the-art methods, while also being simpler to implement and train. For the new challenging ACG benchmark it shows cutting-edge performance, demonstrating its robustness and generalization capabilities. We will make the code publicly available post-acceptance.
Abstract（参考訳）: セマンティックイメージセグメンテーションは、自動運転車技術の進歩に特に不可欠である。しかし、このドメインは雨や暗闇といった悪条件下では大きな課題に直面している。これらのシナリオのための追加のトレーニングデータの生成にはコストがかかるだけでなく、潜在的な不正確さも伴う。 btsegは,広範囲なデータセットの作成を必要とせず,さまざまな悪条件を効果的に処理するために意味セグメンテーションモデルを拡張する,革新的な半教師付きトレーニング手法である。 BTSegは、教師なし学習から借用された概念であるBarlow Twins Losの新たな応用を採用している。オリジナルのバーロウ双生児のアプローチは、外部ラベルを必要とせずにラベルのないデータから有用な表現を学ぶために確率的拡張を用いる。提案手法では,同一地点で撮影された映像を同一場面の多様体表現(「自然な増補」と解釈できる)と見なすことにより,環境の理解を概念化することができる。我々はACDCデータセットに対する我々のアプローチを評価し、現在の最先端手法と比較して好適に機能すると同時に、実装やトレーニングも簡単である。新しい挑戦的なACGベンチマークでは、最先端のパフォーマンスを示し、堅牢性と一般化能力を示している。受理後、コードを公開します。

関連論文リスト

No time to train! Training-Free Reference-Based Instance Segmentation [15.061599989448867]
本研究は,少数の参照画像のみを備える場合のオブジェクトセグメンテーションの課題について検討する。我々の重要な洞察は、ファンデーションモデルによって学習された強力なセマンティック・プライドを活用して、参照とターゲット画像の間の対応する領域を特定することである。対応によって、下流タスクのためのインスタンスレベルのセグメンテーションマスクの自動生成が可能になり、マルチステージのトレーニング不要な方法でアイデアをインスタンス化する。
論文参考訳（メタデータ） (2025-07-03T16:59:01Z)
Physically Feasible Semantic Segmentation [58.17907376475596]
最先端セマンティックセグメンテーションモデルは通常、データ駆動方式で最適化される。本手法は,空間的クラス関係を規定する明示的な物理的制約を抽出する。 PhyFeaは、使用する最先端ネットワーク毎にmIoUが大幅に向上する。
論文参考訳（メタデータ） (2024-08-26T22:39:08Z)
Progressive Feature Self-reinforcement for Weakly Supervised Semantic Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文参考訳（メタデータ） (2023-12-14T13:21:52Z)
Condition-Invariant Semantic Segmentation [77.10045325743644]
我々は現在最先端のドメイン適応アーキテクチャ上で条件不変セマンティック(CISS)を実装している。本手法は,通常の都市景観$to$ACDCベンチマークにおいて,2番目に高い性能を実現する。 CISSはBDD100K-nightやACDC-nightのようなトレーニング中に見えない領域によく一般化している。
論文参考訳（メタデータ） (2023-05-27T03:05:07Z)
FREDOM: Fairness Domain Adaptation Approach to Semantic Scene Understanding [27.05038930059941]
セマンティックシーンにおけるドメイン適応は近年著しく改善されている。フェアネスは、セグメンテーションモデルを人間関連の現実世界アプリケーションにデプロイする際の最も重要な側面の1つである。本稿では,FREDOM(Fairness Domain Adaptation)を用いたシーンセグメンテーション手法を提案する。
論文参考訳（メタデータ） (2023-04-04T21:35:10Z)
Contrastive Model Adaptation for Cross-Condition Robustness in Semantic Segmentation [58.17907376475596]
意味的セグメンテーションのための正規-逆条件モデル適応について検討する。提案手法は, コントラスト学習を通じて条件不変の特徴を学習するために, このような画像ペアを利用する。いくつかの正規-逆適応ベンチマークにおけるモデル適応のための最先端セマンティックセマンティックセマンティクス性能を実現する。
論文参考訳（メタデータ） (2023-03-09T11:48:29Z)
Consistency Regularization for Domain Adaptation [17.067348505083327]
教師なし領域適応(UDA)は、実際の画像にモデルを訓練し適応するために、よりアクセスしやすいデータをどのように利用できるかを研究することで、この問題を解決しようとする。近年のUDA法は,学生と教師のネットワークを用いた画素単位の分類損失の学習による自己学習を適用している。本稿では,ネットワークの出力要素間の画素間関係をモデル化し,半教師付きUDAに整合性正規化項を追加することを提案する。
論文参考訳（メタデータ） (2022-08-23T17:07:06Z)
Refign: Align and Refine for Adaptation of Semantic Segmentation to Adverse Conditions [78.71745819446176]
Refignは、ドメイン間の通信を利用する自己学習ベースのUDAメソッドへの汎用的な拡張である。 Refign は,(1) 不確実性を認識した高密度マッチングネットワークを用いて,正常条件画像と対応する悪条件画像とを整列させ,(2) 適応ラベル補正機構を用いて正常予測で悪条件予測を精査する。このアプローチでは、追加のトレーニングパラメータや、トレーニングのみの計算オーバーヘッドの最小化は導入されず、任意の自己学習ベースのUDAメソッドを改善するためにドロップイン拡張として使用することができる。
論文参考訳（メタデータ） (2022-07-14T11:30:38Z)
Transfer beyond the Field of View: Dense Panoramic Semantic Segmentation via Unsupervised Domain Adaptation [30.104947024614127]
パノラマ的セマンティックセグメンテーションのための教師なしドメイン適応のタスクを形式化する。 DensePASSはドメイン横断条件下でのパノラマセグメンテーションのための新しいデータセットである。 P2PDAはPinhole-to-Panoramicセマンティックセグメンテーションのための汎用フレームワークである。
論文参考訳（メタデータ） (2021-10-21T11:22:05Z)
Self-supervised Augmentation Consistency for Adapting Semantic Segmentation [56.91850268635183]
本稿では,実用的かつ高精度な意味セグメンテーションのためのドメイン適応手法を提案する。私たちは標準データ拡張技術である$-$フォトメトリックノイズ、フリップとスケーリング$-$を採用し、セマンティック予測の一貫性を保証する。適応後の最先端セグメンテーション精度を大幅に改善し、バックボーンアーキテクチャと適応シナリオの異なる選択に整合性を持たせる。
論文参考訳（メタデータ） (2021-04-30T21:32:40Z)
Transferring and Regularizing Prediction for Semantic Segmentation [115.88957139226966]
本稿では,セマンティックセグメンテーションの本質的特性を利用して,モデル伝達におけるそのような問題を緩和する。本稿では,モデル転送を教師なし方式で正規化するための制約として固有特性を課す予測伝達の正規化器(RPT)を提案する。 GTA5とSynTHIA(synthetic data)で訓練されたモデルの都市景観データセット(アーバンストリートシーン)への転送に関するRTPの提案を検証するため、大規模な実験を行った。
論文参考訳（メタデータ） (2020-06-11T16:19:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。