論文の概要: Unsupervised Foggy Scene Understanding via Self Spatial-Temporal Label
Diffusion
- arxiv url: http://arxiv.org/abs/2206.04879v1
- Date: Fri, 10 Jun 2022 05:16:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-13 15:09:27.410602
- Title: Unsupervised Foggy Scene Understanding via Self Spatial-Temporal Label
Diffusion
- Title(参考訳): 自己空間-時間ラベル拡散による非教師なし霧場面理解
- Authors: Liang Liao, Wenyi Chen, Jing Xiao, Zheng Wang, Chia-Wen Lin, Shin'ichi
Satoh
- Abstract要約: 運転シーンの霧画像列の特徴を利用して、自信ある擬似ラベルを密度化する。
局所的な空間的類似性と逐次画像データの隣接時間対応の2つの発見に基づいて,新たなターゲット・ドメイン駆動擬似ラベル拡散方式を提案する。
本手法は,2つの天然霧のデータセット上で51.92%,53.84%の平均交叉結合(mIoU)を達成するのに有効である。
- 参考スコア(独自算出の注目度): 51.11295961195151
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding foggy image sequence in the driving scenes is critical for
autonomous driving, but it remains a challenging task due to the difficulty in
collecting and annotating real-world images of adverse weather. Recently, the
self-training strategy has been considered a powerful solution for unsupervised
domain adaptation, which iteratively adapts the model from the source domain to
the target domain by generating target pseudo labels and re-training the model.
However, the selection of confident pseudo labels inevitably suffers from the
conflict between sparsity and accuracy, both of which will lead to suboptimal
models. To tackle this problem, we exploit the characteristics of the foggy
image sequence of driving scenes to densify the confident pseudo labels.
Specifically, based on the two discoveries of local spatial similarity and
adjacent temporal correspondence of the sequential image data, we propose a
novel Target-Domain driven pseudo label Diffusion (TDo-Dif) scheme. It employs
superpixels and optical flows to identify the spatial similarity and temporal
correspondence, respectively and then diffuses the confident but sparse pseudo
labels within a superpixel or a temporal corresponding pair linked by the flow.
Moreover, to ensure the feature similarity of the diffused pixels, we introduce
local spatial similarity loss and temporal contrastive loss in the model
re-training stage. Experimental results show that our TDo-Dif scheme helps the
adaptive model achieve 51.92% and 53.84% mean intersection-over-union (mIoU) on
two publicly available natural foggy datasets (Foggy Zurich and Foggy Driving),
which exceeds the state-of-the-art unsupervised domain adaptive semantic
segmentation methods. Models and data can be found at
https://github.com/velor2012/TDo-Dif.
- Abstract(参考訳): 運転シーンの霧画像のシーケンスを理解することは自動運転には不可欠だが、悪天候の実際の画像の収集と注釈が難しいため、依然として難しい課題である。
近年、自己学習戦略は、対象の擬似ラベルを生成してモデルを再訓練することで、ソースドメインからターゲットドメインへ反復的にモデルを適用する、教師なしドメイン適応の強力なソリューションとみなされている。
しかし、自信のある疑似ラベルの選択は、必然的にスパーシティと精度の衝突に苦しみ、どちらも最適でないモデルに繋がる。
この問題に対処するために,運転シーンの霧画像シーケンスの特徴を利用して,自信のある擬似ラベルを識別する。
具体的には,シーケンシャル画像データの局所的空間的類似性と隣接した時間的対応の2つの発見に基づき,新たなターゲット領域駆動擬似ラベル拡散(tdo-dif)方式を提案する。
スーパーピクセルとオプティカルフローを使用して、それぞれ空間的類似性と時間的対応を識別し、フローによってリンクされたスーパーピクセルまたは時間的対応ペア内に、自信あるがスパースな擬似ラベルを拡散させる。
さらに,拡散画素の特徴的類似性を確保するために,局所的な空間的類似性損失と時間的対比損失を導入する。
実験の結果、tdo-difスキームは、最先端の非教師なしドメイン適応意味セグメンテーション法を超える2つの自然フォギーデータセット(フォギーチューリッヒとフォギー駆動)において、51.92%と53.84%の平均交点オーバー結合(miou)を達成するのに役立つことがわかった。
モデルとデータはhttps://github.com/velor2012/TDo-Difで見ることができる。
関連論文リスト
- Homography Guided Temporal Fusion for Road Line and Marking Segmentation [73.47092021519245]
道路線やマーキングは、移動車両、影、グレアの存在下でしばしば閉鎖される。
本稿では,映像フレームを補足的に利用するHomography Guided Fusion (HomoFusion) モジュールを提案する。
カメラ固有のデータと地上平面の仮定をクロスフレーム対応に利用することにより,高速・高精度性能が向上した軽量ネットワークの実現が期待できることを示す。
論文 参考訳(メタデータ) (2024-04-11T10:26:40Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Transmission-Guided Bayesian Generative Model for Smoke Segmentation [29.74065829663554]
深層ニューラルネットワークは、その非厳密な形状と透明な外観のために、煙分断を過信する傾向にある。
これは、正確な煙分別のための限られた訓練データによる知識レベルの不確かさと、地味のラベル付けの難しさを表すラベル付けレベルの不確実性の両方によって引き起こされる。
本稿では,モデルパラメータの後方分布とその予測を同時に推定するベイズ生成モデルを提案する。
また,1,400個の実画像と4,000個の合成画像からなる高品質な煙分画データセットSMOKE5Kを画素単位のアノテーションで提供した。
論文 参考訳(メタデータ) (2023-03-02T01:48:05Z) - QuadFormer: Quadruple Transformer for Unsupervised Domain Adaptation in
Power Line Segmentation of Aerial Images [12.840195641761323]
ドメイン適応型セマンティックセグメンテーションのための新しいフレームワークを提案する。
階層的な四重変圧器は、伝達可能なコンテキストに適応するために、クロスアテンションと自己アテンションのメカニズムを組み合わせる。
ARPLSynとARPLRealの2つのデータセットを提示し、教師なし領域適応電力線分割の研究をさらに進める。
論文 参考訳(メタデータ) (2022-11-29T03:15:27Z) - Domain Adaptive Object Detection for Autonomous Driving under Foggy
Weather [25.964194141706923]
本稿では,霧気候下での自律走行のための新しい領域適応型物体検出フレームワークを提案する。
本手法は画像レベルの適応とオブジェクトレベルの適応を両立させ,画像スタイルとオブジェクトの外観における領域差を低減させる。
評価実験の結果,提案手法の有効性と精度が示された。
論文 参考訳(メタデータ) (2022-10-27T05:09:10Z) - Source-Free Domain Adaptive Fundus Image Segmentation with Denoised
Pseudo-Labeling [56.98020855107174]
ドメイン適応は通常、ソースドメインデータにアクセスして、ターゲットデータとのドメインアライメントのために配布情報を利用する必要があります。
多くの実世界のシナリオでは、プライバシの問題により、ターゲットドメインのモデル適応中にソースデータがアクセスできない場合がある。
本稿では,本問題に対する新たな擬似ラベル付け手法を提案する。
論文 参考訳(メタデータ) (2021-09-19T06:38:21Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Synthetic-to-Real Domain Adaptation for Lane Detection [5.811502603310248]
我々は、ラベルなしまたは部分的にラベル付けされたターゲットドメインデータとともに、豊富でランダムに生成された合成データからの学習を探索する。
これは、非現実的な合成領域で学んだモデルを実画像に適応させることの難しさを浮き彫りにする。
対象のドメインデータに適応するために、特定の画像と一致しない合成ラベルを用いる、新しいオートエンコーダベースのアプローチを開発する。
論文 参考訳(メタデータ) (2020-07-08T10:54:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。