論文の概要: Domain Adaptive and Generalizable Network Architectures and Training
Strategies for Semantic Image Segmentation
- arxiv url: http://arxiv.org/abs/2304.13615v2
- Date: Tue, 26 Sep 2023 21:26:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-28 19:31:11.331097
- Title: Domain Adaptive and Generalizable Network Architectures and Training
Strategies for Semantic Image Segmentation
- Title(参考訳): ドメイン適応型および一般化可能なネットワークアーキテクチャとセマンティックイメージセグメンテーションのためのトレーニング戦略
- Authors: Lukas Hoyer, Dengxin Dai, Luc Van Gool
- Abstract要約: 教師なしドメイン適応(UDA)とドメイン一般化(DG)により、ソースドメインでトレーニングされた機械学習モデルは、ラベルなしまたは目に見えないターゲットドメインでうまく機能する。
UDA&DGのマルチレゾリューション・フレームワークであるHRDAを提案する。このフレームワークは、細かなセグメンテーションの詳細を保存するための小さな高分解能作物の強度と、学習されたスケールの注意を伴って長距離のコンテキスト依存を捕捉する大規模な低分解能作物の強度を組み合わせたものである。
- 参考スコア(独自算出の注目度): 108.33885637197614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised domain adaptation (UDA) and domain generalization (DG) enable
machine learning models trained on a source domain to perform well on unlabeled
or even unseen target domains. As previous UDA&DG semantic segmentation methods
are mostly based on outdated networks, we benchmark more recent architectures,
reveal the potential of Transformers, and design the DAFormer network tailored
for UDA&DG. It is enabled by three training strategies to avoid overfitting to
the source domain: While (1) Rare Class Sampling mitigates the bias toward
common source domain classes, (2) a Thing-Class ImageNet Feature Distance and
(3) a learning rate warmup promote feature transfer from ImageNet pretraining.
As UDA&DG are usually GPU memory intensive, most previous methods downscale or
crop images. However, low-resolution predictions often fail to preserve fine
details while models trained with cropped images fall short in capturing
long-range, domain-robust context information. Therefore, we propose HRDA, a
multi-resolution framework for UDA&DG, that combines the strengths of small
high-resolution crops to preserve fine segmentation details and large
low-resolution crops to capture long-range context dependencies with a learned
scale attention. DAFormer and HRDA significantly improve the state-of-the-art
UDA&DG by more than 10 mIoU on 5 different benchmarks. The implementation is
available at https://github.com/lhoyer/HRDA.
- Abstract(参考訳): 教師なしドメイン適応(UDA)とドメイン一般化(DG)により、ソースドメインでトレーニングされた機械学習モデルが、ラベルなしまたは目に見えないターゲットドメインでもうまく機能する。
従来のUDA&DGセマンティックセマンティックセグメンテーションは,主に時代遅れのネットワークに基づいているため,より最近のアーキテクチャをベンチマークし,トランスフォーマーの可能性を明らかにし,UDA&DGに適したDAFormerネットワークを設計する。
1) 希少なクラスサンプリングは共通のソースドメインクラスに対するバイアスを軽減するが、(2) Thing-Class ImageNet Feature Distance と(3) 学習率ウォームアップは ImageNet Pretraining からのフィーチャ転送を促進する。
UDA&DGは通常GPUメモリに集約されているため、これまでのほとんどのメソッドはダウンスケールまたはクロップイメージである。
しかしながら、低解像度の予測は細部を保存できないことが多いが、刈り取られた画像で訓練されたモデルは、長距離のドメインローバストなコンテキスト情報を取得するのに不足している。
そこで我々は,UDA&DGのマルチレゾリューション・フレームワークであるHRDAを提案し,細かなセグメンテーションの詳細と大きな低レゾリューションの作物の強度を組み合わせ,長期の文脈依存性を学習規模で把握する。
DAFormerとHRDAは、5つのベンチマークで10mIoU以上で最先端のUDA&DGを大幅に改善した。
実装はhttps://github.com/lhoyer/hrdaで利用可能である。
関連論文リスト
- Grounding Stylistic Domain Generalization with Quantitative Domain Shift Measures and Synthetic Scene Images [63.58800688320182]
ドメインの一般化は機械学習において難しい課題である。
現在の方法論は、スタイリスティック領域におけるシフトに関する定量的な理解を欠いている。
これらのリスクに対処する新しいDGパラダイムを導入する。
論文 参考訳(メタデータ) (2024-05-24T22:13:31Z) - CMDA: Cross-Modal and Domain Adversarial Adaptation for LiDAR-Based 3D
Object Detection [14.063365469339812]
LiDARベースの3Dオブジェクト検出法は、ソース(またはトレーニング)データ配布の外部のターゲットドメインにうまく一般化しないことが多い。
画像のモダリティから視覚的セマンティックキューを活用する,CMDA (unsupervised domain adaptation) と呼ばれる新しい手法を提案する。
また、自己学習に基づく学習戦略を導入し、モデルが逆向きに訓練され、ドメイン不変の機能を生成する。
論文 参考訳(メタデータ) (2024-03-06T14:12:38Z) - DG-TTA: Out-of-domain medical image segmentation through Domain Generalization and Test-Time Adaptation [43.842694540544194]
本稿では、ドメインの一般化とテスト時間適応を組み合わせることで、未確認対象領域で事前学習したモデルを再利用するための非常に効果的なアプローチを提案する。
本手法は,事前訓練した全身CTモデルと組み合わせることで,MR画像を高精度に分割できることを実証する。
論文 参考訳(メタデータ) (2023-12-11T10:26:21Z) - BEV-DG: Cross-Modal Learning under Bird's-Eye View for Domain
Generalization of 3D Semantic Segmentation [59.99683295806698]
クロスモーダルなUnsupervised Domain Adaptation (UDA)は、新しいドメインにおけるアノテーションの欠如を克服するために、2D-3Dデータの相補性を活用することを目的としている。
本稿では,BEV-DGと呼ばれる3次元セマンティックセグメンテーションの領域一般化(DG)に対する鳥眼図に基づくクロスモーダル学習を提案する。
論文 参考訳(メタデータ) (2023-08-12T11:09:17Z) - CNN Feature Map Augmentation for Single-Source Domain Generalization [6.053629733936548]
ドメイン・ジェネリゼーション(DG)はここ数年で大きな注目を集めている。
DGの目標は、トレーニング中に利用可能なものと異なるデータ分散を提示した場合、引き続き正常に機能するモデルを作成することだ。
単一ソースDG画像分類設定における畳み込みニューラルネットワークアーキテクチャの代替正則化手法を提案する。
論文 参考訳(メタデータ) (2023-05-26T08:48:17Z) - HRDA: Context-Aware High-Resolution Domain-Adaptive Semantic
Segmentation [104.47737619026246]
教師なしドメイン適応(Unsupervised domain adapt, UDA)は、ソースドメインでトレーニングされたモデルをターゲットドメインに適応させることを目的としている。
我々は,小作物の強度を組み合わして細分化の詳細を保存した多分解能トレーニング手法HRDAを提案する。
GTA-to-Cityscapesは5.5 mIoU、Synthia-to-Cityscapesは4.9 mIoUである。
論文 参考訳(メタデータ) (2022-04-27T18:00:26Z) - DAFormer: Improving Network Architectures and Training Strategies for
Domain-Adaptive Semantic Segmentation [99.88539409432916]
教師なしドメイン適応(UDA)プロセスについて検討する。
ベンチマーク結果に基づいて,新しい UDA 手法である DAFormer を提案する。
DAFormerは,GTA->Cityscapesの10.8 mIoU,Synthia->Cityscapesの5.4 mIoUにより,最先端の性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-11-29T19:00:46Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。