論文の概要: WEDGE: Web-Image Assisted Domain Generalization for Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2109.14196v4
- Date: Tue, 2 May 2023 05:59:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-03 18:32:43.298774
- Title: WEDGE: Web-Image Assisted Domain Generalization for Semantic
Segmentation
- Title(参考訳): WEDGE: セマンティックセグメンテーションのためのWebイメージ支援ドメイン一般化
- Authors: Namyup Kim, Taeyoung Son, Jaehyun Pahk, Cuiling Lan, Wenjun Zeng, Suha
Kwak
- Abstract要約: 本稿では,Web画像の多様性を一般化可能なセマンティックセグメンテーションに活用したWEb画像支援ドメインゲネラライゼーション手法を提案する。
また,ウェブクローラー画像のスタイルをトレーニング中のトレーニング画像に注入する手法を提案する。
- 参考スコア(独自算出の注目度): 72.88657378658549
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Domain generalization for semantic segmentation is highly demanded in real
applications, where a trained model is expected to work well in previously
unseen domains. One challenge lies in the lack of data which could cover the
diverse distributions of the possible unseen domains for training. In this
paper, we propose a WEb-image assisted Domain GEneralization (WEDGE) scheme,
which is the first to exploit the diversity of web-crawled images for
generalizable semantic segmentation. To explore and exploit the real-world data
distributions, we collect web-crawled images which present large diversity in
terms of weather conditions, sites, lighting, camera styles, etc. We also
present a method which injects styles of the web-crawled images into training
images on-the-fly during training, which enables the network to experience
images of diverse styles with reliable labels for effective training. Moreover,
we use the web-crawled images with their predicted pseudo labels for training
to further enhance the capability of the network. Extensive experiments
demonstrate that our method clearly outperforms existing domain generalization
techniques.
- Abstract(参考訳): セマンティクスのセグメンテーションのためのドメインの一般化は、訓練済みのモデルがこれまで見つからなかったドメインでうまく機能することが期待される実際のアプリケーションにおいて、非常に要求される。
課題の1つは、トレーニングのために見当たらない可能性のあるドメインの多様な分布をカバーするデータの欠如である。
本稿では,WEb-image Assisted Domain GEneralization (WEDGE) 方式を提案する。
実世界のデータ分布を探索し、活用するために、気象条件、サイト、照明、カメラスタイルなどの点で大きな多様性を示すウェブクローラー画像を収集する。
また,webクローラー画像のスタイルをトレーニング中にオンザフライでトレーニング画像に注入する手法を提案する。
さらに,ウェブクローリング画像と予測された擬似ラベルを用いてトレーニングを行い,ネットワークの能力をさらに向上させる。
広範な実験により,本手法が既存のドメイン一般化手法を明らかに上回ることを示した。
関連論文リスト
- Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation [33.955384040748946]
我々は、新しいクラスを学習するためにも、広く利用可能なWebイメージを考えることができると論じている。
我々の知る限り、これは新しい概念の学習と既に学んだ概念の保存の両方のために、Webイメージにのみ依存する最初の作品である。
論文 参考訳(メタデータ) (2024-07-18T10:14:49Z) - WIDIn: Wording Image for Domain-Invariant Representation in Single-Source Domain Generalization [63.98650220772378]
We present WIDIn, Wording Images for Domain-Invariant representation, to disentangleative discriminative visual representation。
まず、ドメイン固有の言語を適応的に識別し、削除するために使用可能な、きめ細かいアライメントを組み込んだ言語を推定する。
WIDInは、CLIPのような事前訓練された視覚言語モデルと、MoCoやBERTのような個別訓練されたユニモーダルモデルの両方に適用可能であることを示す。
論文 参考訳(メタデータ) (2024-05-28T17:46:27Z) - Domain-Controlled Prompt Learning [49.45309818782329]
既存の素早い学習方法はドメイン認識やドメイン転送機構を欠いていることが多い。
特定のドメインに対するtextbfDomain-Controlled Prompt Learningを提案する。
本手法は,特定の領域画像認識データセットにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-30T02:59:49Z) - Using Language to Extend to Unseen Domains [81.37175826824625]
ビジョンモデルがデプロイ時に遭遇する可能性のあるすべてのドメインのトレーニングデータを集めることは、費用がかかる。
トレーニングドメインと拡張したいが、堅牢性を改善するためのデータを持っていないドメインを、いかに単純に言葉で表現するかを考えます。
共同画像と言語埋め込み空間を備えたマルチモーダルモデルを用いて、LADSはトレーニング領域から各未確認テスト領域への画像埋め込みの変換を学習する。
論文 参考訳(メタデータ) (2022-10-18T01:14:02Z) - Federated Domain Generalization for Image Recognition via Cross-Client
Style Transfer [60.70102634957392]
ドメイン一般化(Domain Generalization, DG)は、画像認識においてホットなトピックであり、目に見えないドメインでうまく機能する一般的なモデルを訓練することを目的としている。
本稿では,データサンプルを交換することなく,クロスクライアント型転送(CCST)による画像認識のための新しい領域一般化手法を提案する。
本手法は2つのDGベンチマーク(PACS, OfficeHome)とFL設定における大規模医用画像データセット(Camelyon17)において,最近のSOTA DG法より優れている。
論文 参考訳(メタデータ) (2022-10-03T13:15:55Z) - Domain-invariant Prototypes for Semantic Segmentation [30.932130453313537]
ドメイン適応型セマンティックセグメンテーションのためのドメイン不変のプロトタイプを学習する。
本手法は,1段階の訓練のみを伴い,大規模な未注釈対象画像に対してトレーニングを行う必要はない。
論文 参考訳(メタデータ) (2022-08-12T02:21:05Z) - DoFE: Domain-oriented Feature Embedding for Generalizable Fundus Image
Segmentation on Unseen Datasets [96.92018649136217]
対象ドメインに対するCNNの一般化能力を向上させるために,新しいドメイン指向特徴埋め込み(DoFE)フレームワークを提案する。
私たちのDoFEフレームワークは、マルチソースドメインから学んだ追加のドメイン事前知識で、画像機能を動的に強化します。
本フレームワークは、未確認データセットのセグメンテーション結果を満足して生成し、他の領域の一般化やネットワークの正規化手法を超越する。
論文 参考訳(メタデータ) (2020-10-13T07:28:39Z) - Generalizable Model-agnostic Semantic Segmentation via Target-specific
Normalization [24.14272032117714]
一般化可能なセマンティックセグメンテーションタスクのための新しいドメイン一般化フレームワークを提案する。
モデルに依存しない学習を利用してドメインシフト問題をシミュレートする。
観測対象領域と観測対象領域間のデータ分散の相違を考慮し、目標固有正規化方式を開発する。
論文 参考訳(メタデータ) (2020-03-27T09:25:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。