論文の概要: WEDGE: Web-Image Assisted Domain Generalization for Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2109.14196v1
- Date: Wed, 29 Sep 2021 05:19:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-30 23:50:41.411479
- Title: WEDGE: Web-Image Assisted Domain Generalization for Semantic
Segmentation
- Title(参考訳): WEDGE: セマンティックセグメンテーションのためのWebイメージ支援ドメイン一般化
- Authors: Namyup Kim, Taeyoung Son, Cuiling Lan, Wenjun Zeng, Suha Kwak
- Abstract要約: 本稿では,Web画像の多様性を一般化可能なセマンティックセグメンテーションに活用したWEb画像支援ドメインゲネラライゼーション手法を提案する。
また、トレーニング中にWebクローリングされたデータのスタイル表現をソースドメインにインジェクトする手法を提案する。
- 参考スコア(独自算出の注目度): 76.98684134514264
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Domain generalization for semantic segmentation is highly demanded in real
applications, where a trained model is expected to work well in previously
unseen domains. One challenge lies in the lack of data which could cover the
diverse distributions of the possible unseen domains for training. In this
paper, we propose a WEb-image assisted Domain GEneralization (WEDGE) scheme,
which is the first to exploit the diversity of web-crawled images for
generalizable semantic segmentation. To explore and exploit the real-world data
distributions, we collect a web-crawled dataset which presents large diversity
in terms of weather conditions, sites, lighting, camera styles, etc. We also
present a method which injects the style representation of the web-crawled data
into the source domain on-the-fly during training, which enables the network to
experience images of diverse styles with reliable labels for effective
training. Moreover, we use the web-crawled dataset with predicted pseudo labels
for training to further enhance the capability of the network. Extensive
experiments demonstrate that our method clearly outperforms existing domain
generalization techniques.
- Abstract(参考訳): セマンティクスのセグメンテーションのためのドメインの一般化は、訓練済みのモデルがこれまで見つからなかったドメインでうまく機能することが期待される実際のアプリケーションにおいて、非常に要求される。
課題の1つは、トレーニングのために見当たらない可能性のあるドメインの多様な分布をカバーするデータの欠如である。
本稿では,WEb-image Assisted Domain GEneralization (WEDGE) 方式を提案する。
実世界のデータ配信を探索し、活用するために、気象条件、サイト、照明、カメラスタイルなどの観点から大きな多様性を示すWebcrawledデータセットを収集します。
また、トレーニング中にWebcrawledデータのスタイル表現をソースドメインにインジェクトし、信頼性の高いラベル付き多種多様なスタイルの画像をネットワークで体験し、効果的なトレーニングを行う方法を提案する。
さらに,ネットワークの能力を高めるために,擬似ラベル付きウェブクローリングデータセットを用いてトレーニングを行う。
広範な実験により,本手法が既存のドメイン一般化手法を明らかに上回ることを示した。
関連論文リスト
- Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation [33.955384040748946]
我々は、新しいクラスを学習するためにも、広く利用可能なWebイメージを考えることができると論じている。
我々の知る限り、これは新しい概念の学習と既に学んだ概念の保存の両方のために、Webイメージにのみ依存する最初の作品である。
論文 参考訳(メタデータ) (2024-07-18T10:14:49Z) - WIDIn: Wording Image for Domain-Invariant Representation in Single-Source Domain Generalization [63.98650220772378]
We present WIDIn, Wording Images for Domain-Invariant representation, to disentangleative discriminative visual representation。
まず、ドメイン固有の言語を適応的に識別し、削除するために使用可能な、きめ細かいアライメントを組み込んだ言語を推定する。
WIDInは、CLIPのような事前訓練された視覚言語モデルと、MoCoやBERTのような個別訓練されたユニモーダルモデルの両方に適用可能であることを示す。
論文 参考訳(メタデータ) (2024-05-28T17:46:27Z) - ODES: Domain Adaptation with Expert Guidance for Online Medical Image Segmentation [16.90507882617707]
ドメイン適応セグメンテーションは、通常、ラベルなしのターゲットデータセット上で事前トレーニングされたネットワークによって予測される擬似ラベルを使用した自己学習に依存する。
バッチ内の全画像にまたがるピクセルレベルのアノテーションの取得は、オンライン学習における時間的オーバーヘッドを増大させながら、冗長な情報をもたらすことが多い。
本稿では,現在のバッチから画像の最も有用なサブセットを選択して,アクティブな学習を行う,新しい画像抽出手法を提案する。
論文 参考訳(メタデータ) (2023-12-08T23:43:17Z) - Domain-Controlled Prompt Learning [49.45309818782329]
既存の素早い学習方法はドメイン認識やドメイン転送機構を欠いていることが多い。
特定のドメインに対するtextbfDomain-Controlled Prompt Learningを提案する。
本手法は,特定の領域画像認識データセットにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-30T02:59:49Z) - Using Language to Extend to Unseen Domains [81.37175826824625]
ビジョンモデルがデプロイ時に遭遇する可能性のあるすべてのドメインのトレーニングデータを集めることは、費用がかかる。
トレーニングドメインと拡張したいが、堅牢性を改善するためのデータを持っていないドメインを、いかに単純に言葉で表現するかを考えます。
共同画像と言語埋め込み空間を備えたマルチモーダルモデルを用いて、LADSはトレーニング領域から各未確認テスト領域への画像埋め込みの変換を学習する。
論文 参考訳(メタデータ) (2022-10-18T01:14:02Z) - Federated Domain Generalization for Image Recognition via Cross-Client
Style Transfer [60.70102634957392]
ドメイン一般化(Domain Generalization, DG)は、画像認識においてホットなトピックであり、目に見えないドメインでうまく機能する一般的なモデルを訓練することを目的としている。
本稿では,データサンプルを交換することなく,クロスクライアント型転送(CCST)による画像認識のための新しい領域一般化手法を提案する。
本手法は2つのDGベンチマーク(PACS, OfficeHome)とFL設定における大規模医用画像データセット(Camelyon17)において,最近のSOTA DG法より優れている。
論文 参考訳(メタデータ) (2022-10-03T13:15:55Z) - Domain-invariant Prototypes for Semantic Segmentation [30.932130453313537]
ドメイン適応型セマンティックセグメンテーションのためのドメイン不変のプロトタイプを学習する。
本手法は,1段階の訓練のみを伴い,大規模な未注釈対象画像に対してトレーニングを行う必要はない。
論文 参考訳(メタデータ) (2022-08-12T02:21:05Z) - DoFE: Domain-oriented Feature Embedding for Generalizable Fundus Image
Segmentation on Unseen Datasets [96.92018649136217]
対象ドメインに対するCNNの一般化能力を向上させるために,新しいドメイン指向特徴埋め込み(DoFE)フレームワークを提案する。
私たちのDoFEフレームワークは、マルチソースドメインから学んだ追加のドメイン事前知識で、画像機能を動的に強化します。
本フレームワークは、未確認データセットのセグメンテーション結果を満足して生成し、他の領域の一般化やネットワークの正規化手法を超越する。
論文 参考訳(メタデータ) (2020-10-13T07:28:39Z) - Generalizable Model-agnostic Semantic Segmentation via Target-specific
Normalization [24.14272032117714]
一般化可能なセマンティックセグメンテーションタスクのための新しいドメイン一般化フレームワークを提案する。
モデルに依存しない学習を利用してドメインシフト問題をシミュレートする。
観測対象領域と観測対象領域間のデータ分散の相違を考慮し、目標固有正規化方式を開発する。
論文 参考訳(メタデータ) (2020-03-27T09:25:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。