論文の概要: Generalization by Adaptation: Diffusion-Based Domain Extension for
Domain-Generalized Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2312.01850v1
- Date: Mon, 4 Dec 2023 12:31:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 15:14:50.169890
- Title: Generalization by Adaptation: Diffusion-Based Domain Extension for
Domain-Generalized Semantic Segmentation
- Title(参考訳): 適応による一般化:ドメイン一般化意味セグメンテーションのための拡散ベースドメイン拡張
- Authors: Joshua Niemeijer, Manuel Schwonberg, Jan-Aike Term\"ohlen, Nico M.
Schmidt, Tim Fingscheidt
- Abstract要約: 拡散型ドメイン拡張法(DIDEX)を提案する。
拡散モデルを用いて、多様なテキストプロンプトを持つ擬似ターゲットドメインを生成する。
2番目のステップでは、この擬標的領域に適応して一般化モデルを訓練する。
- 参考スコア(独自算出の注目度): 21.016364582994846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When models, e.g., for semantic segmentation, are applied to images that are
vastly different from training data, the performance will drop significantly.
Domain adaptation methods try to overcome this issue, but need samples from the
target domain. However, this might not always be feasible for various reasons
and therefore domain generalization methods are useful as they do not require
any target data. We present a new diffusion-based domain extension (DIDEX)
method and employ a diffusion model to generate a pseudo-target domain with
diverse text prompts. In contrast to existing methods, this allows to control
the style and content of the generated images and to introduce a high
diversity. In a second step, we train a generalizing model by adapting towards
this pseudo-target domain. We outperform previous approaches by a large margin
across various datasets and architectures without using any real data. For the
generalization from GTA5, we improve state-of-the-art mIoU performance by 3.8%
absolute on average and for SYNTHIA by 11.8% absolute, marking a big step for
the generalization performance on these benchmarks. Code is available at
https://github.com/JNiemeijer/DIDEX
- Abstract(参考訳): 例えば、セマンティクスセグメンテーション(セマンティックセグメンテーション)のようなモデルが、トレーニングデータと大きく異なるイメージに適用されると、パフォーマンスは大幅に低下する。
ドメイン適応メソッドはこの問題を克服しようとしますが、ターゲットドメインからのサンプルが必要です。
しかし、これは必ずしも様々な理由で実現可能であるとは限らないため、ドメイン一般化メソッドはターゲットデータを必要としないため有用である。
本稿では,拡散型ドメイン拡張法(DIDEX)を提案し,拡散モデルを用いてテキストプロンプトの異なる擬似ターゲットドメインを生成する。
既存の手法とは対照的に、生成された画像のスタイルと内容の制御と、高い多様性の導入が可能になる。
2番目のステップでは、この擬標的領域に適応して一般化モデルを訓練する。
これまでのアプローチを、実際のデータを使わずに、さまざまなデータセットやアーキテクチャで大きなマージンで上回っています。
GTA5からの一般化では、平均で3.8%、SynTHIAで11.8%の改善を行い、これらのベンチマーク上での一般化性能の大きなステップとなる。
コードはhttps://github.com/JNiemeijer/DIDEXで入手できる。
関連論文リスト
- DG-TTA: Out-of-domain medical image segmentation through Domain Generalization and Test-Time Adaptation [43.842694540544194]
本稿では、ドメインの一般化とテスト時間適応を組み合わせることで、未確認対象領域で事前学習したモデルを再利用するための非常に効果的なアプローチを提案する。
本手法は,事前訓練した全身CTモデルと組み合わせることで,MR画像を高精度に分割できることを実証する。
論文 参考訳(メタデータ) (2023-12-11T10:26:21Z) - DGInStyle: Domain-Generalizable Semantic Segmentation with Image Diffusion Models and Stylized Semantic Control [68.14798033899955]
大規模で事前訓練された潜伏拡散モデル(LDM)は、創造的コンテンツを生成できる異常な能力を示した。
しかし、それらは例えば、セマンティックセグメンテーションのような知覚スタックのタスクを改善するために、大規模なデータジェネレータとして使用できますか?
自律運転の文脈でこの疑問を考察し、「はい」という言い換えで答える。
論文 参考訳(メタデータ) (2023-12-05T18:34:12Z) - Multi-Domain Long-Tailed Learning by Augmenting Disentangled
Representations [80.76164484820818]
多くの現実世界の分類問題には、避けられない長い尾のクラスバランスの問題がある。
本稿では,この多領域長鎖学習問題について検討し,すべてのクラスとドメインにまたがってよく一般化されたモデルを作成することを目的とする。
TALLYは、選択的均衡サンプリング戦略に基づいて、ある例のセマンティック表現と別の例のドメイン関連ニュアンスを混合することでこれを達成している。
論文 参考訳(メタデータ) (2022-10-25T21:54:26Z) - Continual Unsupervised Domain Adaptation for Semantic Segmentation using
a Class-Specific Transfer [9.46677024179954]
セグメンテーションモデルは 目に見えない領域に一般化しません
2つのクラス条件のAdaIN層を組み込んだ軽量なスタイル転送フレームワークを提案する。
合成シーケンスに対する我々のアプローチを広く検証し、さらに実領域からなる挑戦的なシーケンスを提案する。
論文 参考訳(メタデータ) (2022-08-12T21:30:49Z) - Semantic-Aware Domain Generalized Segmentation [67.49163582961877]
ソースドメインでトレーニングされたディープモデルは、異なるデータ分布を持つ未確認対象ドメインで評価された場合、一般化に欠ける。
セマンティック・アウェア・正規化(SAN)とセマンティック・アウェア・ホワイトニング(SAW)の2つの新しいモジュールを含むフレームワークを提案する。
提案手法は,様々なバックボーンネットワークにおいて,既存の最先端ネットワークよりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-04-02T09:09:59Z) - Adaptive Domain-Specific Normalization for Generalizable Person
Re-Identification [81.30327016286009]
一般化可能なRe-IDのための適応型ドメイン固有正規化手法(AdsNorm)を提案する。
本研究では,一般化可能人物 Re-ID に対する適応領域特異的正規化手法 (AdsNorm) を提案する。
論文 参考訳(メタデータ) (2021-05-07T02:54:55Z) - Robust Domain-Free Domain Generalization with Class-aware Alignment [4.442096198968069]
ドメインフリードメイン一般化(DFDG)は、目に見えないテストドメインでより良い一般化性能を実現するモデル非依存の方法である。
DFDGは新しい戦略を用いてドメイン不変なクラス差別的特徴を学習する。
時系列センサと画像分類公開データセットの両方で競合性能を得る。
論文 参考訳(メタデータ) (2021-02-17T17:46:06Z) - Batch Normalization Embeddings for Deep Domain Generalization [50.51405390150066]
ドメインの一般化は、異なるドメインと見えないドメインで堅牢に実行されるように機械学習モデルをトレーニングすることを目的としている。
一般的な領域一般化ベンチマークにおいて,最先端技術よりも分類精度が著しく向上したことを示す。
論文 参考訳(メタデータ) (2020-11-25T12:02:57Z) - Learning Meta Face Recognition in Unseen Domains [74.69681594452125]
メタ顔認識(MFR)というメタラーニングを用いた新しい顔認識手法を提案する。
MFRは、メタ最適化目標を用いてソース/ターゲットドメインシフトを合成する。
一般化顔認識評価のためのベンチマークを2つ提案する。
論文 参考訳(メタデータ) (2020-03-17T14:10:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。