論文の概要: Grounding Stylistic Domain Generalization with Quantitative Domain Shift Measures and Synthetic Scene Images
- arxiv url: http://arxiv.org/abs/2405.15961v1
- Date: Fri, 24 May 2024 22:13:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 01:49:07.227381
- Title: Grounding Stylistic Domain Generalization with Quantitative Domain Shift Measures and Synthetic Scene Images
- Title(参考訳): 定量的領域シフト対策と合成シーン画像を用いたグラウンドディング・スティリスティック・ドメインの一般化
- Authors: Yiran Luo, Joshua Feinglass, Tejas Gokhale, Kuan-Cheng Lee, Chitta Baral, Yezhou Yang,
- Abstract要約: ドメインの一般化は機械学習において難しい課題である。
現在の方法論は、スタイリスティック領域におけるシフトに関する定量的な理解を欠いている。
これらのリスクに対処する新しいDGパラダイムを導入する。
- 参考スコア(独自算出の注目度): 63.58800688320182
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Domain Generalization (DG) is a challenging task in machine learning that requires a coherent ability to comprehend shifts across various domains through extraction of domain-invariant features. DG performance is typically evaluated by performing image classification in domains of various image styles. However, current methodology lacks quantitative understanding about shifts in stylistic domain, and relies on a vast amount of pre-training data, such as ImageNet1K, which are predominantly in photo-realistic style with weakly supervised class labels. Such a data-driven practice could potentially result in spurious correlation and inflated performance on DG benchmarks. In this paper, we introduce a new DG paradigm to address these risks. We first introduce two new quantitative measures ICV and IDD to describe domain shifts in terms of consistency of classes within one domain and similarity between two stylistic domains. We then present SuperMarioDomains (SMD), a novel synthetic multi-domain dataset sampled from video game scenes with more consistent classes and sufficient dissimilarity compared to ImageNet1K. We demonstrate our DG method SMOS. SMOS first uses SMD to train a precursor model, which is then used to ground the training on a DG benchmark. We observe that SMOS contributes to state-of-the-art performance across five DG benchmarks, gaining large improvements to performances on abstract domains along with on-par or slight improvements to those on photo-realistic domains. Our qualitative analysis suggests that these improvements can be attributed to reduced distributional divergence between originally distant domains. Our data are available at https://github.com/fpsluozi/SMD-SMOS .
- Abstract(参考訳): ドメイン一般化(Domain Generalization, DG)は、ドメイン不変の特徴の抽出を通じて、さまざまなドメイン間のシフトを理解するコヒーレントな能力を必要とする機械学習の課題である。
DG性能は、通常、様々な画像スタイルの領域で画像分類を行うことによって評価される。
しかし、現在の手法では、スタイリスティックなドメインのシフトに関する定量的な理解が欠如しており、ImageNet1Kのような大量の事前学習データに依存している。
このようなデータ駆動のプラクティスは、DGベンチマーク上での急激な相関とインフレーションパフォーマンスをもたらす可能性がある。
本稿では,これらのリスクに対処する新しいDGパラダイムを提案する。
まず1つのドメイン内のクラスの一貫性と2つのスタイリスティックなドメイン間の類似性の観点から、ドメインシフトを記述するための2つの新しい量的尺度 ICV と IDD を導入する。
次に、より一貫したクラスと、ImageNet1Kと比較して十分な相同性を持つ、ビデオゲームシーンからサンプリングされた新しい合成マルチドメインデータセットであるSuperMarioDomains(SMD)を提示する。
DG法SMOSを実証する。
SMOSはまずSMDを使用して前駆体モデルをトレーニングし、その後DGベンチマークでトレーニングを行う。
SMOSは5つのDGベンチマークにまたがって最先端のパフォーマンスに寄与し、抽象領域における性能を大幅に改善し、写真リアリスティック領域における性能をわずかに改善する。
我々の定性的分析は、これらの改善は、もともとの遠い領域間の分布のばらつきの減少に起因する可能性があることを示唆している。
私たちのデータはhttps://github.com/fpsluozi/SMD-SMOSで公開されています。
関連論文リスト
- Domain-Guided Weight Modulation for Semi-Supervised Domain Generalization [11.392783918495404]
半教師付き領域一般化の課題について検討する。
目的は、ラベル付きデータのごく一部とラベルなしデータの比較的大きな部分だけを使用しながら、ドメイン一般化可能なモデルを学ぶことである。
そこで本研究では,様々なドメインシフトの下で,正確な擬似ラベルの生成を容易にする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-04T01:26:23Z) - Disentangling Masked Autoencoders for Unsupervised Domain Generalization [57.56744870106124]
教師なしの領域一般化は急速に注目されているが、まだ十分に研究されていない。
Disentangled Masked Auto (DisMAE) は、本質的な特徴を忠実に示す不整合表現を発見することを目的としている。
DisMAEは、セマンティックで軽量な変分エンコーダを備えた非対称なデュアルブランチアーキテクチャを共同で訓練する。
論文 参考訳(メタデータ) (2024-07-10T11:11:36Z) - Domain Adaptive and Generalizable Network Architectures and Training
Strategies for Semantic Image Segmentation [108.33885637197614]
教師なしドメイン適応(UDA)とドメイン一般化(DG)により、ソースドメインでトレーニングされた機械学習モデルは、ラベルなしまたは目に見えないターゲットドメインでうまく機能する。
UDA&DGのマルチレゾリューション・フレームワークであるHRDAを提案する。このフレームワークは、細かなセグメンテーションの詳細を保存するための小さな高分解能作物の強度と、学習されたスケールの注意を伴って長距離のコンテキスト依存を捕捉する大規模な低分解能作物の強度を組み合わせたものである。
論文 参考訳(メタデータ) (2023-04-26T15:18:45Z) - Federated Domain Generalization for Image Recognition via Cross-Client
Style Transfer [60.70102634957392]
ドメイン一般化(Domain Generalization, DG)は、画像認識においてホットなトピックであり、目に見えないドメインでうまく機能する一般的なモデルを訓練することを目的としている。
本稿では,データサンプルを交換することなく,クロスクライアント型転送(CCST)による画像認識のための新しい領域一般化手法を提案する。
本手法は2つのDGベンチマーク(PACS, OfficeHome)とFL設定における大規模医用画像データセット(Camelyon17)において,最近のSOTA DG法より優れている。
論文 参考訳(メタデータ) (2022-10-03T13:15:55Z) - Multi-Scale Multi-Target Domain Adaptation for Angle Closure
Classification [50.658613573816254]
角度閉包分類のためのM2DAN(Multi-scale Multi-target Domain Adversarial Network)を提案する。
異なるスケールでのこれらのドメイン不変性に基づいて、ソースドメインで訓練されたディープモデルは、複数のターゲットドメインの角度クロージャを分類することができる。
論文 参考訳(メタデータ) (2022-08-25T15:27:55Z) - Unsupervised Domain Adaptation for Cross-Modality Retinal Vessel
Segmentation via Disentangling Representation Style Transfer and
Collaborative Consistency Learning [3.9562534927482704]
ドメインシフトが大きいタスクに対する、新しいクロスモーダルな教師なしドメイン適応フレームワークDCDAを提案する。
本フレームワークは,OCTAからOCT,OCTからOCTAまで,目標に訓練されたオラクルに近いDiceスコアを達成し,他の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2022-01-13T07:03:16Z) - Semi-supervised Meta-learning with Disentanglement for
Domain-generalised Medical Image Segmentation [15.351113774542839]
新たなセンター(ここではドメイン)からの新しいデータにモデルを一般化することは、依然として課題である。
本稿では,絡み合いを伴う半教師付きメタラーニングフレームワークを提案する。
提案手法は,異なるセグメンテーションタスクに対して頑健であり,2つの公開ベンチマーク上での最先端の一般化性能を実現する。
論文 参考訳(メタデータ) (2021-06-24T19:50:07Z) - Curriculum Graph Co-Teaching for Multi-Target Domain Adaptation [78.28390172958643]
マルチターゲットドメイン適応(MTDA)における複数のドメインシフトを軽減するのに役立つ2つの重要な側面を同定する。
本論文では,二重分類器ヘッドを用いたCGCT(Curriculum Graph Co-Teaching)を提案する。そのうちの1つがグラフ畳み込みネットワーク(GCN)である。
ドメインラベルが利用可能になると、まずより簡単なターゲットドメインに適応し、続いて難しいドメインに適応する逐次適応戦略であるDomain-Aware Curriculum Learning (DCL)を提案する。
論文 参考訳(メタデータ) (2021-04-01T23:41:41Z) - Robust Domain-Free Domain Generalization with Class-aware Alignment [4.442096198968069]
ドメインフリードメイン一般化(DFDG)は、目に見えないテストドメインでより良い一般化性能を実現するモデル非依存の方法である。
DFDGは新しい戦略を用いてドメイン不変なクラス差別的特徴を学習する。
時系列センサと画像分類公開データセットの両方で競合性能を得る。
論文 参考訳(メタデータ) (2021-02-17T17:46:06Z) - Domain Adaptation on Semantic Segmentation for Aerial Images [3.946367634483361]
セマンティックイメージセグメンテーションにおける領域シフトに対処する、新しい教師なしドメイン適応フレームワークを提案する。
また、ターゲット領域にエントロピー最小化を適用し、高信頼な予測を生成する。
様々な指標を用いて最先端手法の改善を示す。
論文 参考訳(メタデータ) (2020-12-03T20:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。