論文の概要: A Data Centric Approach for Unsupervised Domain Generalization via
Retrieval from Web Scale Multimodal Data
- arxiv url: http://arxiv.org/abs/2402.04416v1
- Date: Tue, 6 Feb 2024 21:29:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-08 17:43:17.711489
- Title: A Data Centric Approach for Unsupervised Domain Generalization via
Retrieval from Web Scale Multimodal Data
- Title(参考訳): webスケールマルチモーダルデータからの検索による教師なしドメイン一般化のためのデータ中心アプローチ
- Authors: Christopher Liao, Theodoros Tsiligkaridis, Brian Kulis
- Abstract要約: 教師なし領域一般化問題のマルチモーダル版に取り組む。
私たちのフレームワークは、ソースデータセットとターゲットタスクの関係を明示的に想定していません。
20の多様なターゲットデータセットに対して、精度を最大10%向上させる。
- 参考スコア(独自算出の注目度): 14.695102732987774
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Domain generalization (DG) is an important problem that learns a model that
can generalize to unseen test domains leveraging one or more source domains,
under the assumption of shared label spaces. However, most DG methods assume
access to abundant source data in the target label space, a requirement that
proves overly stringent for numerous real-world applications, where acquiring
the same label space as the target task is prohibitively expensive. For this
setting, we tackle the multimodal version of the unsupervised domain
generalization (UDG) problem, which uses a large task-agnostic unlabeled source
dataset, such as LAION-2B during finetuning. Our framework does not explicitly
assume any relationship between the source dataset and target task. Instead, it
relies only on the premise that the source dataset can be efficiently searched
in a joint vision-language space. For this multimodal UDG setting, we propose a
novel method to build a small ($<$100K) subset of the source data in three
simple steps: (1) diversified retrieval using label names as queries, (2) rank
pseudo-labeling, and (3) clustering to find representative samples. To
demonstrate the value of studying the multimodal UDG problem, we compare our
results against state-of-the-art source-free DG and zero-shot (ZS) methods on
their respective benchmarks and show up to 10% improvement in accuracy on 20
diverse target datasets. Additionally, our multi-stage dataset construction
method achieves 3% improvement on average over nearest neighbors retrieval.
Code is available: https://github.com/Chris210634/mudg
- Abstract(参考訳): ドメイン一般化 (Domain Generalization, DG) は、共有ラベル空間を仮定して、1つ以上のソースドメインを活用するテスト領域を一般化できるモデルを学ぶ重要な問題である。
しかし、ほとんどのdgメソッドは、ターゲットのラベル空間における豊富なソースデータへのアクセスを前提としており、ターゲットのタスクと同じラベル空間を取得する場合、多くの実世界のアプリケーションに対して過度に厳密であることを証明する要件である。
この設定のために、細かいチューニング中にlaion-2bのような大きなタスクに依存しない非ラベルのソースデータセットを使用するunsupervised domain generalization(udg)問題のマルチモーダルバージョンに取り組む。
私たちのフレームワークは、ソースデータセットとターゲットタスクの関係を明示的に仮定していません。
代わりに、ソースデータセットを共同ビジョン言語空間で効率的に検索できるという前提にのみ依存する。
このマルチモーダルUDG設定では,(1)ラベル名を用いたクエリの多様化,(2)擬似ラベル付け,(3)クラスタリングによる代表サンプルの検索,という3つの簡単なステップで,ソースデータの小さな($100K)サブセットを構築する方法を提案する。
マルチモーダルUDG問題の研究価値を示すために,各ベンチマークにおける最先端のソースフリーDGとゼロショット(ZS)手法を比較し,20種類のターゲットデータセットに対して最大10%の精度向上を示す。
さらに, この多段階データセット構築手法は, 近隣の検索よりも平均3%改善されている。
コード提供: https://github.com/chris210634/mudg
関連論文リスト
- Gradual Source Domain Expansion for Unsupervised Domain Adaptation [45.207132297204424]
教師なしドメイン適応(UDA)は、ソースデータセットからターゲットデータセットに知識を転送することで、大きなラベル付きデータセットの必要性を克服しようとする。
本稿では,この問題を解決するために,段階的ソース領域拡張(GSDE)アルゴリズムを提案する。
GSDEはUDAタスクをスクラッチから数回トレーニングし、毎回ネットワークウェイトを再起動するが、毎回ターゲットデータでソースデータセットを拡張する。
論文 参考訳(メタデータ) (2023-11-16T06:18:35Z) - SUG: Single-dataset Unified Generalization for 3D Point Cloud
Classification [44.27324696068285]
トレーニング済みのソースモデルが直面する予期せぬ領域差を軽減するために,単一データセット統一一般化(SUG)フレームワークを提案する。
具体的には、まず、学習した表現をドメインに依存しない識別性に制約できるマルチグラニュアルサブドメインアライメント(MSA)法を設計する。
次にSDA(Sample-level Domain-Aware Attention)戦略を示し、異なるサブドメインから簡単に適応できるサンプルを選択的に強化する。
論文 参考訳(メタデータ) (2023-05-16T04:36:04Z) - Cross-Domain Few-Shot Classification via Inter-Source Stylization [11.008292768447614]
Cross-Domain Few-Shot Classification (CDFSC)は、限られたラベル付きデータでターゲットデータセットを正確に分類することである。
本稿では、追加のラベル付けコストを必要とせずに複数のソースドメインを利用するソリューションを提案する。
論文 参考訳(メタデータ) (2022-08-17T01:44:32Z) - MultiMatch: Multi-task Learning for Semi-supervised Domain
Generalization [60.159546669021346]
我々は、各ソースドメインにいくつかのラベル情報がある半教師付きドメイン一般化タスクの解決に頼っている。
我々は、MultiMatchを提案し、FixMatchをマルチタスク学習フレームワークに拡張し、SSDGのための高品質な擬似ラベルを生成する。
提案手法の有効性を検証し,いくつかのベンチマークDGデータセット上で既存の半教師付き手法とSSDG法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T14:44:33Z) - Improving Multi-Domain Generalization through Domain Re-labeling [31.636953426159224]
本稿では,事前特定ドメインラベルと一般化性能の関連性について検討する。
マルチドメイン一般化のための一般的なアプローチであるMulDEnsを導入し,ERMをベースとした深層アンサンブルバックボーンを用いた。
我々は、MulDEnsがデータセット固有の拡張戦略やトレーニングプロセスの調整を必要としないことを示す。
論文 参考訳(メタデータ) (2021-12-17T23:21:50Z) - Curriculum Graph Co-Teaching for Multi-Target Domain Adaptation [78.28390172958643]
マルチターゲットドメイン適応(MTDA)における複数のドメインシフトを軽減するのに役立つ2つの重要な側面を同定する。
本論文では,二重分類器ヘッドを用いたCGCT(Curriculum Graph Co-Teaching)を提案する。そのうちの1つがグラフ畳み込みネットワーク(GCN)である。
ドメインラベルが利用可能になると、まずより簡単なターゲットドメインに適応し、続いて難しいドメインに適応する逐次適応戦略であるDomain-Aware Curriculum Learning (DCL)を提案する。
論文 参考訳(メタデータ) (2021-04-01T23:41:41Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z) - Sparsely-Labeled Source Assisted Domain Adaptation [64.75698236688729]
本稿では,Sparsely-Labeled Source Assisted Domain Adaptation (SLSA-DA)アルゴリズムを提案する。
ラベル不足の問題により、ソースドメインとターゲットドメインの両方で投影されたクラスタリングが行われる。
論文 参考訳(メタデータ) (2020-05-08T15:37:35Z) - Multi-source Domain Adaptation for Visual Sentiment Classification [92.53780541232773]
マルチソース・ドメイン適応(MDA)手法をMSGAN(Multi-source Sentiment Generative Adversarial Network)と呼ぶ。
複数のソースドメインからのデータを扱うために、MSGANはソースドメインとターゲットドメインの両方のデータが同じ分布を共有する、統一された感情潜在空間を見つけることを学ぶ。
4つのベンチマークデータセットで実施された大規模な実験により、MSGANは視覚的感情分類のための最先端のMDAアプローチよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2020-01-12T08:37:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。