論文の概要: Partial Domain Adaptation via Importance Sampling-based Shift Correction
- arxiv url: http://arxiv.org/abs/2507.20191v1
- Date: Sun, 27 Jul 2025 09:19:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:57.179014
- Title: Partial Domain Adaptation via Importance Sampling-based Shift Correction
- Title(参考訳): 重要サンプリングに基づくシフト補正による部分領域適応
- Authors: Cheng-Jun Guo, Chuan-Xian Ren, You-Wei Luo, Xiao-Lin Xu, Hong Yan,
- Abstract要約: 部分的ドメイン適応(PDA)は、現実世界の機械学習シナリオにおいて難しいタスクである。
そこで我々は,新しいラベル付きデータをサンプリングドメインからサンプリングする,新しい重要サンプリングベースシフト補正法 (IS$2$C) を提案する。
一般化誤差がIS$2$Cで十分に支配できることを証明することにより、IS$2$Cの理論的な保証を提供する。
- 参考スコア(独自算出の注目度): 22.133232771742527
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Partial domain adaptation (PDA) is a challenging task in real-world machine learning scenarios. It aims to transfer knowledge from a labeled source domain to a related unlabeled target domain, where the support set of the source label distribution subsumes the target one. Previous PDA works managed to correct the label distribution shift by weighting samples in the source domain. However, the simple reweighing technique cannot explore the latent structure and sufficiently use the labeled data, and then models are prone to over-fitting on the source domain. In this work, we propose a novel importance sampling-based shift correction (IS$^2$C) method, where new labeled data are sampled from a built sampling domain, whose label distribution is supposed to be the same as the target domain, to characterize the latent structure and enhance the generalization ability of the model. We provide theoretical guarantees for IS$^2$C by proving that the generalization error can be sufficiently dominated by IS$^2$C. In particular, by implementing sampling with the mixture distribution, the extent of shift between source and sampling domains can be connected to generalization error, which provides an interpretable way to build IS$^2$C. To improve knowledge transfer, an optimal transport-based independence criterion is proposed for conditional distribution alignment, where the computation of the criterion can be adjusted to reduce the complexity from $\mathcal{O}(n^3)$ to $\mathcal{O}(n^2)$ in realistic PDA scenarios. Extensive experiments on PDA benchmarks validate the theoretical results and demonstrate the effectiveness of our IS$^2$C over existing methods.
- Abstract(参考訳): 部分的ドメイン適応(PDA)は、現実世界の機械学習シナリオにおいて難しいタスクである。
ラベル付きソースドメインから関連するラベル付きターゲットドメインに知識を転送することを目的としており、ソースラベル配布のサポートセットがターゲットドメインに該当する。
以前のPDA作業は、ソースドメインのサンプルを重み付けすることで、ラベルの分布シフトを修正できた。
しかし、単純なリウィーディング手法では、潜在構造を探索することができず、ラベル付きデータを十分に利用することができず、モデルがソースドメインに過度に適合する傾向がある。
本研究では,新たな重要サンプリングベースシフト補正法 (IS$^2$C) を提案する。この手法では,ラベル分布がターゲットドメインと同一であるはずのサンプリングドメインから新たなラベル付きデータをサンプリングし,潜在構造を特徴づけ,モデルの一般化能力を向上する。
一般化誤差がIS$^2$Cで十分に支配できることを証明することにより、IS$^2$Cの理論的保証を提供する。
特に、混合分布でサンプリングを実装することで、ソースとサンプリングドメイン間のシフトの程度を一般化誤差に結びつけることができ、IS$^2$Cを構築するための解釈可能な方法を提供する。
知識伝達を改善するために、条件分布アライメントに対して最適な輸送ベース独立基準が提案され、現実的なPDAシナリオでは$\mathcal{O}(n^3)$から$\mathcal{O}(n^2)$への複雑性を低減するために、条件の計算を調整できる。
PDAベンチマークの大規模な実験により理論結果が検証され,既存の手法に対するIS$2$Cの有効性が実証された。
関連論文リスト
- Soft-Masked Semi-Dual Optimal Transport for Partial Domain Adaptation [16.213569477689916]
部分的ドメイン適応 (partial domain adapt, PDA) は、ターゲットラベル空間がソースのサブセットである一般的で実用的なシナリオである。
PDA の課題は、ドメインシフトだけでなく、ドメインの非IDラベル空間にも起因している。
本稿では,PDA問題に対処するために,ソフトマスク型半二重最適輸送法(SSOT)を提案する。
論文 参考訳(メタデータ) (2025-05-03T03:20:17Z) - Out-Of-Domain Unlabeled Data Improves Generalization [0.7589678255312519]
本稿では,ラベルなしデータを半教師付き分類問題に組み込む新しい枠組みを提案する。
ラベルのないサンプルは一般化ギャップを狭めるために利用できることを示す。
我々は、さまざまな合成および実世界のデータセットで実施された実験を通じて、我々の主張を検証する。
論文 参考訳(メタデータ) (2023-09-29T02:00:03Z) - CAusal and collaborative proxy-tasKs lEarning for Semi-Supervised Domain
Adaptation [20.589323508870592]
半教師付きドメイン適応(SSDA)は、ソースドメインデータとラベル付きターゲットサンプルを効果的に活用することにより、学習者を新しいドメインに適応させる。
提案手法は,SSDAデータセットの有効性と汎用性の観点から,SOTA法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-03-30T16:48:28Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Mitigating Both Covariate and Conditional Shift for Domain
Generalization [14.91361835243516]
ドメイン一般化(Domain Generalization、DG)は、複数のソースドメインのモデルを学習することを目的としており、モデルが未確認のターゲットドメインに適切に一般化できることを願っている。
本稿では,視覚的アライメントと不確実性誘導的信念アンサンブル(VAUE)による分布変化に対処する新しいDG手法を提案する。
論文 参考訳(メタデータ) (2022-09-17T05:13:56Z) - Source-Free Domain Adaptation via Distribution Estimation [106.48277721860036]
ドメイン適応は、ラベル付きソースドメインから学んだ知識を、データ分散が異なるラベル付きターゲットドメインに転送することを目的としています。
近年,ソースフリードメイン適応 (Source-Free Domain Adaptation, SFDA) が注目されている。
本研究では,SFDA-DEと呼ばれる新しいフレームワークを提案し,ソース分布推定によるSFDAタスクに対処する。
論文 参考訳(メタデータ) (2022-04-24T12:22:19Z) - KL Guided Domain Adaptation [88.19298405363452]
ドメイン適応は重要な問題であり、現実世界のアプリケーションにしばしば必要である。
ドメイン適応文学における一般的なアプローチは、ソースとターゲットドメインに同じ分布を持つ入力の表現を学ぶことである。
確率的表現ネットワークにより、KL項はミニバッチサンプルにより効率的に推定できることを示す。
論文 参考訳(メタデータ) (2021-06-14T22:24:23Z) - On Universal Black-Box Domain Adaptation [53.7611757926922]
実践的な展開という観点から,ドメイン適応の最小限の制約条件について検討する。
ソースモデルのインターフェースのみがターゲットドメインで利用可能であり、2つのドメイン間のラベル空間関係が異なることや未知であることが許されている。
対象試料の局所近傍における予測の整合性によって正規化された自己訓練フレームワークに統一することを提案する。
論文 参考訳(メタデータ) (2021-04-10T02:21:09Z) - Learning Invariant Representations and Risks for Semi-supervised Domain
Adaptation [109.73983088432364]
半教師付きドメイン適応(Semi-DA)の設定の下で不変表現とリスクを同時に学習することを目的とした最初の手法を提案する。
共同で textbfLearning textbfInvariant textbfRepresentations と textbfRisks の LIRR アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-10-09T15:42:35Z) - Sparsely-Labeled Source Assisted Domain Adaptation [64.75698236688729]
本稿では,Sparsely-Labeled Source Assisted Domain Adaptation (SLSA-DA)アルゴリズムを提案する。
ラベル不足の問題により、ソースドメインとターゲットドメインの両方で投影されたクラスタリングが行われる。
論文 参考訳(メタデータ) (2020-05-08T15:37:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。