論文の概要: Harmonizing and Merging Source Models for CLIP-based Domain Generalization
- arxiv url: http://arxiv.org/abs/2506.09446v1
- Date: Wed, 11 Jun 2025 06:52:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 06:35:02.653434
- Title: Harmonizing and Merging Source Models for CLIP-based Domain Generalization
- Title(参考訳): CLIPベースのドメイン一般化のためのハーモナイズとマージソースモデル
- Authors: Yuhe Ding, Jian Liang, Bo Jiang, Zi Wang, Aihua Zheng, Bin Luo,
- Abstract要約: CLIPベースのドメイン一般化は、CLIPと複数のソースデータセットの強力なゼロショット分類機能を活用することで、未確認領域へのモデル一般化を改善することを目的としている。
既存のメソッドは通常、複数のソースドメインにまたがって単一のモデルをトレーニングし、ドメイン共有情報をキャプチャする。
近年の研究では、モデルマージが多目的最適化の競合を効果的に軽減し、一般化性能を向上させることが示されている。
私たちは、CLIPベースのドメイン一般化のための新しいソースモデルマージフレームワークであるHarmonizing and Merging (HAM)を提案する。
- 参考スコア(独自算出の注目度): 44.54422259017548
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: CLIP-based domain generalization aims to improve model generalization to unseen domains by leveraging the powerful zero-shot classification capabilities of CLIP and multiple source datasets. Existing methods typically train a single model across multiple source domains to capture domain-shared information. However, this paradigm inherently suffers from two types of conflicts: 1) sample conflicts, arising from noisy samples and extreme domain shifts among sources; and 2) optimization conflicts, stemming from competition and trade-offs during multi-source training. Both hinder the generalization and lead to suboptimal solutions. Recent studies have shown that model merging can effectively mitigate the competition of multi-objective optimization and improve generalization performance. Inspired by these findings, we propose Harmonizing and Merging (HAM), a novel source model merging framework for CLIP-based domain generalization. During the training process of the source models, HAM enriches the source samples without conflicting samples, and harmonizes the update directions of all models. Then, a redundancy-aware historical model merging method is introduced to effectively integrate knowledge across all source models. HAM comprehensively consolidates source domain information while enabling mutual enhancement among source models, ultimately yielding a final model with optimal generalization capabilities. Extensive experiments on five widely used benchmark datasets demonstrate the effectiveness of our approach, achieving state-of-the-art performance.
- Abstract(参考訳): CLIPベースのドメイン一般化は、CLIPと複数のソースデータセットの強力なゼロショット分類機能を活用することで、未確認領域へのモデル一般化を改善することを目的としている。
既存のメソッドは通常、複数のソースドメインにまたがって単一のモデルをトレーニングし、ドメイン共有情報をキャプチャする。
しかし、このパラダイムは本質的に2つのタイプの対立に苦しむ。
1)ノイズのあるサンプルから生じるサンプルの衝突及びソース間の極端な領域シフト
2) マルチソーストレーニングにおける競合やトレードオフに起因する最適化の対立。
どちらも一般化を妨げ、準最適解へと導く。
近年の研究では、モデルマージが多目的最適化の競合を効果的に軽減し、一般化性能を向上させることが示されている。
これらの知見に触発されて、我々は、CLIPベースのドメイン一般化のための新しいソースモデルマージフレームワークであるHarmonizing and Merging (HAM)を提案する。
ソースモデルのトレーニングプロセスの間、HAMはサンプルに矛盾することなくソースサンプルを豊かにし、すべてのモデルの更新方向を調和させる。
そして、すべてのソースモデルにまたがる知識を効果的に統合するために、冗長性を考慮した履歴モデルマージ手法を導入する。
HAMは、ソースドメイン情報を包括的に統合し、ソースモデル間の相互拡張を可能にし、最終的には最適な一般化機能を備えた最終モデルを生成する。
5つの広く使用されているベンチマークデータセットに対する大規模な実験は、我々のアプローチの有効性を示し、最先端のパフォーマンスを実現した。
関連論文リスト
- GM-DF: Generalized Multi-Scenario Deepfake Detection [49.072106087564144]
既存の偽造検出は、通常、単一のドメインでのトレーニングモデルのパラダイムに従う。
本稿では,複数の顔偽造検出データセットを共同で訓練した場合のディープフェイク検出モデルの一般化能力について詳しく検討する。
論文 参考訳(メタデータ) (2024-06-28T17:42:08Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - A Novel Mix-normalization Method for Generalizable Multi-source Person
Re-identification [49.548815417844786]
人物再識別(Re-ID)は、監督されたシナリオにおいて大きな成功を収めた。
モデルがソースドメインに過度に適合するため、教師付きモデルを任意の未確認領域に直接転送することは困難である。
ドメイン・アウェア・ミックス正規化(DMN)とドメイン・ウェア・センター正規化(DCR)からなるMixNormを提案する。
論文 参考訳(メタデータ) (2022-01-24T18:09:38Z) - Improving Multi-Domain Generalization through Domain Re-labeling [31.636953426159224]
本稿では,事前特定ドメインラベルと一般化性能の関連性について検討する。
マルチドメイン一般化のための一般的なアプローチであるMulDEnsを導入し,ERMをベースとした深層アンサンブルバックボーンを用いた。
我々は、MulDEnsがデータセット固有の拡張戦略やトレーニングプロセスの調整を必要としないことを示す。
論文 参考訳(メタデータ) (2021-12-17T23:21:50Z) - Self-balanced Learning For Domain Generalization [64.99791119112503]
ドメインの一般化は、モデルが未知の統計を持つ対象のドメインに一般化できるように、マルチドメインのソースデータの予測モデルを学ぶことを目的としている。
既存のアプローチのほとんどは、ソースデータがドメインとクラスの両方の観点からバランスよく調整されているという前提の下で開発されている。
本稿では,多領域ソースデータの分布の違いによるバイアスを軽減するために,損失の重み付けを適応的に学習する自己均衡型領域一般化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-31T03:17:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。