Fugu-MT 論文翻訳(概要): Domain-Adaptive Model Merging across Disconnected Modes

論文の概要: Domain-Adaptive Model Merging across Disconnected Modes

arxiv url: http://arxiv.org/abs/2603.05957v1
Date: Fri, 06 Mar 2026 06:42:57 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-09 13:17:45.191458
Title: Domain-Adaptive Model Merging across Disconnected Modes
Title（参考訳）: 分割モード間のドメイン適応モデルマージ
Authors: Junming Liu, Yusen Zhang, Rongchao Zhang, Wenkai Zhu, Tian Wu,
Abstract要約: DMMは、高度に分散したモデルを扱うように設計されたデータフリーモデルマージフレームワークである。 DMMは3つのステップで進行する。まずドメイン固有モデルは独立して訓練される。次に、高い類似性を持つモデルは、安定性を確保するために標準技術を用いてマージされる。第3に、正規化統計から擬似データを合成し、これらのサンプルによって導かれる軽量な精細化により、発散したモデルから融合モデルへの知識を抽出する。
参考スコア（独自算出の注目度）: 4.47776784336111
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Learning across domains is challenging when data cannot be centralized due to privacy or heterogeneity, which limits the ability to train a single comprehensive model. Model merging provides an appealing alternative by consolidating knowledge from multiple specialized models into one, avoiding data sharing and reducing retraining cost. In this work, we present DMM, a data-free model merging framework designed to handle highly divergent models. DMM proceeds in three steps. First, domain-specific models are trained independently. Second, models with high similarity are merged using standard techniques to ensure stability. Third, we synthesize pseudo-data from normalization statistics and distill knowledge from divergent models into the merged model through a lightweight refinement guided by these samples. This approach preserves rare but critical knowledge while maintaining stability. Extensive experiments on unimodal and multimodal benchmarks show that DMM achieves state-of-the-art performance over existing merging methods.
Abstract（参考訳）: プライバシや不均一性のためにデータが集中できない場合、ドメイン間での学習は困難であり、単一の包括的なモデルをトレーニングする能力を制限する。モデルマージは、複数の専門モデルからの知識をひとつに統合し、データの共有を回避し、再トレーニングコストを削減することで、魅力的な代替手段を提供する。本研究では,高度に分散したモデルを扱うように設計されたデータフリーモデルマージフレームワークであるDMMを提案する。 DMMは3ステップで進む。まず、ドメイン固有モデルは独立して訓練される。第二に、高い類似性を持つモデルは、安定性を確保するために標準技術を用いてマージされる。第3に、正規化統計から擬似データを合成し、これらのサンプルによって導かれる軽量な精錬により、発散モデルからの知識を融合モデルに蒸留する。このアプローチは、稀だが重要な知識を維持しながら、安定性を維持している。単モーダルおよびマルチモーダルベンチマークの広範囲な実験により、DMMは既存のマージ手法よりも最先端のパフォーマンスを達成することが示された。

論文の概要: Domain-Adaptive Model Merging across Disconnected Modes

関連論文リスト