Fugu-MT 論文翻訳(概要): PSO-Merging: Merging Models Based on Particle Swarm Optimization

論文の概要: PSO-Merging: Merging Models Based on Particle Swarm Optimization

arxiv url: http://arxiv.org/abs/2508.19839v1
Date: Wed, 27 Aug 2025 12:52:36 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-28 19:07:41.629107
Title: PSO-Merging: Merging Models Based on Particle Swarm Optimization
Title（参考訳）: PSO-Merging: Particle Swarm Optimizationに基づくマージモデル
Authors: Kehao Zhang, Shaolei Zhang, Yang Feng,
Abstract要約: 我々は、Particle Swarm Optimization(PSO)に基づく新しいデータ駆動マージ手法であるPSO-Mergingを紹介する。提案手法では,素粒子群を事前学習モデル,エキスパートモデル,スパシファイドエキスパートモデルで初期化する。次に、複数の繰り返しを行い、最終的な大域的最適粒子がマージモデルとして機能する。
参考スコア（独自算出の注目度）: 36.641774346671504
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Model merging has emerged as an efficient strategy for constructing multitask models by integrating the strengths of multiple available expert models, thereby reducing the need to fine-tune a pre-trained model for all the tasks from scratch. Existing data-independent methods struggle with performance limitations due to the lack of data-driven guidance. Data-driven approaches also face key challenges: gradient-based methods are computationally expensive, limiting their practicality for merging large expert models, whereas existing gradient-free methods often fail to achieve satisfactory results within a limited number of optimization steps. To address these limitations, this paper introduces PSO-Merging, a novel data-driven merging method based on the Particle Swarm Optimization (PSO). In this approach, we initialize the particle swarm with a pre-trained model, expert models, and sparsified expert models. We then perform multiple iterations, with the final global best particle serving as the merged model. Experimental results on different language models show that PSO-Merging generally outperforms baseline merging methods, offering a more efficient and scalable solution for model merging.
Abstract（参考訳）: モデルマージは、複数の利用可能なエキスパートモデルの強みを統合することで、すべてのタスクをスクラッチからトレーニング済みモデルを微調整する必要性を減らすことで、マルチタスクモデルを構築するための効率的な戦略として登場した。既存のデータ非依存のメソッドは、データ駆動のガイダンスが欠如しているため、パフォーマンス上の制限に悩まされる。データ駆動型アプローチも大きな課題に直面している: 勾配ベースの手法は計算コストが高く、大規模なエキスパートモデルをマージするための実用性を制限している。これらの制約に対処するために、PSO-Mergingは、Particle Swarm Optimization (PSO)に基づく新しいデータ駆動マージ手法である。提案手法では,素粒子群を事前学習モデル,エキスパートモデル,スパシファイドエキスパートモデルで初期化する。次に、複数の繰り返しを行い、最終的な大域的最適粒子がマージモデルとして機能する。異なる言語モデルの実験的結果から、PSO-Mergingは一般的にベースラインマージ手法よりも優れており、モデルマージのためのより効率的でスケーラブルなソリューションを提供する。

論文の概要: PSO-Merging: Merging Models Based on Particle Swarm Optimization

関連論文リスト