Fugu-MT 論文翻訳(概要): MiLorE-SSL: Scaling Multilingual Capabilities in Self-Supervised Models without Forgetting

論文の概要: MiLorE-SSL: Scaling Multilingual Capabilities in Self-Supervised Models without Forgetting

arxiv url: http://arxiv.org/abs/2601.20300v1
Date: Wed, 28 Jan 2026 06:48:52 GMT
ステータス: 翻訳完了
システム内更新日: 2026-01-29 15:46:06.799422
Title: MiLorE-SSL: Scaling Multilingual Capabilities in Self-Supervised Models without Forgetting
Title（参考訳）: MiLorE-SSL: 予測せずに自己監視モデルで多言語機能をスケールアップする
Authors: Jing Xu, Minglin Wu, Xueyuan Chen, Xixin Wu, Helen Meng,
Abstract要約: MiLorE-SSLは、LoRAモジュールとソフトミキシング・オブ・エキスパート・メカニズムを組み合わせて、効率的な連続多言語トレーニングを行う軽量フレームワークである。 LoRAは効率的な低ランク適応を提供するが、ソフトなMoEは言語間のフレキシブルな専門家共有を促進し、言語間の干渉を減らす。 ML-SUPERBの実験では、MiLorE-SSLは新しい言語で高いパフォーマンスを実現し、2.14%のトレーニング可能なパラメータで既存の言語での性能を向上させることが示されている。
参考スコア（独自算出の注目度）: 69.6938830307759
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Self-supervised learning (SSL) has greatly advanced speech representation learning, but multilingual SSL models remain constrained to languages encountered during pretraining. Retraining from scratch to incorporate new languages is computationally expensive, while sequential training without migitation strategies often leads to catastrophic forgetting. To address this, we propose MiLorE-SSL, a lightweight framework that combines LoRA modules with a soft mixture-of-experts (MoE) mechanism for efficient continual multilingual training. LoRA provides efficient low-rank adaptation, while soft MoE promotes flexible expert sharing across languages, reducing cross-lingual interference. To further mitigate forgetting, we introduce limited replay data from existing languages, avoiding reliance on large historical corpora. Experiments on ML-SUPERB demonstrate that MiLorE-SSL achieves strong performance in new languages and improves the ability in existing ones with only 2.14% trainable parameters.
Abstract（参考訳）: 自己教師付き学習(SSL)は、言語表現学習が大幅に進歩するが、多言語SSLモデルは、事前訓練中に遭遇する言語に制約されないままである。スクラッチから新しい言語を組み込むためのトレーニングは計算に費用がかかるが、緩和戦略を伴わない逐次トレーニングは、しばしば破滅的な忘れを招く。そこで本研究では,LoRAモジュールとソフトミキシング・オブ・エキスパート(MoE)機構を組み合わせる軽量フレームワークであるMiLorE-SSLを提案する。 LoRAは効率的な低ランク適応を提供するが、ソフトなMoEは言語間のフレキシブルな専門家共有を促進し、言語間の干渉を減らす。忘れを和らげるために,既存の言語からの制限されたリプレイデータを導入し,大規模な歴史的コーパスへの依存を回避した。 ML-SUPERBの実験では、MiLorE-SSLは新しい言語で高いパフォーマンスを実現し、2.14%のトレーニング可能なパラメータで既存の言語での性能を向上させることが示されている。

論文の概要: MiLorE-SSL: Scaling Multilingual Capabilities in Self-Supervised Models without Forgetting

関連論文リスト