論文の概要: Continual Model Routing in Evolving Model Hubs
- arxiv url: http://arxiv.org/abs/2605.28577v1
- Date: Wed, 27 May 2026 15:00:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.135487
- Title: Continual Model Routing in Evolving Model Hubs
- Title(参考訳): 進化するモデルハブにおける連続的モデルルーティング
- Authors: Jack Bell, Giacomo Carfì, Gerlando Gramaglia, Vincenzo Lomonaco,
- Abstract要約: 連続モデルルーティング(CMR)は、現実的なハブ拡張をシミュレートする大規模なベンチマークである。
CarvEは、チェックポイントベースのアンカーと構造化されたリプレイによる効率的な連続モデルルーティングのための対照的な埋め込みアプローチである。
CARvEは、モデル、ファミリー、ドメインレベルの精度においてゼロショット検索、微調整、およびアダプタマージベースラインを著しく上回る。
- 参考スコア(独自算出の注目度): 3.139117990484874
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI model hubs provide access to a rapidly growing collection of powerful pre-trained models, enabling off-the-shelf mixture-of-experts systems with different routing strategies. However, this rapid growth poses two fundamental challenges: scaling model selection across thousands of experts and continually updating routing mechanisms as new models and tasks are introduced. In this paper, we formalise this setting as Continual Model Routing (CMR) and propose CMRBench, a new large-scale benchmark simulating realistic hub expansion and including over 2,000 candidate models. Finally, we introduce CARvE, a contrastive embedding approach for efficient continual model routing via checkpoint-based anchoring and structured replay. Extensive empirical results and ablations show that CARvE significantly outperforms zero-shot retrieval, fine-tuning, and adapter-merging baselines in model, family, and domain-level accuracy.
- Abstract(参考訳): AIモデルハブは、急速に成長する強力なトレーニング済みモデルの集合へのアクセスを提供し、異なるルーティング戦略を備えた既成の混合システムを可能にする。
しかし、この急速な成長は、何千もの専門家にまたがるモデル選択のスケーリングと、新しいモデルやタスクが導入されるにつれて、ルーティングメカニズムの継続的な更新という、2つの根本的な課題をもたらす。
本稿では,この設定をCMR(Continuous Model Routing)として定式化し,2000以上の候補モデルを含む,現実的なハブ展開をシミュレートした新しい大規模ベンチマークであるCMRBenchを提案する。
最後に、チェックポイントベースのアンカーと構造化リプレイによる効率的な連続モデルルーティングのためのコントラスト埋め込みアプローチであるCARvEを紹介する。
CARvEは, モデル, ファミリー, ドメインレベルの精度において, ゼロショット検索, 微調整, アダプタマージベースラインを著しく上回っている。
関連論文リスト
- Bending the Scaling Law Curve in Large-Scale Recommendation Systems [25.722146264492096]
提案するULTRA-HSTUは,エンド・ツー・エンド・エンド・モデルとシステム共同設計によって開発された新しいシーケンシャル・レコメンデーション・モデルである。
私たちのソリューションは大規模にデプロイされており、毎日数十億のユーザにサービスを提供しています。
論文 参考訳(メタデータ) (2026-02-19T01:15:17Z) - Merge and Guide: Unifying Model Merging and Guided Decoding for Controllable Multi-Objective Generation [49.98025799046136]
Merge-And-GuidEは、ガイド付きデコーディングにモデルマージを利用する2段階のフレームワークである。
ステージ1では、MAGEはガイダンスとベースモデルの互換性の問題を解決する。
ステージ2では、明示的で暗黙的な値モデルを統一的なガイダンスプロキシにマージします。
論文 参考訳(メタデータ) (2025-10-04T11:10:07Z) - Merging Models on the Fly Without Retraining: A Sequential Approach to Scalable Continual Model Merging [75.93960998357812]
ディープモデルマージ(Deep Modelmerging)は、複数の微調整モデルを組み合わせて、さまざまなタスクやドメインにまたがる能力を活用する、新たな研究方向を示すものだ。
現在のモデルマージ技術は、全ての利用可能なモデルを同時にマージすることに集中しており、重量行列に基づく手法が主要なアプローチである。
本稿では,モデルを逐次処理するトレーニングフリーなプロジェクションベース連続マージ手法を提案する。
論文 参考訳(メタデータ) (2025-01-16T13:17:24Z) - EMR-Merging: Tuning-Free High-Performance Model Merging [55.03509900949149]
Elect, Mask & Rescale-Merging (EMR-Merging) は既存のマージ手法と比較して優れた性能を示した。
EMR-Mergingはチューニング不要なので、データアベイラビリティや追加のトレーニングは必要ありません。
論文 参考訳(メタデータ) (2024-05-23T05:25:45Z) - Federated Topic Model and Model Pruning Based on Variational Autoencoder [14.737942599204064]
フェデレートされたトピックモデリングにより、複数のパーティがデータのプライバシを保護しながらモデルを共同でトレーニングできる。
本稿では,各ノードのプライバシを確保しつつ,フェデレートされたトピックモデルを確立する手法を提案し,ニューラルネットワークモデルプルーニングを用いてモデルを高速化する。
実験結果から,フェデレートされたトピックモデルプルーニングは,モデルの性能を確保しつつ,モデルのトレーニング速度を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-11-01T06:00:14Z) - Contextually Enhanced ES-dRNN with Dynamic Attention for Short-Term Load
Forecasting [1.1602089225841632]
提案手法は,コンテキストトラックとメイントラックという,同時に訓練された2つのトラックから構成される。
RNNアーキテクチャは、階層的な拡張を積み重ねた複数の繰り返し層で構成され、最近提案された注意的再帰細胞を備えている。
このモデルは点予測と予測間隔の両方を生成する。
論文 参考訳(メタデータ) (2022-12-18T07:42:48Z) - DAIS: Automatic Channel Pruning via Differentiable Annealing Indicator
Search [55.164053971213576]
畳み込みニューラルネットワークは,計算オーバーヘッドが大きいにもかかわらず,コンピュータビジョンタスクの実行において大きな成功を収めている。
構造的(チャネル)プルーニングは、通常、ネットワーク構造を保ちながらモデルの冗長性を低減するために適用される。
既存の構造化プルーニング法では、手作りのルールが必要であり、これは大きなプルーニング空間に繋がる可能性がある。
論文 参考訳(メタデータ) (2020-11-04T07:43:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。