論文の概要: Learning to Route LLMs from Implicit Cost-Performance Preferences via Meta-Learning
- arxiv url: http://arxiv.org/abs/2606.06178v1
- Date: Thu, 04 Jun 2026 13:53:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.83148
- Title: Learning to Route LLMs from Implicit Cost-Performance Preferences via Meta-Learning
- Title(参考訳): メタラーニングによる不必要なコストパフォーマンス選好からのLCMの経路学習
- Authors: Jiahao Zeng, Ming Tang, Ningning Ding,
- Abstract要約: 大規模言語モデル(LLM)は、パフォーマンスとコストのトレードオフを示し、より強力なモデルによってコストが増大する。
既存の手法は、異なるユーザコストパフォーマンスの好みに対してうまく機能しない。
本稿では,パーソナライズおよびユーザ中心のコストパフォーマンス最適化のための新しいLLMルーティングパラダイムを提案する。
- 参考スコア(独自算出の注目度): 8.795547377156174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) present a trade-off between performance and cost, where more powerful models incur greater expense. LLM routing aims to mitigate expenses while maintaining performance by sending queries to the most suitable model. However, existing methods cannot perform well for different user cost-performance preferences. To address this gap, we introduce a novel perceptive LLM routing paradigm for personalized and user-centric cost-performance optimization, which efficiently learns users' implicit preferences through little interaction. To handle the challenge of heterogeneous user needs, we formulate preference profiles as a set of distinct tasks in contextual bandit and propose MetaRouter, a meta-learning framework designed for preference-aware LLM routing. Experimental results show that MetaRouter outperforms strong baselines on both in-distribution and out-of-distribution tasks. Furthermore, it exhibits high efficiency in learning user preferences, robustness to changes in the routable LLMs, and scalability to multi-model routing.
- Abstract(参考訳): 大規模言語モデル(LLM)は、パフォーマンスとコストのトレードオフを示し、より強力なモデルによってコストが増大する。
LLMルーティングは、最も適切なモデルにクエリを送信することで、パフォーマンスを維持しながら、コストを軽減することを目的としている。
しかし,既存の手法では,コスト・パフォーマンスの異なる方法ではうまく動作しない。
このギャップに対処するために、パーソナライズされた、ユーザ中心のコストパフォーマンス最適化のための、新しいパーセプティブなLLMルーティングパラダイムを導入し、インタラクションを少なくすることで、ユーザの暗黙の好みを効率的に学習する。
不均一なユーザニーズに対処するために、コンテキスト的帯域幅の異なるタスクの集合として好みプロファイルを定式化し、好みを意識したLLMルーティング用に設計されたメタラーニングフレームワークであるMetaRouterを提案する。
実験結果から,MetaRouterは分布内および分布外の両方において高いベースラインを達成できた。
さらに、ユーザ好みの学習や、ルタブルなLLMの変更に対する堅牢性、マルチモデルルーティングへのスケーラビリティなどにおいて、高い効率性を示す。
関連論文リスト
- Efficient and Interpretable Multi-Agent LLM Routing via Ant Colony Optimization [58.59491516762626]
マルチエージェントシステム(MAS)のための効率的かつ解釈可能なルーティングフレームワークAMRO-Sを提案する。
AMRO-Sは、意味条件付き経路選択問題としてMASルーティングをモデル化し、3つのキーメカニズムを通してルーティング性能を向上させる。
5つの公開ベンチマークと高速ストレステストによる大規模な実験により、AMRO-Sは強いルーティングベースラインに対する品質-コストトレードオフを一貫して改善することを示した。
論文 参考訳(メタデータ) (2026-03-13T12:26:05Z) - PersonalizedRouter: Personalized LLM Routing via Graph-based User Preference Modeling [21.94491843046055]
多様なユーザプロファイルをモデル化し,パーソナライズされたLLM選択を行うグラフベースのフレームワークであるPersonalizedを提案する。
ユーザクエリと最適なLLM間のコンテキスト情報をキャプチャするために、Personalizedはインタラクションデータを異種グラフに変換する。
実験の結果,パーソナライズドは既存のLCM選択法よりも有意に優れていた。
論文 参考訳(メタデータ) (2025-11-21T01:19:34Z) - xRouter: Training Cost-Aware LLMs Orchestration System via Reinforcement Learning [104.63494870852894]
我々は,学習したルータが直接応答するか,あるいは1つ以上の外部モデルを呼び出すことができるツールコールベースのルーティングシステム x を提案する。
当社の実装には、報酬とコスト会計を含む、完全な強化学習フレームワークが含まれています。
さまざまなベンチマークで、xはコストパフォーマンスのトレードオフを強く達成します。
論文 参考訳(メタデータ) (2025-10-09T16:52:01Z) - Learning to Route LLMs from Bandit Feedback: One Policy, Many Trade-offs [69.2486294522259]
BaRPはBandit Routing-feedback with Preferencesアプローチであり、デプロイと同じ部分フィードバック制限の下でトレーニングされる。
提案手法は,学習中のオンラインフィードバック設定をシミュレートし,新たなプロンプトに適応する。
論文 参考訳(メタデータ) (2025-10-08T18:24:59Z) - RadialRouter: Structured Representation for Efficient and Robust Large Language Models Routing [27.481573948464987]
Radialは、大規模言語モデルのルーティングのための新しいフレームワークである。
RadialFormerという名前のラジアル構造を持つ軽量なTransformerベースのバックボーンを使用して、クエリとLLMの関係を明確にする。
バランシングとコストファーストのシナリオでは、既存のルーティングメソッドの9.2%と5.8%を大きく上回っている。
論文 参考訳(メタデータ) (2025-06-04T12:16:41Z) - LightRouter: Towards Efficient LLM Collaboration with Minimal Overhead [19.573553157421774]
Lightは、より大きなプールからLLMの小さなサブセットを体系的に選択、統合するために設計された新しいフレームワークである。
実験によると、光は広く使われているアンサンブルのベースラインと一致し、25%の精度向上を実現している。
本研究は、効率的なLCM選択のための実践的なアプローチを導入し、モデル組み合わせのための最適な戦略に関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2025-05-22T04:46:04Z) - Universal Model Routing for Efficient LLM Inference [69.86195589350264]
モデルルーティングは,大規模言語モデル(LLM)の推論コストを削減する手法である
動的ルーティング問題に対する新しいアプローチであるUniRouteを提案する。
これらは理論的に最適なルーティングルールの推定であり、過大なリスクバウンドによってそれらのエラーを定量化する。
論文 参考訳(メタデータ) (2025-02-12T20:30:28Z) - LLM Bandit: Cost-Efficient LLM Generation via Preference-Conditioned Dynamic Routing [3.090041654375235]
本稿では, LLM選択過程を多武装バンディット問題として定式化する新しい枠組みを提案する。
提案手法は好み条件付き動的ルーティング機構を組み込んでおり、ユーザーは推論時に好みを指定できる。
提案手法は,LLMプラットフォーム間での精度とコスト効率の両立を実現している。
論文 参考訳(メタデータ) (2025-02-04T22:09:43Z) - CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing [74.14816777318033]
Token-lEvel Routing(CITER)との協調推論は、小規模および大規模言語モデルの効率的な協調を可能にするフレームワークである。
ルータの学習をポリシー最適化として定式化し、予測の質と生成の推論コストの両方に基づいて報酬を受け取る。
実験の結果,CITERは高品質な生成を保ちながら推論コストを低減し,リアルタイムおよびリソース制約のあるアプリケーションに対して有望なソリューションを提供することがわかった。
論文 参考訳(メタデータ) (2025-02-04T03:36:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。