論文の概要: IR3DE: A Linear Router for Large Language Models
- arxiv url: http://arxiv.org/abs/2606.06098v1
- Date: Thu, 04 Jun 2026 12:36:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.790872
- Title: IR3DE: A Linear Router for Large Language Models
- Title(参考訳): IR3DE: 大規模言語モデルのための線形ルータ
- Authors: Eros Fanì, Oğuzhan Ersoy,
- Abstract要約: IR3DEはRook Regressionベースのドメインエキスパート向けルータで、各プロンプトに対して安価で高速なルーティング決定を提供する。
我々は、全てのドメインに対してタスクが次々に予測される2つの因果言語モデリング(CLM)設定と、各ドメインが独自の推論タスクを持つ1つの推論設定でIR3DEを評価する。
- 参考スコア(独自算出の注目度): 2.1485350418225244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundational Large Language Models (LLMs) demonstrate proficiency on a wide range of general tasks, and achieve remarkable results on various specialized tasks via domain-expert LLMs. With the ever-growing list of available LLMs, inference routers are being proposed to select the most appropriate LLM for each prompt. However, existing routing methods either optimize cost across weak-to-strong generalist LLMs or require substantial training to support domain-expertise routing. In this paper, we propose IR3DE, a Ridge Regression-based Router for Domain Experts that provides cheap and fast routing decisions for each prompt. We evaluate IR3DE in two Causal Language Modeling (CLM) settings where the tasks are next-token prediction for all domains, and one reasoning setting where each domain has its own distinct reasoning task. Despite being a linear router, IR3DE achieves performance comparable to the other baselines in both CLM settings, and surpassing them in the reasoning setting, with a normalized performance of 98.4%. Moreover, IR3DE enables the addition or removal of new domain experts without requiring the router to be retrained from scratch, allowing a dynamic set of LLMs to be served with minimal disruption to the router itself. Our code is available at: github.com/gensyn-ai/IR3DE.
- Abstract(参考訳): 基礎的大規模言語モデル(LLM)は,多種多様な汎用タスクに習熟し,ドメインエキスパート LLM を用いて様々な特殊タスクに顕著な結果をもたらす。
利用可能なLSMのリストは増え続けており、各プロンプトに最適なLSMを選択するために推論ルータが提案されている。
しかし、既存のルーティング手法は、弱い汎用LSMをまたいでコストを最適化するか、ドメインエキスパートルーティングをサポートするためにかなりの訓練を必要とする。
本稿では,リッジ回帰に基づくドメインエキスパート向けルータIR3DEを提案する。
我々は、全てのドメインに対してタスクが次々に予測される2つの因果言語モデリング(CLM)設定と、各ドメインが独自の推論タスクを持つ1つの推論設定でIR3DEを評価する。
線形ルータであるにもかかわらず、IR3DEはCLM設定の両方で他のベースラインに匹敵する性能を達成し、推論設定ではその性能を98.4%の正規化性能で上回っている。
さらにIR3DEは、ルータをスクラッチから再トレーニングすることなく、新しいドメインエキスパートの追加や削除を可能にし、動的にLLMのセットをルータ自体に最小限の破壊を与えることができる。
私たちのコードは、github.com/gensyn-ai/IR3DEで利用可能です。
関連論文リスト
- LatentRouter: Can We Choose the Right Multimodal Model Before Seeing Its Answer? [69.71754384259167]
マルチモーダル大言語モデル(MLLM)は、OCR、チャート理解、空間的推論、視覚的質問応答、コスト、レイテンシにまたがるヘテロジニアスな強度を持つ。
本稿では,MLLMルーティングを実効的マルチモーダルユーティリティ予測として定式化するルータであるLatentを提案する。
MMR-BenchとVL-Benchの実験では、Latentは固定モデル、特徴レベル、学習ルータベースラインよりも優れていた。
論文 参考訳(メタデータ) (2026-05-11T22:42:12Z) - Efficient and Interpretable Multi-Agent LLM Routing via Ant Colony Optimization [58.59491516762626]
マルチエージェントシステム(MAS)のための効率的かつ解釈可能なルーティングフレームワークAMRO-Sを提案する。
AMRO-Sは、意味条件付き経路選択問題としてMASルーティングをモデル化し、3つのキーメカニズムを通してルーティング性能を向上させる。
5つの公開ベンチマークと高速ストレステストによる大規模な実験により、AMRO-Sは強いルーティングベースラインに対する品質-コストトレードオフを一貫して改善することを示した。
論文 参考訳(メタデータ) (2026-03-13T12:26:05Z) - Run, Ruminate, and Regulate: A Dual-process Thinking System for Vision-and-Language Navigation [52.11339614452127]
VLN(Vision-and-Language Navigation)は、エージェントが人間の指示に従って複雑な3D環境を動的に探索する必要がある。
近年の研究では、一般的な知識と一般的な推論能力から、大きな言語モデル(LLM)をVLNに活用する可能性を強調している。
本稿では、LLMの一般化機能とVLN固有の専門知識をゼロショットで統合する、R3と呼ばれる新しいデュアルプロセス思考フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-18T04:32:00Z) - Routesplain: Towards Faithful and Intervenable Routing for Software-related Tasks [35.0568483095689]
本稿では,ソフトウェア関連タスクのための最初のLLMルータであるRoutesplainを紹介する。
既存のルーティングアプローチとは異なり、Routesplainはまず、各クエリから人間解釈可能な概念を抽出する。
我々は,8つのソフトウェア関連タスクにまたがる16の最先端LCM上でのRoutesplainの評価を行った。
論文 参考訳(メタデータ) (2025-11-12T14:42:07Z) - DiSRouter: Distributed Self-Routing for LLM Selections [23.38983740640377]
集中制御から分散ルーティングへ移行する新しいパラダイムであるDiS(Distributed Self-)を紹介する。
DiS では、クエリは LLM エージェントのネットワークを横切り、それぞれが自身の自己認識に基づいて他のエージェントに答えるかどうかを独立に決定する。
大規模な実験により、DiSは様々なシナリオで既存のルーティング方法よりも優れていることが示された。
論文 参考訳(メタデータ) (2025-10-22T03:36:40Z) - Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning [27.70756702796812]
マルチLLMルーティングとアグリゲーションを逐次決定プロセスとして定式化する強化学習フレームワークである textbf Generalization-R1 を提案する。
学習を容易にするために,形式報酬と最終結果報酬と,性能とコストのバランスを最適化するための新たなコスト報酬からなる軽量なルールベース報酬を用いる。
論文 参考訳(メタデータ) (2025-06-10T17:56:45Z) - Universal Model Routing for Efficient LLM Inference [69.86195589350264]
モデルルーティングは,大規模言語モデル(LLM)の推論コストを削減する手法である
動的ルーティング問題に対する新しいアプローチであるUniRouteを提案する。
これらは理論的に最適なルーティングルールの推定であり、過大なリスクバウンドによってそれらのエラーを定量化する。
論文 参考訳(メタデータ) (2025-02-12T20:30:28Z) - Glider: Global and Local Instruction-Driven Expert Router [83.785832410832]
モデルMoErging」手法は、保持タスクのパフォーマンスを犠牲にして、未確認タスクへの一般化を優先する。
マルチスケールルーティング機構を統合したGLIDER(Global and Local Instruction Driven Expert Router)を提案する。
GLIDERは、ホールドアウトタスクの強い一般化を維持しながら、ホールドイン性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-10-09T17:59:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。