論文の概要: Flexible Routing via Uncertainty Decomposition
- arxiv url: http://arxiv.org/abs/2605.07805v1
- Date: Fri, 08 May 2026 14:39:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.121273
- Title: Flexible Routing via Uncertainty Decomposition
- Title(参考訳): 不確実性分解によるフレキシブルルーティング
- Authors: Charlotte Peale, Siddartha Devic, Parikshit Gopalan, Udi Wieder, Aravind Gollakota,
- Abstract要約: 機械学習システムのパフォーマンスとコストのバランスをとるための主要な戦略は、クエリを低コストのモデルか高価なオラクルに動的にルーティングすることだ。
本稿では,不確実なクエリに対する不必要なオラクル呼び出しを回避するための,新しい不確実性対応ルータを提案する。
- 参考スコア(独自算出の注目度): 13.854691350572821
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A key strategy for balancing performance and cost in modern machine learning systems is to dynamically route queries to either a low-cost model or a more expensive oracle (such as a large pretrained model or human expert), an approach known as model routing. In this work we present a new uncertainty-aware router that (1) avoids unnecessary oracle calls on inherently ambiguous queries, and (2) adapts dynamically to different loss functions and cost parameters through simple hyperparameter changes, without retraining. Our method, applicable to any classification setting where multiple independent annotations per input are available, is based on decomposing total uncertainty into irreducible and reducible components using higher-order predictors [Ahdritz et al., 2025]. This enables a unified approach to both routing and abstention: predict with the weak model when uncertainty is low, route to the oracle when reducible uncertainty is high, and abstain when irreducible uncertainty is high. Our router comes with strong theoretical guarantees bounding regret relative to optimal task-specific routers. We conduct experiments on both synthetic and real-world datasets that demonstrate the benefits of our approach in suitable regimes -- in particular, whenever reducible and irreducible uncertainty are not too correlated.
- Abstract(参考訳): 現代の機械学習システムのパフォーマンスとコストのバランスをとるための重要な戦略は、クエリを低コストのモデルまたはより高価なオラクル(大規模な事前訓練されたモデルや人間専門家など)に動的にルーティングすることである。
本研究では,(1)不必要に不明瞭な問合せを回避し,(2)異なる損失関数やコストパラメータに動的に適応する新しい不確実性対応ルータを提案する。
提案手法は,入力毎に複数の独立したアノテーションが利用できる任意の分類設定に適用可能であり,高次予測器 (Ahdritz et al , 2025) を用いて,完全不確かさを既約かつ再現可能なコンポーネントに分解する手法である。
これにより、ルーティングと停止の両方に対する統一的なアプローチが可能となり、不確実性が低い場合の弱いモデル、再現可能な不確実性が高い場合のオラクルへのルート、既約不確実性が高い場合の停止を予測できる。
我々のルータには、最適なタスク固有のルータに対して、後悔を抑える強力な理論的保証が備わっている。
私たちは、適切なレシエーションにおいて、我々のアプローチの利点を示す合成データセットと実世界のデータセットの両方で実験を行います。
関連論文リスト
- Efficient and Interpretable Multi-Agent LLM Routing via Ant Colony Optimization [58.59491516762626]
マルチエージェントシステム(MAS)のための効率的かつ解釈可能なルーティングフレームワークAMRO-Sを提案する。
AMRO-Sは、意味条件付き経路選択問題としてMASルーティングをモデル化し、3つのキーメカニズムを通してルーティング性能を向上させる。
5つの公開ベンチマークと高速ストレステストによる大規模な実験により、AMRO-Sは強いルーティングベースラインに対する品質-コストトレードオフを一貫して改善することを示した。
論文 参考訳(メタデータ) (2026-03-13T12:26:05Z) - ODAR: Principled Adaptive Routing for LLM Reasoning via Active Inference [60.958331943869126]
ODAR-Expertは、原則化されたリソース割り当てによる精度と効率のトレードオフを最適化する適応的なルーティングフレームワークである。
我々は、MATHの98.2%の精度、HumanityのLast Examの54.8%を含む、強く一貫した利得を示している。
論文 参考訳(メタデータ) (2026-02-27T05:22:01Z) - How Robust Are Router-LLMs? Analysis of the Fragility of LLM Routing Capabilities [62.474732677086855]
大規模言語モデル(LLM)ルーティングは,計算コストと性能のバランスをとる上で重要な戦略である。
DSCベンチマークを提案する: Diverse, Simple, and Categorizedは、幅広いクエリタイプでルータのパフォーマンスを分類する評価フレームワークである。
論文 参考訳(メタデータ) (2025-03-20T19:52:30Z) - Stochastic Linear Bandits with Latent Heterogeneity [8.981251210938787]
本稿では、この未観測不均一性を顧客応答で明示的にモデル化する、新しい遅延不均一バンディットフレームワークを提案する。
本手法では,グループメンバシップとグループ固有報酬関数を同時に学習する革新的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-01T13:02:21Z) - Online Learning under Budget and ROI Constraints via Weak Adaptivity [57.097119428915796]
制約付きオンライン学習問題に対する既存の原始双対アルゴリズムは、2つの基本的な仮定に依存している。
このような仮定は、標準の原始双対テンプレートを弱適応的後悔最小化器で与えることによって、どのように回避できるのかを示す。
上記の2つの前提が満たされていない場合に保証される、世界の最高の保証を証明します。
論文 参考訳(メタデータ) (2023-02-02T16:30:33Z) - Improve Noise Tolerance of Robust Loss via Noise-Awareness [60.34670515595074]
本稿では,NARL-Adjuster(NARL-Adjuster for brevity)と呼ばれる,ハイパーパラメータ予測関数を適応的に学習するメタラーニング手法を提案する。
4つのSOTAロバストな損失関数を我々のアルゴリズムに統合し,提案手法の一般性および性能をノイズ耐性と性能の両面で検証した。
論文 参考訳(メタデータ) (2023-01-18T04:54:58Z) - Robust Neural Regression via Uncertainty Learning [5.654198773446211]
ディープニューラルネットワークは不確実性を過小評価し、過度に自信を持って予測する傾向がある。
一般化線形回帰法において、時間的反復重み付き最小二乗(IRLS)を拡張して簡単な解を提案する。
我々は2つのサブネットワークを用いて予測と不確実性推定をパラメトリズし、複雑な入力と非線形応答を容易に扱えるようにした。
論文 参考訳(メタデータ) (2021-10-12T23:19:13Z) - Online Optimization and Ambiguity-based Learning of Distributionally Uncertain Dynamic Systems [1.6709415233613623]
本稿では,分散的に不確実な力学系のクラスを対象とする最適化問題 (P) に対して,データ駆動型オンラインソリューションを構築するための新しい手法を提案する。
導入されたフレームワークは、パラメータ化された制御依存のあいまいさセットを通じて、分散システムの不確実性の同時学習を可能にする。
また、Nesterovの高速化段階アルゴリズムのオンライン版を導入し、その性能を分析して、分散性理論を用いてこの問題のクラスを解く。
論文 参考訳(メタデータ) (2021-02-18T01:49:06Z) - Learning Adaptive Loss for Robust Learning with Noisy Labels [59.06189240645958]
ロバスト損失は、堅牢な学習問題を扱うための重要な戦略である。
本稿では,強靭なハイパーチューニングが可能なメタ学習手法を提案する。
4種類のSOTA損失関数は, 最小化, 一般利用, 有効性を示す。
論文 参考訳(メタデータ) (2020-02-16T00:53:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。