論文の概要: Multi-LLM Query Optimization
- arxiv url: http://arxiv.org/abs/2603.24617v1
- Date: Tue, 24 Mar 2026 19:51:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:47.891585
- Title: Multi-LLM Query Optimization
- Title(参考訳): マルチLLMクエリ最適化
- Authors: Arlen Dean, Zijin Zhang, Stefanus Jasin, Yuqing Liu,
- Abstract要約: 我々は、ステートワイドなエラー制約を受ける総クエリコストを最小限に抑える、堅牢でオフラインなクエリ計画問題を定式化する。
本研究は,サロゲート保存コストと真の最適コストとの比が,誤差耐性が小さくなるにつれて1つに収束することを示す。
- 参考スコア(独自算出の注目度): 1.7435005683276596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying multiple large language models (LLMs) in parallel to classify an unknown ground-truth label is a common practice, yet the problem of optimally allocating queries across heterogeneous models remains poorly understood. In this paper, we formulate a robust, offline query-planning problem that minimizes total query cost subject to statewise error constraints which guarantee reliability for every possible ground-truth label. We first establish that this problem is NP-hard via a reduction from the minimum-weight set cover problem. To overcome this intractability, we develop a surrogate by combining a union bound decomposition of the multi-class error into pairwise comparisons with Chernoff-type concentration bounds. The resulting surrogate admits a closed-form, multiplicatively separable expression in the query counts and is guaranteed to be feasibility-preserving. We further show that the surrogate is asymptotically tight at the optimization level: the ratio of surrogate-optimal cost to true optimal cost converges to one as error tolerances shrink, with an explicit rate of $O\left(\log\log(1/α_{\min}) / \log(1/α_{\min})\right)$. Finally, we design an asymptotic fully polynomial-time approximation scheme (AFPTAS) that returns a surrogate-feasible query plan within a $(1+\varepsilon)$ factor of the surrogate optimum.
- Abstract(参考訳): 複数の大規模言語モデル(LLM)を並列にデプロイして未知の基底構造ラベルを分類することは一般的な慣習であるが、不均一なモデル間でクエリを最適に割り当てるという問題はいまだに理解されていない。
本稿では,全ての基幹トラストラベルの信頼性を保証し,全問合せコストを最小化する,ロバストでオフラインな問合せ計画問題を定式化する。
まず、この問題は最小重集合被覆問題からの還元によりNPハードであることが確認される。
この難易度を克服するために、多クラス誤差の結合境界分解とチャーノフ型濃度境界とのペア比較を組み合わせることで、サロゲートを開発する。
結果として得られるサロゲートは、クエリカウントにクローズドな、乗法的に分離可能な式を認め、実行可能性を保存することが保証される。
さらに、サロゲートは最適化レベルで漸近的に厳密であることを示し、サロゲート最適コストと真の最適コストの比率は、エラー耐性が縮小するにつれて1つに収束し、明示レートは$O\left(\log\log(1/α_{\min}) / \log(1/α_{\min})\right)$である。
最後に,サロゲート最適係数(1+\varepsilon)$係数でサロゲート対応クエリ計画を返す漸近完全多項式時間近似スキーム (AFPTAS) を設計する。
関連論文リスト
- The Multi-Query Paradox in Zeroth-Order Optimization [6.777975824808536]
Zeroth-order Alignment (ZO)は、明示的な勾配が利用できない問題に対して強力なフレームワークを提供する。
論文 参考訳(メタデータ) (2025-09-19T03:10:45Z) - A single-loop SPIDER-type stochastic subgradient method for expectation-constrained nonconvex nonsmooth optimization [18.38962516619021]
厳密なペナルティモデルを構築するための新しい手法を提案する。
対象関数と関数の次数と各制約関数値を用いる。
その結果,本手法は2人制約問題よりもはるかに高速であることが判明した。
論文 参考訳(メタデータ) (2025-01-31T15:18:52Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Multi-Agent Bayesian Optimization with Coupled Black-Box and Affine
Constraints [21.38692458445459]
ブラックボックス制約と既知のアフィン制約を結合した分散マルチエージェントベイズ最適化の問題について検討する。
単一エージェントの場合と同様の後悔/違反境界を実現するアルゴリズムが提案されている。
論文 参考訳(メタデータ) (2023-10-02T08:07:36Z) - Universal Online Learning with Gradient Variations: A Multi-layer Online Ensemble Approach [57.92727189589498]
本稿では,2段階の適応性を持つオンライン凸最適化手法を提案する。
我々は$mathcalO(log V_T)$, $mathcalO(d log V_T)$, $hatmathcalO(sqrtV_T)$ regret bounds for strong convex, exp-concave and convex loss function。
論文 参考訳(メタデータ) (2023-07-17T09:55:35Z) - Algorithm for Constrained Markov Decision Process with Linear
Convergence [55.41644538483948]
エージェントは、そのコストに対する複数の制約により、期待される累積割引報酬を最大化することを目的としている。
エントロピー正規化ポリシーとベイダの二重化という2つの要素を統合した新しい双対アプローチが提案されている。
提案手法は(線形速度で)大域的最適値に収束することが示されている。
論文 参考訳(メタデータ) (2022-06-03T16:26:38Z) - Faster Algorithm and Sharper Analysis for Constrained Markov Decision
Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。
新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。
これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文 参考訳(メタデータ) (2021-10-20T02:57:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。