Fugu-MT 論文翻訳(概要): A bi-objective $\epsilon$-constrained framework for quality-cost optimization in language model ensembles

論文の概要: A bi-objective $\epsilon$-constrained framework for quality-cost optimization in language model ensembles

arxiv url: http://arxiv.org/abs/2312.16119v1
Date: Tue, 26 Dec 2023 16:56:22 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-27 14:46:26.377613
Title: A bi-objective $\epsilon$-constrained framework for quality-cost optimization in language model ensembles
Title（参考訳）: 言語モデルアンサンブルの品質コスト最適化のための双方向$\epsilon$-Constrainedフレームワーク
Authors: Aditi Singla, Aditya Singh, Kanishk Kukreja
Abstract要約: 本稿では,多種多様なオープンソースのLarge Language Models (LLM) を用いて,コスト効率を維持しつつ高い応答品質を実現するアンサンブルフレームワークを提案する。品質・コストトレードオフを表すために2目的最適化問題を定式化し, 簡単な0/1knapsack問題に還元する追加の予算制約を導入する。
参考スコア（独自算出の注目度）: 1.5039745292757671
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: We propose an ensembling framework that uses diverse open-sourced Large Language Models (LLMs) to achieve high response quality while maintaining cost efficiency. We formulate a bi-objective optimization problem to represent the quality-cost tradeoff and then introduce an additional budget constraint that reduces the problem to a straightforward 0/1 knapsack problem. We empirically demonstrate that our framework outperforms the existing ensembling approaches in response quality while significantly reducing costs.
Abstract（参考訳）: 本稿では,多種多様なオープンソース大言語モデル(LLM)を用いて,コスト効率を維持しつつ高い応答品質を実現するアンサンブルフレームワークを提案する。品質コストトレードオフを表わすために,二目的最適化問題を定式化し,0/1クナップサック問題に問題を還元する追加予算制約を導入する。当社のフレームワークは,既存のアンサンブルアプローチよりも応答品質が優れ,コストが大幅に削減されていることを実証的に実証した。

関連論文リスト

Controlling Performance and Budget of a Centralized Multi-agent LLM System with Reinforcement Learning [53.57360296655208]
大規模言語モデル(LLM)は、ドメイン間で補完的な強みを示し、様々な推論コストが伴う。既存のアプローチは分散化されたフレームワークに依存しており、入力毎に複数のLSMを呼び出すため、実質的で制御されていない推論コストが発生する。我々は,LLMコントローラが,コスト効率とコスト制御が可能な方法で,専門家モデルのプールを選択的にコーディネートする,集中型マルチLLMフレームワークを提案する。
論文参考訳（メタデータ） (2025-11-04T17:35:17Z)
Universal Dynamic Regret and Constraint Violation Bounds for Constrained Online Convex Optimization [7.798233121583888]
普遍的動的後悔と累積的制約違反境界をもたらす単純なモジュラ構造を持つ2つのアルゴリズムを提案する。我々の結果は、コスト関数と制約関数の両方が敵によって任意に選択される場合に最も一般的な場合において成り立つ。
論文参考訳（メタデータ） (2025-10-02T10:19:16Z)
Aligning LLMs on a Budget: Inference-Time Alignment with Heuristic Reward Models [23.37504394417425]
HIA(Heuristic-Guided Inference-time Alignment)は,軽量プロンプトを用いたチューニング不要でブラックボックス互換のアプローチである。 HIAは1つまたは2つの応答クエリの少ない低推論予算下で有効であることが判明した。
論文参考訳（メタデータ） (2025-08-07T08:54:27Z)
Federated In-Context Learning: Iterative Refinement for Improved Answer Quality [62.72381208029899]
In-context Learning (ICL) では、入力に提供される例を活用することで、パラメータを変更することなく、言語モデルで応答を生成することができる。我々は,反復的協調プロセスを通じてICLを強化する汎用フレームワークであるFederated In-Context Learning (Fed-ICL)を提案する。 Fed-ICLは、クライアントと中央サーバ間のマルチラウンドインタラクションを活用することで、応答を徐々に洗練し、モデルパラメータを送信することなく、応答品質を向上させる。
論文参考訳（メタデータ） (2025-06-09T05:33:28Z)
Regularized infill criteria for multi-objective Bayesian optimization with application to aircraft design [0.565395466029518]
本稿では,SEGOMOEの専門家の混在による超効率的なグローバル最適化を拡張し,制約付き多目的問題の解法を提案する。提案手法の利点は、制約のない既知の多目的ベンチマーク問題に示される。予備的な結果は,関数評価における総コストを,進化的アルゴリズムNSGA-IIと比較して20倍に削減したことを示している。
論文参考訳（メタデータ） (2025-04-11T16:24:40Z)
Efficient First-Order Optimization on the Pareto Set for Multi-Objective Learning under Preference Guidance [41.24995294376129]
ユーザ特定嗜好下での多目的学習は、公正な条件下での多言語音声認識のような実世界の問題で一般的である。我々は,事前定義された選好関数の最適化を目標とする半ベクタリアル二段階最適化問題として,そのような問題をモデル化する。修正された単一レベル問題を解くアルゴリズムを提案し,その収束保証を確立する。
論文参考訳（メタデータ） (2025-03-26T16:41:07Z)
Nash Equilibrium Constrained Auto-bidding With Bi-level Reinforcement Learning [64.2367385090879]
本稿では,プラットフォームの観点から,自動入札問題の新たな定式化を提案する。これは、$epsilon$-NE制約の下ですべての広告主の社会的福祉を最大化することを目的としている。 NCB問題は、その制約された二段階構造と、典型的には多くの広告主が関与しているため、重大な課題を提起している。
論文参考訳（メタデータ） (2025-03-13T12:25:36Z)
Surrogate-assisted multi-objective design of complex multibody systems [1.1650821883155187]
本稿では,サロゲートモデリングと多目的最適化の相反するアプローチを提案する。我々は多目的最適化、サンプリングおよび代理モデリングに関する異なる戦略を比較した。
論文参考訳（メタデータ） (2024-12-19T13:48:49Z)
Robust personalized pricing under uncertainty of purchase probabilities [2.9061423802698565]
予測された購入確率の不確実性を考慮したパーソナライズ価格のロバストな最適化モデルを提案する。また、線形探索と組み合わせたラグランジアン分解アルゴリズムを開発し、大規模最適化問題に対する高品質な解を効率的に見つける。
論文参考訳（メタデータ） (2024-07-22T02:36:19Z)
Evolve Cost-aware Acquisition Functions Using Large Language Models [11.209139558885035]
本稿では,大規模言語モデル (LLM) と進化計算 (EC) を統合する新しいフレームワークであるEvolCAFを紹介する。設計されたコストアウェアAFは、過去のデータ、サロゲートモデル、予算の詳細から利用可能な情報の利用を最大化する。 EIpu と EI-cool の手法は, 人的専門家が設計した手法と比較して, 様々なタスクにまたがる顕著な効率性と一般化を示す。
論文参考訳（メタデータ） (2024-04-25T12:19:18Z)
Hybrid LLM: Cost-Efficient and Quality-Aware Query Routing [53.748685766139715]
大規模言語モデル(LLM)は、ほとんどのNLPタスクで優れていますが、そのサイズのため、デプロイに高価なクラウドサーバも必要です。コスト削減と品質維持のために,それぞれの強みを組み合わせたハイブリッド推論手法を提案する。実験では、反応の品質が低下することなく、最大40%大きなモデルへの呼び出しを削減できます。
論文参考訳（メタデータ） (2024-04-22T23:06:42Z)
Approaching Collateral Optimization for NISQ and Quantum-Inspired Computing [0.0]
担保最適化(Collateral optimization)とは、債務又は担保取引を満たすための金融資産の体系的な配分を指す。一般的な目的の1つは、特定のトランザクションや取引ポートフォリオに関連するリスクを軽減するのに必要な担保コストを最小限にすることである。
論文参考訳（メタデータ） (2023-05-25T18:01:04Z)
Online Learning under Budget and ROI Constraints via Weak Adaptivity [57.097119428915796]
制約付きオンライン学習問題に対する既存の原始双対アルゴリズムは、2つの基本的な仮定に依存している。このような仮定は、標準の原始双対テンプレートを弱適応的後悔最小化器で与えることによって、どのように回避できるのかを示す。上記の2つの前提が満たされていない場合に保証される、世界の最高の保証を証明します。
論文参考訳（メタデータ） (2023-02-02T16:30:33Z)
A Unifying Framework for Online Optimization with Long-Term Constraints [62.35194099438855]
我々は,意思決定者が長期的制約の対象となる一連の意思決定をしなければならないオンライン学習問題について検討する。目標は、全報酬を最大化し、同時に、$T$ラウンド全体で小さな累積違反を達成することである。本稿では,この一般クラス問題に対して,未知のモデルに基づいて報酬と制約が選択された場合と,各ラウンドで敵が選択した場合の双方において,最良世界型アルゴリズムを提示する。
論文参考訳（メタデータ） (2022-09-15T16:59:19Z)
Algorithm for Constrained Markov Decision Process with Linear Convergence [55.41644538483948]
エージェントは、そのコストに対する複数の制約により、期待される累積割引報酬を最大化することを目的としている。エントロピー正規化ポリシーとベイダの二重化という2つの要素を統合した新しい双対アプローチが提案されている。提案手法は(線形速度で)大域的最適値に収束することが示されている。
論文参考訳（メタデータ） (2022-06-03T16:26:38Z)
Online Learning with Knapsacks: the Best of Both Worlds [54.28273783164608]
オンライン学習の課題として,意思決定者が,リソース制約の有限セットに違反することなく,期待する報酬を最大化したい,という課題を提起する。当社のフレームワークは,意思決定者がそのエビデンスを柔軟かつコスト論的に扱えるようにします。
論文参考訳（メタデータ） (2022-02-28T12:10:48Z)
Automatically Learning Compact Quality-aware Surrogates for Optimization Problems [55.94450542785096]
未知パラメータで最適化問題を解くには、未知パラメータの値を予測し、これらの値を用いて問題を解くための予測モデルを学ぶ必要がある。最近の研究によると、複雑なトレーニングモデルパイプラインのレイヤーとして最適化の問題を含めると、観測されていない意思決定の繰り返しを予測することになる。我々は,大規模最適化問題の低次元サロゲートモデルを学習することにより,解の質を向上させることができることを示す。
論文参考訳（メタデータ） (2020-06-18T19:11:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。