論文の概要: Efficient Ensemble Selection from Binary and Pairwise Feedback
- arxiv url: http://arxiv.org/abs/2605.09588v1
- Date: Sun, 10 May 2026 15:01:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.324019
- Title: Efficient Ensemble Selection from Binary and Pairwise Feedback
- Title(参考訳): バイナリとペアワイズフィードバックからの効率的なアンサンブル選択
- Authors: Tzeh Yuan Neoh, Nicholas Teh, Je Qin Chooi, Paul W. Goldberg, Milind Tambe,
- Abstract要約: マルチウィンナー投票の分布変種として選択問題を考察する。
我々は、正しい/間違った結果のタスクに対する二項フィードバックと、候補出力を優先的に比較したタスクに対するペアフィードバックの両方を解析する。
本稿では,全情報最適化はPTASを許容するが,Gap-ETHの下ではEPPTASを含まないことを示し,目的はモノトーンだが部分モジュラーではないことを示す。
- 参考スコア(独自算出の注目度): 32.05855919168298
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Organizations increasingly deploy multiple AI systems across task domains, but selecting a small, high-performing ensemble can require costly model calls, benchmark runs, and human evaluation. We study this selection problem as a distributional variant of multiwinner voting: tasks are drawn from an unknown domain distribution, each task induces feedback over candidate experts, and a committee's value on a task is determined by its best-performing member. We analyze both binary feedback, for tasks with correct/incorrect outcomes, and pairwise feedback, for tasks where candidate outputs are compared by preference. In the binary setting, the induced objective is coverage. We give exhaustive-elicitation baselines and matching worst-case query lower bounds, and we design a failure-conditioned greedy algorithm that preserves the standard $(1-1/e)$ guarantee while obtaining instance-dependent query savings. In the pairwise setting, we study $θ$-winning committees. We show that full-information optimization admits a PTAS but no EPTAS under Gap-ETH, and that the objective is monotone but not submodular. This motivates a weighted ordinal coverage relaxation, which is submodular and supports a failure-conditioned greedy oracle under pairwise feedback. We then convert this oracle back into $θ$-type guarantees through finite-family auditing or a minimax wrapper. We also provide small-scale LLM experiments illustrating the predicted query savings and the role of complementarity in committee selection.
- Abstract(参考訳): 組織はタスクドメインにまたがって複数のAIシステムをデプロイする傾向にあるが、小型で高性能なアンサンブルを選択するには、コストのかかるモデルコール、ベンチマーク実行、人的評価が必要になる。
この選択問題を,未知の領域分布からタスクを抽出し,各タスクが候補とする専門家に対するフィードバックを誘導し,そのタスクに対する委員会の価値は,その最も優れたメンバによって決定される。
我々は、正しい/間違った結果のタスクに対する二項フィードバックと、候補出力を優先的に比較したタスクに対するペアフィードバックの両方を解析する。
バイナリ設定では、誘導対象はカバレッジである。
我々は,インスタンスに依存したクエリセーブを得ながら,標準値(1-1/e)の保証を保った,エラー条件付きグレディアルゴリズムを設計する。
ペアワイズ環境では、$θ$-winning Committeesを調査する。
本稿では,全情報最適化はPTASを許容するが,Gap-ETHの下ではEPPTASを含まないことを示し,目的はモノトーンだが部分モジュラーではないことを示す。
これは重み付けされた順序付きカバレッジ緩和を動機付け、これはサブモジュラーであり、ペアのフィードバックの下で故障条件付きグリーディオラクルをサポートする。
次に、このオラクルを有限家族監査やミニマックスラッパーを通じて$θ$-typeの保証に戻す。
また、予測されたクエリの節約と、委員会選択における相補性の役割を実証する小規模なLCM実験も提供する。
関連論文リスト
- Budget-Aware Routing for Long Clinical Text [8.474809035213118]
大きな言語モデルの大きな課題は、クエリ毎のトークンコストとデプロイメント全体のコストです。
文書単位のサブセットが厳格なトークン予算の下で選択される、予算付きコンテキスト選択について検討する。
関連性,カバレッジ,多様性のバランスをとるモノトンサブモジュラー目的のtextbfRCD を提案する。
論文 参考訳(メタデータ) (2026-05-01T01:34:53Z) - $V_1$: Unifying Generation and Self-Verification for Parallel Reasoners [69.66089681814013]
$V_$は、効率的なペアワイドランキングを通じて生成と検証を統合するフレームワークである。
V_$-Inferはポイントワイド検証でPass@1を最大10%改善する。
V_$-PairRLは、標準のRLとポイントワイドのジョイントトレーニングよりも、テストタイムのスケーリングが7ドル--9%で向上する。
論文 参考訳(メタデータ) (2026-03-04T17:22:16Z) - One-Stage Top-$k$ Learning-to-Defer: Score-Based Surrogates with Theoretical Guarantees [6.792743621449621]
最初の1段階のTop-k$ Learning-to-Deferフレームワークを紹介します。
我々は、最もコスト効率の良いエンティティラベルや専門家1人当たりのインプットを$k$で選択するスコアベースの共有モデルを学ぶ。
CIFAR-10とSVHNの実験により、我々の1段階のTop-$k$法がTop-1deferralを厳密に上回っていることを確認した。
論文 参考訳(メタデータ) (2025-05-15T10:41:16Z) - Training Greedy Policy for Proposal Batch Selection in Expensive Multi-Objective Combinatorial Optimization [52.80408805368928]
本稿では,バッチ取得のための新しいグリーディ型サブセット選択アルゴリズムを提案する。
赤蛍光タンパク質に関する実験により,提案手法は1.69倍少ないクエリでベースライン性能を達成できることが判明した。
論文 参考訳(メタデータ) (2024-06-21T05:57:08Z) - Active Ranking of Experts Based on their Performances in Many Tasks [72.96112117037465]
我々は、dタスクのパフォーマンスに基づいて、n名のエキスパートをランク付けする問題を考察する。
我々は,各専門家のペアに対して,各タスクにおいて他方よりも優れているという,単調な仮定を定めている。
論文 参考訳(メタデータ) (2023-06-05T06:55:39Z) - Robust Subset Selection by Greedy and Evolutionary Pareto Optimization [23.0838604893412]
サブセット選択は、ある目的関数を最大化するために、グラウンドセットからサブセットを選択することを目的としている。
グリーディアルゴリズムは1-e-betagamma$の近似比を得ることができ、$beta$と$gamma$は対象関数の相関と部分モジュラリティ比である。
論文 参考訳(メタデータ) (2022-05-03T11:00:54Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z) - A Provably Efficient Sample Collection Strategy for Reinforcement
Learning [123.69175280309226]
オンライン強化学習(RL)における課題の1つは、エージェントがその振る舞いを最適化するために、環境の探索とサンプルの活用をトレードオフする必要があることである。
1) 生成モデル(環境のスパースシミュレータなど)にアクセス可能な状態のサンプル数を規定する「対象別」アルゴリズム,2) 所定のサンプルをできるだけ早く生成する「対象別」サンプル収集。
論文 参考訳(メタデータ) (2020-07-13T15:17:35Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。