論文の概要: Adaptive Combinatorial Experimental Design: Pareto Optimality for Decision-Making and Inference
- arxiv url: http://arxiv.org/abs/2602.24231v1
- Date: Fri, 27 Feb 2026 17:58:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.548378
- Title: Adaptive Combinatorial Experimental Design: Pareto Optimality for Decision-Making and Inference
- Title(参考訳): Adaptive Combinatorial Experimental Design: Pareto Optimality for Decision-Making and Inference
- Authors: Hongrui Xie, Junyu Cao, Kan Xu,
- Abstract要約: われわれは,多武装バンディット(CMAB)における後悔と統計的パワーのトレードオフに着目した適応型実験設計に関する最初の研究を行った。
情報構造が異なる2つのケースに対して,MixCombKLとMixCombUCBの2つのアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 2.9618272039677667
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we provide the first investigation into adaptive combinatorial experimental design, focusing on the trade-off between regret minimization and statistical power in combinatorial multi-armed bandits (CMAB). While minimizing regret requires repeated exploitation of high-reward arms, accurate inference on reward gaps requires sufficient exploration of suboptimal actions. We formalize this trade-off through the concept of Pareto optimality and establish equivalent conditions for Pareto-efficient learning in CMAB. We consider two relevant cases under different information structures, i.e., full-bandit feedback and semi-bandit feedback, and propose two algorithms MixCombKL and MixCombUCB respectively for these two cases. We provide theoretical guarantees showing that both algorithms are Pareto optimal, achieving finite-time guarantees on both regret and estimation error of arm gaps. Our results further reveal that richer feedback significantly tightens the attainable Pareto frontier, with the primary gains arising from improved estimation accuracy under our proposed methods. Taken together, these findings establish a principled framework for adaptive combinatorial experimentation in multi-objective decision-making.
- Abstract(参考訳): 本稿では,組合せ多重武装バンドイット(CMAB)における後悔最小化と統計的パワーのトレードオフに着目し,適応的組合せ実験設計に関する最初の研究を行う。
後悔を最小限に抑えるには、高返りの腕を何度も搾取する必要があるが、報酬のギャップを正確に推測するには、適切な準最適行動の探索が必要である。
我々は,このトレードオフをパレート最適性の概念で定式化し,CMABにおけるパレート効率学習の等価条件を確立する。
情報構造が異なる場合、すなわち、全帯域フィードバックと半帯域フィードバックの2つのケースを検討し、これら2つのケースに対して、MixCombKLとMixCombUCBの2つのアルゴリズムを提案する。
両アルゴリズムがパレート最適であることを示す理論的保証を提供する。
さらに,よりリッチなフィードバックによって達成可能なパレートフロンティアが大幅に強化され,提案手法による推定精度の向上による主な利得が得られた。
これらの知見を総合して,多目的意思決定における適応的組合せ実験の原則的枠組みを確立した。
関連論文リスト
- Exploration-free Algorithms for Multi-group Mean Estimation [7.480522058240762]
提案手法は,複数グループにまたがる有限サンプリング予算を割り当てて,その平均を均一に正確に推定する多群平均推定の問題に対処する。
この設定における最適な割り当ては、$Theta(T)$ timesの順序ですべてのグループをサンプリングする必要がある。
論文 参考訳(メタデータ) (2025-10-12T00:20:30Z) - COM-BOM: Bayesian Exemplar Search for Efficiently Exploring the Accuracy-Calibration Pareto Frontier [12.261526989434282]
先行探索法は予測精度とモデル校正を狭義に最適化する。
本稿では,予測精度の決定値とキャリブレーション誤差の最小化の両方を対象とする多目的最適化問題を定式化する。
その結果,COM-BOMは2つの目的を協調的に最適化する上で,ベースラインに打ち勝つか一致することがわかった。
論文 参考訳(メタデータ) (2025-10-01T17:57:49Z) - FACTORS: Factorial Approximation for Complementary Two-factor Optimization with Risk-aware Scoring [0.0]
FACTORSは、実験の設計とShapley分解を組み合わせることで、パフォーマンスと安定性の問題に対処するフレームワークである。
我々のアプローチは、主効果と2要素相互作用を常に推定し、それらをリスク調整対象関数に統合する。
論文 参考訳(メタデータ) (2025-09-13T14:44:45Z) - Risk-Averse Best Arm Set Identification with Fixed Budget and Fixed Confidence [0.4199844472131922]
本稿では,期待報酬の最大化と関連する不確実性の最小化に対処するバンディット最適化における新たな問題設定を提案する。
固定信頼と固定最適体制の両方の下で動作可能な統一的メタ予算ゴリトミックフレームワークを提案する。
提案手法は,精度と試料効率の両面で既存手法より優れている。
論文 参考訳(メタデータ) (2025-06-27T14:21:03Z) - Stochastic Primal-Dual Double Block-Coordinate for Two-way Partial AUC Maximization [45.99743804547533]
2方向部分AUCAUCは、不均衡なデータを持つバイナリ分類における重要な性能指標である。
TPAUC最適化のための既存のアルゴリズムは未探索のままである。
TPAUC最適化のための2つの革新的な二重座標ブロック座標アルゴリズムを導入する。
論文 参考訳(メタデータ) (2025-05-28T03:55:05Z) - Towards Optimal Multi-draft Speculative Decoding [102.67837141152232]
MDSD(Multi-Draft Speculative Decoding)は、各トークンを生成する際に、小さなドラフトモデルで複数のドラフトを生成する手法である。
本稿では、最適輸送問題の双対性について論じ、最適受容率を効率的に計算する方法を提供する。
論文 参考訳(メタデータ) (2025-02-26T03:22:44Z) - Optimal Adaptive Experimental Design for Estimating Treatment Effect [14.088972921434761]
本稿では,治療効果を推定する際の最適精度を決定するための基本的な問題に対処する。
二重ロバストな手法の概念を逐次実験設計に取り入れることで、最適推定問題をオンラインバンディット学習問題としてモデル化する。
本稿では,バンディットアルゴリズム設計と適応統計的推定の両方のツールとアイデアを用いて,一般的な低スイッチング適応実験フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-07T23:22:51Z) - Best Arm Identification with Minimal Regret [55.831935724659175]
最高の腕識別問題 優雅にアマルガメートは、最小化とBAIを後悔している。
エージェントの目標は、所定の信頼度で最高の腕を特定することである。
二重KL-UCBアルゴリズムは、信頼度がゼロになる傾向があるため、最適性を達成する。
論文 参考訳(メタデータ) (2024-09-27T16:46:02Z) - Tight Guarantees for Interactive Decision Making with the
Decision-Estimation Coefficient [51.37720227675476]
我々は、決定推定係数の新たな変種を導入し、それを用いて、3つの面における事前の作業を改善する新しい下界を導出する。
我々は同じ量でスケールした後悔について上界を与え、フォスター等における上界と下界の間のギャップの1つを除いて全てを閉じる。
この結果は、後悔のフレームワークとPACフレームワークの両方に適用され、我々が期待するいくつかの新しい分析とアルゴリズム設計技術を利用して、より広範な利用が期待できる。
論文 参考訳(メタデータ) (2023-01-19T18:24:08Z) - When AUC meets DRO: Optimizing Partial AUC for Deep Learning with
Non-Convex Convergence Guarantee [51.527543027813344]
単方向および二方向部分AUC(pAUC)の系統的および効率的な勾配法を提案する。
一方通行と一方通行の pAUC に対して,2つのアルゴリズムを提案し,それぞれ2つの定式化を最適化するための収束性を証明した。
論文 参考訳(メタデータ) (2022-03-01T01:59:53Z) - A Unified Framework for Multi-distribution Density Ratio Estimation [101.67420298343512]
バイナリ密度比推定(DRE)は多くの最先端の機械学習アルゴリズムの基礎を提供する。
ブレグマン最小化の発散の観点から一般的な枠組みを開発する。
我々のフレームワークはバイナリDREでそれらのフレームワークを厳格に一般化する手法に導かれることを示す。
論文 参考訳(メタデータ) (2021-12-07T01:23:20Z) - An Empirical Study of Assumptions in Bayesian Optimisation [61.19427472792523]
本研究では,ベイズ最適化に固有の従来的および非慣習的仮定を厳密に分析する。
超パラメータチューニングタスクの大多数は、不均一性と非定常性を示すと結論付けている。
これらの発見が実践者およびこの分野のさらなる研究の指針となることを願っている。
論文 参考訳(メタデータ) (2020-12-07T16:21:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。