論文の概要: Replicable Constrained Bandits
- arxiv url: http://arxiv.org/abs/2602.14580v1
- Date: Mon, 16 Feb 2026 09:22:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:50.348934
- Title: Replicable Constrained Bandits
- Title(参考訳): Replicable Constrained Bandits
- Authors: Matteo Bollini, Gianmarco Genalti, Francesco Emanuele Stradi, Matteo Castiglioni, Alberto Marchesi,
- Abstract要約: 説明可能なオンライン学習アルゴリズムは、同じ環境で異なる実行をまたいで同じ一連の決定を、高い確率で行うアルゴリズムである。
再現性のあるアルゴリズムを設計し, 後悔と制約違反は, 複製不可能なアルゴリズムとT$で一致させる。
これらの保証に向けた重要なステップとして、インフン制約MABのための最初の複製可能なUPBライクなアルゴリズムを開発する。
- 参考スコア(独自算出の注目度): 27.71248958698115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Algorithmic \emph{replicability} has recently been introduced to address the need for reproducible experiments in machine learning. A \emph{replicable online learning} algorithm is one that takes the same sequence of decisions across different executions in the same environment, with high probability. We initiate the study of algorithmic replicability in \emph{constrained} MAB problems, where a learner interacts with an unknown stochastic environment for $T$ rounds, seeking not only to maximize reward but also to satisfy multiple constraints. Our main result is that replicability can be achieved in constrained MABs. Specifically, we design replicable algorithms whose regret and constraint violation match those of non-replicable ones in terms of $T$. As a key step toward these guarantees, we develop the first replicable UCB-like algorithm for \emph{unconstrained} MABs, showing that algorithms that employ the optimism in-the-face-of-uncertainty principle can be replicable, a result that we believe is of independent interest.
- Abstract(参考訳): Algorithmic \emph{replicability}が最近導入され、機械学習における再現可能な実験の必要性に対処している。
emph{replicable online learning}アルゴリズムは、同じ環境で異なる実行をまたいで同じ一連の決定を、高い確率で行うアルゴリズムである。
我々は,学習者が未知の確率環境と相互作用し,報酬を最大化するだけでなく,複数の制約を満たすためのアルゴリズム的複製性の研究を開始する。
我々の主な成果は、複製性は制約されたMABで達成できるということである。
具体的には, 再現性のあるアルゴリズムを設計し, 後悔と制約違反は, 複製不可能なアルゴリズムとT$で一致させる。
これらの保証に向けた重要なステップとして,我々は,不確実性原理の最適化を取り入れたアルゴリズムが複製可能であることを示す,擬似制約付きMABのための最初の複製可能なUPBライクなアルゴリズムを開発した。
関連論文リスト
- In-Context Algorithm Emulation in Fixed-Weight Transformers [13.585357287532588]
凍結したウェイトを持つ最小のトランスフォーマーは、コンテキスト内プロンプトによって幅広いアルゴリズムのクラスをエミュレートする。
1つの固定重2層アテンションモジュールは、プロンプトのみを通してタスク固有のクラスから全てのアルゴリズムをエミュレートする。
論文 参考訳(メタデータ) (2025-08-24T23:20:31Z) - Replicable Learning of Large-Margin Halfspaces [46.91303295440005]
我々は,大マージンハーフスペースを学習する問題に対して,効率的なアルゴリズムを提供する。
Impagliazzo, Lei, Pitassi, Sorrellによるアルゴリズム [STOC 2022] の改良を行った。
論文 参考訳(メタデータ) (2024-02-21T15:06:51Z) - Replicability is Asymptotically Free in Multi-armed Bandits [41.86005698892541]
我々は,アルゴリズムの動作シーケンスがデータセットに固有のランダム性の影響を受けないことを高い確率で保証する,レプリカブルなマルチアームバンディットアルゴリズムを考察する。
非複製の確率を制限するための原則的アプローチを提案する。
論文 参考訳(メタデータ) (2024-02-12T03:31:34Z) - Batch Bayesian Optimization for Replicable Experimental Design [56.64902148159355]
多くの実世界の設計問題は、大規模で異質な観測ノイズのため、複数の実験条件を並列に評価し、各条件を複数回再現する。
本稿では,3つのアルゴリズムを含むReplicable Experimental Designフレームワークのバッチトンプソンサンプリングを提案する。
我々は,アルゴリズムの有効性を,精密農業とAutoMLの2つの実世界の応用例で示す。
論文 参考訳(メタデータ) (2023-11-02T12:46:03Z) - Replicability and stability in learning [16.936594801109557]
Impagliazzo氏、Lei氏、Pitassi氏、Sorrell氏(22)は先頃、マシンラーニングにおけるレプリカ性の研究を開始した。
我々は、任意のレプリカブルアルゴリズムを、任意の確率が 1 に近く同じ出力を生成するように拡張する方法を示す。
任意の確率で 1 に近い確率で達成できるように、リストの複製性を高めることができることを証明した。
論文 参考訳(メタデータ) (2023-04-07T17:52:26Z) - Accelerated First-Order Optimization under Nonlinear Constraints [61.98523595657983]
我々は、制約付き最適化のための一階アルゴリズムと非滑らかなシステムの間で、新しい一階アルゴリズムのクラスを設計する。
これらのアルゴリズムの重要な性質は、制約がスパース変数の代わりに速度で表されることである。
論文 参考訳(メタデータ) (2023-02-01T08:50:48Z) - Minimax Optimization with Smooth Algorithmic Adversaries [59.47122537182611]
対戦相手が展開するスムーズなアルゴリズムに対して,Min-playerの新しいアルゴリズムを提案する。
本アルゴリズムは,制限周期のない単調進行を保証し,適切な勾配上昇数を求める。
論文 参考訳(メタデータ) (2021-06-02T22:03:36Z) - Byzantine-Resilient Non-Convex Stochastic Gradient Descent [61.6382287971982]
敵対的レジリエントな分散最適化。
機械は独立して勾配を計算し 協力することができます
私達のアルゴリズムは新しい集中の技術およびサンプル複雑性に基づいています。
それは非常に実用的です:それはないときすべての前の方法の性能を改善します。
セッティングマシンがあります。
論文 参考訳(メタデータ) (2020-12-28T17:19:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。