論文の概要: Multi-Armed Sequential Hypothesis Testing by Betting
- arxiv url: http://arxiv.org/abs/2603.17925v1
- Date: Wed, 18 Mar 2026 17:01:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.838478
- Title: Multi-Armed Sequential Hypothesis Testing by Betting
- Title(参考訳): ベッティングによる多要素逐次仮説の検証
- Authors: Ricardo J. Sandoval, Ian Waudby-Smith, Michael I. Jordan,
- Abstract要約: 我々は、グローバル null 仮説 $mathscrP$ と合成代替 $mathscrQ$ を考える。
いくつかの腕がnullではないとしても、我々は$e$プロセスとシーケンシャルテストを求め、そのパフォーマンスは、どの腕が$mathscrP$に対して最もエビデンスを生成するかというオラクル知識を持つものと同じくらいである。
この最適性分析における重要な技術的装置は、観測不能だが十分に「推定可能」な報酬に対して、上信任性バウンドのようなアルゴリズムを改良したものである。
- 参考スコア(独自算出の注目度): 44.29651618521598
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a variant of sequential testing by betting where, at each time step, the statistician is presented with multiple data sources (arms) and obtains data by choosing one of the arms. We consider the composite global null hypothesis $\mathscr{P}$ that all arms are null in a certain sense (e.g. all dosages of a treatment are ineffective) and we are interested in rejecting $\mathscr{P}$ in favor of a composite alternative $\mathscr{Q}$ where at least one arm is non-null (e.g. there exists an effective treatment dosage). We posit an optimality desideratum that we describe informally as follows: even if several arms are non-null, we seek $e$-processes and sequential tests whose performance are as strong as the ones that have oracle knowledge about which arm generates the most evidence against $\mathscr{P}$. Formally, we generalize notions of log-optimality and expected rejection time optimality to more than one arm, obtaining matching lower and upper bounds for both. A key technical device in this optimality analysis is a modified upper-confidence-bound-like algorithm for unobservable but sufficiently "estimable" rewards. In the design of this algorithm, we derive nonasymptotic concentration inequalities for optimal wealth growth rates in the sense of Kelly [1956]. These may be of independent interest.
- Abstract(参考訳): 我々は,各タイミングで統計学者に複数のデータソース(アーム)を提示し,各アームを選択することでデータを取得する,ベッティングによるシーケンシャルテストの変種を考える。
合成大域的ヌル仮説 $\mathscr{P}$ は、ある意味ですべての腕がヌルである(例えば、治療のすべてのドセージは有効ではない)と考えており、少なくとも一方の腕が非ヌルであるような合成的代替品 $\mathscr{Q}$ を拒絶することに興味がある(例えば、有効な治療ドセージが存在する)。
いくつかの腕が非nullであるとしても、性能が$e$プロセスとシーケンシャルテストを求め、腕が$\mathscr{P}$に対して最もエビデンスを発生させる神託知識を持つものと同じくらい高い。
形式的には、ログ最適性の概念と予測拒絶時間最適性の概念を複数のアームに一般化し、両者の一致した下界と上界を得る。
この最適性分析における重要な技術的装置は、観測不能だが十分に「推定可能」な報酬に対して、上信任性バウンドのようなアルゴリズムを改良したものである。
このアルゴリズムの設計において、ケリー(1956)の意味での最適富成長率に対する漸近的濃度不等式を導出する。
これらは独立した関心事かもしれない。
関連論文リスト
- Constrained Best Arm Identification with Tests for Feasibility [7.968868442731488]
ベストアーム識別(BAI)は、各アームからサンプルを集めることで、一組のK$アームの中で最高のパフォーマンスのアームを識別することを目的としている。
本稿では,本アルゴリズムが問題の難易度に自然に適応できることを示すアルゴリズムを提案する。
我々のアルゴリズムは、合成と実世界の両方のデータセットにおいて、他の最先端のBAIアルゴリズムよりも優れていることを実証的に示す。
論文 参考訳(メタデータ) (2025-11-12T23:20:10Z) - Optimal Multi-Objective Best Arm Identification with Fixed Confidence [62.36929749450298]
我々は、各アームが選択時にM$Dのベクトル報酬を得られる多腕バンディット設定を考える。
最終的なゴールは、最も短い(予想される)時間において、エラーの確率の上限に従属する全ての目的の最良のアームを特定することである。
本稿では,各ステップでアームをサンプリングするために,エミュロゲート比例という新しいアイデアを用いたアルゴリズムを提案し,各ステップにおける最大最小最適化問題を解く必要をなくした。
論文 参考訳(メタデータ) (2025-01-23T12:28:09Z) - Best-Arm Identification in Unimodal Bandits [24.001611176749158]
本研究では, 固定信頼度ベストアーム識別問題について検討する。
我々は任意の境界の停止時間で2つ下げる。
腕の数に対する線形依存は、信頼性に依存しないコストでは避けられないことを示す。
論文 参考訳(メタデータ) (2024-11-04T09:05:11Z) - Optimal Multi-Fidelity Best-Arm Identification [65.23078799972188]
バンディットのベストアーム識別において、アルゴリズムは、できるだけ早く特定の精度で、最高平均報酬の腕を見つけることを任務とする。
マルチフィデリティのベストアーム識別について検討し、低コストで低いフィデリティ(正確な平均推定値を持たない)で腕をサンプリングすることを選択できる。
この問題に対処するためのいくつかの方法が提案されているが、その最適性は、特に最適な腕を特定するのに必要な総コストのゆるやかな下限のため、未解決のままである。
論文 参考訳(メタデータ) (2024-06-05T08:02:40Z) - Optimal Top-Two Method for Best Arm Identification and Fluid Analysis [15.353009236788262]
最適な腕識別問題に対する最適トップ2型アルゴリズムを提案する。
提案アルゴリズムは$delta rightarrow 0$として最適であることを示す。
論文 参考訳(メタデータ) (2024-03-14T06:14:07Z) - Combinatorial Stochastic-Greedy Bandit [79.1700188160944]
我々は,選択した$n$のアームセットのジョイント報酬以外の余分な情報が観測されない場合に,マルチアームのバンディット問題に対する新規グリーディ・バンディット(SGB)アルゴリズムを提案する。
SGBは最適化された拡張型コミットアプローチを採用しており、ベースアームの大きなセットを持つシナリオ用に特別に設計されている。
論文 参考訳(メタデータ) (2023-12-13T11:08:25Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z) - Top-$k$ eXtreme Contextual Bandits with Arm Hierarchy [71.17938026619068]
我々は、腕の総数が膨大であることができるトップ$ k$極端な文脈的包帯問題を研究します。
まず,Inverse Gap Weighting戦略を用いて,非極端に実現可能な設定のアルゴリズムを提案する。
我々のアルゴリズムは、$O(ksqrt(A-k+1)T log (|mathcalF|T))$である。
論文 参考訳(メタデータ) (2021-02-15T19:10:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。