論文の概要: Sample size planning for conditional counterfactual mean estimation with
a K-armed randomized experiment
- arxiv url: http://arxiv.org/abs/2403.04039v1
- Date: Wed, 6 Mar 2024 20:37:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 15:52:59.807800
- Title: Sample size planning for conditional counterfactual mean estimation with
a K-armed randomized experiment
- Title(参考訳): K武装ランダム化実験による条件付き対実平均推定のためのサンプルサイズ計画
- Authors: Gabriel Ruiz
- Abstract要約: K$のランダム化実験で十分なサンプルサイズを決定する方法を示す。
政策木を用いてサブグループを学習し、公開可能な大規模なランダム化実験データセットにおいて、我々の名目上の保証を評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We cover how to determine a sufficiently large sample size for a $K$-armed
randomized experiment in order to estimate conditional counterfactual
expectations in data-driven subgroups. The sub-groups can be output by any
feature space partitioning algorithm, including as defined by binning users
having similar predictive scores or as defined by a learned policy tree. After
carefully specifying the inference target, a minimum confidence level, and a
maximum margin of error, the key is to turn the original goal into a
simultaneous inference problem where the recommended sample size to offset an
increased possibility of estimation error is directly related to the number of
inferences to be conducted. Given a fixed sample size budget, our result allows
us to invert the question to one about the feasible number of treatment arms or
partition complexity (e.g. number of decision tree leaves). Using policy trees
to learn sub-groups, we evaluate our nominal guarantees on a large
publicly-available randomized experiment test data set.
- Abstract(参考訳): データ駆動型サブグループにおける条件付き対実予測を推定するために、K$のランダム化実験に対して十分なサンプルサイズを決定する方法について述べる。
サブグループは任意の特徴空間分割アルゴリズムによって出力され、同様の予測スコアを持つユーザや学習ポリシーツリーによって定義されるユーザによって定義される。
推定対象を慎重に指定し、最小信頼度レベルと誤差の限界を最大にした後、鍵となるのは、元の目標を、推定誤差の増加を相殺するための推奨サンプルサイズが実行すべき推論回数に直接関係する同時推論問題に変換することである。
固定されたサンプルサイズ予算が与えられた場合、我々の結果は、可能な処理アームの数やパーティションの複雑さ(例えば、決定ツリーの葉の数)について質問を逆転させることができる。
政策木を用いてサブグループを学習し、公開可能な大規模なランダム化実験データセットに対する名目上の保証を評価する。
関連論文リスト
- Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。
スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。
実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Achieving Long-term Fairness in Submodular Maximization through
Randomization [16.33001220320682]
人種や性別などのセンシティブな属性を含む可能性のあるデータアイテムを扱う場合、公平性を意識したアルゴリズムを実装することが重要です。
群フェアネス制約を満たしながら単調部分モジュラ函数を最大化する問題について検討する。
論文 参考訳(メタデータ) (2023-04-10T16:39:19Z) - One-Shot Federated Conformal Prediction [0.0]
単発フェデレーション学習環境における予測セット構築のための共形予測手法を提案する。
我々は,任意の分布に対して,1ラウンドの通信でのみ,所望のカバレッジで予測セットを出力できることを証明した。
論文 参考訳(メタデータ) (2023-02-13T12:46:39Z) - Non-Stochastic CDF Estimation Using Threshold Queries [3.6576781735746513]
実験的な分布を2つの課題で推定する問題に取り組む。
まず、アルゴリズムはデータを直接観察するのではなく、サンプルについて限られた数のしきい値クエリしか要求しない。
第二に、データは独立で同一の分散であると仮定されず、代わりにサンプルを生成する任意のプロセスが可能である。
論文 参考訳(メタデータ) (2023-01-13T18:00:57Z) - Will My Robot Achieve My Goals? Predicting the Probability that an MDP Policy Reaches a User-Specified Behavior Target [56.99669411766284]
自律的なシステムがタスクを実行する場合、ユーザの目標を達成する確率のキャリブレーションされた見積もりを維持する必要がある。
本稿では,ユーザの目標が目標間隔として指定される設定について検討する。
我々は、共形予測を反転させて確率推定を計算する。
論文 参考訳(メタデータ) (2022-11-29T18:41:20Z) - Learning from a Biased Sample [3.546358664345473]
本稿では,テスト分布のファミリーで発生する最悪のリスクを最小限に抑える決定ルールの学習方法を提案する。
本研究では,健康調査データからメンタルヘルススコアの予測を行うケーススタディにおいて,提案手法を実証的に検証した。
論文 参考訳(メタデータ) (2022-09-05T04:19:16Z) - BRIO: Bringing Order to Abstractive Summarization [107.97378285293507]
非決定論的分布を前提とした新しい学習パラダイムを提案する。
提案手法は, CNN/DailyMail (47.78 ROUGE-1) と XSum (49.07 ROUGE-1) のデータセット上で, 最新の結果が得られる。
論文 参考訳(メタデータ) (2022-03-31T05:19:38Z) - Group Testing with Non-identical Infection Probabilities [59.96266198512243]
そこで我々は,集合形成法を用いた適応型グループテストアルゴリズムを開発した。
提案アルゴリズムは, エントロピー下界に近い性能を示す。
論文 参考訳(メタデータ) (2021-08-27T17:53:25Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z) - Robust M-Estimation Based Bayesian Cluster Enumeration for Real
Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。
本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。
サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文 参考訳(メタデータ) (2020-05-04T11:44:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。