Fugu-MT 論文翻訳(概要): Sample size planning for conditional counterfactual mean estimation with a K-armed randomized experiment

論文の概要: Sample size planning for conditional counterfactual mean estimation with a K-armed randomized experiment

arxiv url: http://arxiv.org/abs/2403.04039v1
Date: Wed, 6 Mar 2024 20:37:29 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-08 15:52:59.807800
Title: Sample size planning for conditional counterfactual mean estimation with a K-armed randomized experiment
Title（参考訳）: K武装ランダム化実験による条件付き対実平均推定のためのサンプルサイズ計画
Authors: Gabriel Ruiz
Abstract要約: K$のランダム化実験で十分なサンプルサイズを決定する方法を示す。政策木を用いてサブグループを学習し、公開可能な大規模なランダム化実験データセットにおいて、我々の名目上の保証を評価する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We cover how to determine a sufficiently large sample size for a $K$-armed randomized experiment in order to estimate conditional counterfactual expectations in data-driven subgroups. The sub-groups can be output by any feature space partitioning algorithm, including as defined by binning users having similar predictive scores or as defined by a learned policy tree. After carefully specifying the inference target, a minimum confidence level, and a maximum margin of error, the key is to turn the original goal into a simultaneous inference problem where the recommended sample size to offset an increased possibility of estimation error is directly related to the number of inferences to be conducted. Given a fixed sample size budget, our result allows us to invert the question to one about the feasible number of treatment arms or partition complexity (e.g. number of decision tree leaves). Using policy trees to learn sub-groups, we evaluate our nominal guarantees on a large publicly-available randomized experiment test data set.
Abstract（参考訳）: データ駆動型サブグループにおける条件付き対実予測を推定するために、K$のランダム化実験に対して十分なサンプルサイズを決定する方法について述べる。サブグループは任意の特徴空間分割アルゴリズムによって出力され、同様の予測スコアを持つユーザや学習ポリシーツリーによって定義されるユーザによって定義される。推定対象を慎重に指定し、最小信頼度レベルと誤差の限界を最大にした後、鍵となるのは、元の目標を、推定誤差の増加を相殺するための推奨サンプルサイズが実行すべき推論回数に直接関係する同時推論問題に変換することである。固定されたサンプルサイズ予算が与えられた場合、我々の結果は、可能な処理アームの数やパーティションの複雑さ(例えば、決定ツリーの葉の数)について質問を逆転させることができる。政策木を用いてサブグループを学習し、公開可能な大規模なランダム化実験データセットに対する名目上の保証を評価する。

関連論文リスト

Almost Asymptotically Optimal Active Clustering Through Pairwise Observations [59.20614082241528]
そこで本研究では, ノイズと能動的に収集された応答を用いて, M$アイテムを未知数の$K$個別グループにクラスタリングするための新しい分析フレームワークを提案する。クラスタリングの精度に対する望ましい信頼性を達成するのに必要なクエリ数の基本的下位境界を確立する。我々は、一般化された同値比統計の計算可能な変種を開発し、その下限に対する性能ギャップを正確に推定できることを実証的に示す。
論文参考訳（メタデータ） (2026-02-05T14:16:47Z)
Multi-Distribution Robust Conformal Prediction [15.5300376981723]
複数の異種分布に対して一様に有効である共形予測集合を構築することの問題点について検討する。まず,有限サンプル・複数分布カバレッジを実現する最大pアグリゲーション方式を提案する。本稿では,グループ単位での分散的ロバストな最適化,サブポピュレーションシフト,公平性,マルチソース学習との関連性について論じる。
論文参考訳（メタデータ） (2026-01-06T13:22:13Z)
COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。 COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文参考訳（メタデータ） (2025-06-25T07:04:49Z)
Size-adaptive Hypothesis Testing for Fairness [8.315080617799445]
我々は、公正性評価を証拠に基づく統計的決定に変換する統一的、サイズ適応的、仮説テストフレームワークを導入する。統計的パリティ差に対して中央限の結果が証明され、解析的信頼区間と、タイプI(偽陽性)エラーがレベル$alpha$で保証されるウォルド試験が導かれる。小さな交叉群の長い尾に対して、完全ベイズ的ディリクレ・マルチノミカル推定器を導出する。
論文参考訳（メタデータ） (2025-06-12T11:22:09Z)
Clustered random forests with correlated data for optimal estimation and inference under potential covariate shift [4.13592995550836]
我々はクラスタ内の依存を示す独立したグループから生じるランダムなデータに対するランダムなフォレストアルゴリズムであるClustered Random Forestsを開発した。集団化されたランダム林を構成する各決定木の葉回り予測は、重み付き最小二乗推定器の形を取る。伐採された無作為林は、特定の樹木分割基準に対して、ポイントワイド条件の平均推定に最適なミニマックスレートを示す。
論文参考訳（メタデータ） (2025-03-16T20:07:23Z)
Conformal Prediction Sets with Improved Conditional Coverage using Trust Scores [52.92618442300405]
有限サンプルにおいて、正確に分布のない条件付きカバレッジを達成することは不可能である。本稿では,最も重要となる範囲を対象とするコンフォメーション予測アルゴリズムを提案する。
論文参考訳（メタデータ） (2025-01-17T12:01:56Z)
Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文参考訳（メタデータ） (2024-11-04T14:29:02Z)
Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。本手法は, 精度の高い問題に特に適している。提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文参考訳（メタデータ） (2023-11-08T00:10:21Z)
Achieving Long-term Fairness in Submodular Maximization through Randomization [16.33001220320682]
人種や性別などのセンシティブな属性を含む可能性のあるデータアイテムを扱う場合、公平性を意識したアルゴリズムを実装することが重要です。群フェアネス制約を満たしながら単調部分モジュラ函数を最大化する問題について検討する。
論文参考訳（メタデータ） (2023-04-10T16:39:19Z)
One-Shot Federated Conformal Prediction [0.0]
単発フェデレーション学習環境における予測セット構築のための共形予測手法を提案する。我々は,任意の分布に対して,1ラウンドの通信でのみ,所望のカバレッジで予測セットを出力できることを証明した。
論文参考訳（メタデータ） (2023-02-13T12:46:39Z)
Non-Stochastic CDF Estimation Using Threshold Queries [3.6576781735746513]
実験的な分布を2つの課題で推定する問題に取り組む。まず、アルゴリズムはデータを直接観察するのではなく、サンプルについて限られた数のしきい値クエリしか要求しない。第二に、データは独立で同一の分散であると仮定されず、代わりにサンプルを生成する任意のプロセスが可能である。
論文参考訳（メタデータ） (2023-01-13T18:00:57Z)
Will My Robot Achieve My Goals? Predicting the Probability that an MDP Policy Reaches a User-Specified Behavior Target [56.99669411766284]
自律的なシステムがタスクを実行する場合、ユーザの目標を達成する確率のキャリブレーションされた見積もりを維持する必要がある。本稿では,ユーザの目標が目標間隔として指定される設定について検討する。我々は、共形予測を反転させて確率推定を計算する。
論文参考訳（メタデータ） (2022-11-29T18:41:20Z)
Learning from a Biased Sample [3.546358664345473]
本稿では,テスト分布のファミリーで発生する最悪のリスクを最小限に抑える決定ルールの学習方法を提案する。本研究では,健康調査データからメンタルヘルススコアの予測を行うケーススタディにおいて,提案手法を実証的に検証した。
論文参考訳（メタデータ） (2022-09-05T04:19:16Z)
BRIO: Bringing Order to Abstractive Summarization [107.97378285293507]
非決定論的分布を前提とした新しい学習パラダイムを提案する。提案手法は, CNN/DailyMail (47.78 ROUGE-1) と XSum (49.07 ROUGE-1) のデータセット上で, 最新の結果が得られる。
論文参考訳（メタデータ） (2022-03-31T05:19:38Z)
Group Testing with Non-identical Infection Probabilities [59.96266198512243]
そこで我々は,集合形成法を用いた適応型グループテストアルゴリズムを開発した。提案アルゴリズムは, エントロピー下界に近い性能を示す。
論文参考訳（メタデータ） (2021-08-27T17:53:25Z)
Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文参考訳（メタデータ） (2020-10-21T13:43:48Z)
Robust M-Estimation Based Bayesian Cluster Enumeration for Real Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文参考訳（メタデータ） (2020-05-04T11:44:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。