論文の概要: Counterfactual Inference of the Mean Outcome under a Convergence of
Average Logging Probability
- arxiv url: http://arxiv.org/abs/2102.08975v1
- Date: Wed, 17 Feb 2021 19:05:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 14:10:22.240538
- Title: Counterfactual Inference of the Mean Outcome under a Convergence of
Average Logging Probability
- Title(参考訳): 平均ロギング確率の収束下における平均結果の反事実推論
- Authors: Masahiro Kato
- Abstract要約: 本稿では,適応実験で得られたサンプルから,アクションの平均結果を推定する。
適応実験では、過去の観測に基づいて行動を選択する確率を逐次更新することができる。
- 参考スコア(独自算出の注目度): 5.596752018167751
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptive experiments, including efficient average treatment effect estimation
and multi-armed bandit algorithms, have garnered attention in various
applications, such as social experiments, clinical trials, and online
advertisement optimization. This paper considers estimating the mean outcome of
an action from samples obtained in adaptive experiments. In causal inference,
the mean outcome of an action has a crucial role, and the estimation is an
essential task, where the average treatment effect estimation and off-policy
value estimation are its variants. In adaptive experiments, the probability of
choosing an action (logging probability) is allowed to be sequentially updated
based on past observations. Due to this logging probability depending on the
past observations, the samples are often not independent and identically
distributed (i.i.d.), making developing an asymptotically normal estimator
difficult. A typical approach for this problem is to assume that the logging
probability converges in a time-invariant function. However, this assumption is
restrictive in various applications, such as when the logging probability
fluctuates or becomes zero at some periods. To mitigate this limitation, we
propose another assumption that the average logging probability converges to a
time-invariant function and show the doubly robust (DR) estimator's asymptotic
normality. Under the assumption, the logging probability itself can fluctuate
or be zero for some actions. We also show the empirical properties by
simulations.
- Abstract(参考訳): 効率的な平均治療効果推定や多腕バンディットアルゴリズムを含む適応実験は、社会実験、臨床試験、オンライン広告最適化など様々な応用で注目を集めている。
本稿では,適応実験で得られたサンプルから,アクションの平均結果を推定する。
因果推論において、行動の平均的な結果には重要な役割があり、その推定は重要なタスクであり、平均的な治療効果の推定とオフポリシー値推定はその変種である。
適応実験では、過去の観測に基づいて、アクション(ログング確率)を選択する確率を順次更新することができる。
このロギングの確率は過去の観測に依存するため、サンプルはしばしば独立ではなく、同じ分布(すなわちd)である。
漸近的に正常な推定器の開発は困難である。
この問題の典型的なアプローチは、ロギング確率が時間不変関数に収束すると仮定することである。
しかし、この仮定は、ロギング確率が変動したり、ある期間にゼロになったりするなど、様々なアプリケーションで制限される。
この制限を緩和するために、平均ロギング確率が時間不変関数に収束する別の仮定を提案し、二重ロバスト(dr)推定子の漸近正規性を示す。
この仮定の下では、ロギング確率自体が変動したり、ある作用に対してゼロとなることがある。
また,シミュレーションにより経験的特性を示す。
関連論文リスト
- Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Logistic-beta processes for dependent random probabilities with beta marginals [58.91121576998588]
本稿では,ロジスティック・ベータプロセスと呼ばれる新しいプロセスを提案する。
空間や時間などの離散領域と連続領域の両方への依存をモデル化でき、相関カーネルを通じて柔軟な依存構造を持つ。
本研究は,非パラメトリック二分回帰と条件密度推定の例による効果をシミュレーション研究と妊娠結果応用の両方で説明する。
論文 参考訳(メタデータ) (2024-02-10T21:41:32Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - User-defined Event Sampling and Uncertainty Quantification in Diffusion
Models for Physical Dynamical Systems [49.75149094527068]
拡散モデルを用いて予測を行い,カオス力学系に対する不確かさの定量化が可能であることを示す。
本研究では,雑音レベルが低下するにつれて真の分布に収束する条件付きスコア関数の確率的近似法を開発する。
推論時に非線形ユーザ定義イベントを条件付きでサンプリングすることができ、分布の尾部からサンプリングした場合でもデータ統計と一致させることができる。
論文 参考訳(メタデータ) (2023-06-13T03:42:03Z) - Semi-Parametric Inference for Doubly Stochastic Spatial Point Processes: An Approximate Penalized Poisson Likelihood Approach [3.085995273374333]
二重確率点過程は、ランダム強度関数の実現を前提とした不均一過程として空間領域上の事象の発生をモデル化する。
既存の二重確率空間モデルの実装は、計算的に要求され、しばしば理論的な保証が制限され、または制限的な仮定に依存している。
論文 参考訳(メタデータ) (2023-06-11T19:48:39Z) - Counterfactual inference for sequential experiments [17.817769460838665]
複数の単位に複数の時間点に対する処理を割り当てるシーケンシャルな設計実験のアフタースタディ統計的推測を考察する。
我々のゴールは、最小限のスケールで、カウンターファクト平均に対する推論保証を提供することです。
我々は,いくつかのシミュレーションと,モバイル医療臨床試験HeartStepsのデータを含むケーススタディを通して,我々の理論を解説する。
論文 参考訳(メタデータ) (2022-02-14T17:24:27Z) - Variance Minimization in the Wasserstein Space for Invariant Causal
Prediction [72.13445677280792]
そこで本研究では,ICPで行ったアプローチを,予測器数で線形にスケールする一連の非パラメトリックテストとして再検討する。
これらのテストはそれぞれ、最適輸送理論の道具から導かれる新しい損失関数の最小化に依存している。
我々は,本手法が同定可能な直接原因の集合を回復できるという軽微な仮定の下で証明し,他のベンチマーク因果探索アルゴリズムと競合することを示す。
論文 参考訳(メタデータ) (2021-10-13T22:30:47Z) - Multivariate Probabilistic Regression with Natural Gradient Boosting [63.58097881421937]
多変量予測分布の条件パラメータを非パラメトリックにモデル化したNatural Gradient Boosting (NGBoost) 手法を提案する。
提案手法は頑健で, 広範囲なチューニングを伴わず, 推定対象分布に対してモジュール構造であり, 既存の手法と比較して競争力がある。
論文 参考訳(メタデータ) (2021-06-07T17:44:49Z) - Tolerance and Prediction Intervals for Non-normal Models [0.0]
予測間隔は、繰り返しサンプリングにおいてランダムプロセスから将来の観察をカバーする。
寛容間隔は繰り返しサンプリングにおいて集団パーセンタイルをカバーし、しばしば中心的な量に基づいている。
論文 参考訳(メタデータ) (2020-11-23T17:48:09Z) - Valid Causal Inference with (Some) Invalid Instruments [24.794879633855373]
排他的仮定違反にも拘わらず、一貫したIV推定を行う方法を示す。
我々は,深層ネットワークに基づく推定器のアンサンブルを用いて条件平均処理効果を正確に推定する。
論文 参考訳(メタデータ) (2020-06-19T21:09:26Z) - Conformal Inference of Counterfactuals and Individual Treatment Effects [6.810856082577402]
そこで本研究では,反ファクトや個々の治療効果について,信頼できる間隔を推定できる共形推論に基づく手法を提案する。
既存の手法は、単純なモデルであってもかなりのカバレッジの欠陥に悩まされる。
論文 参考訳(メタデータ) (2020-06-11T01:03:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。