論文の概要: Inference on Optimal Policy Values and Other Irregular Functionals via Smoothing
- arxiv url: http://arxiv.org/abs/2507.11780v1
- Date: Tue, 15 Jul 2025 22:38:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.175247
- Title: Inference on Optimal Policy Values and Other Irregular Functionals via Smoothing
- Title(参考訳): 平滑化による最適政策値とその他の不規則関数の推論
- Authors: Justin Whitehouse, Morgane Austern, Vasilis Syrgkanis,
- Abstract要約: 本研究では,ソフトマックススムースティングに基づく推定器を用いて,ニュアンス成分を含むスコアの最大値として指定されたパラメータを推定できることを示す。
我々の推定器は$sqrtn$収束率を取得し、パラメトリックな制限や非現実的なマージンの仮定を避け、しばしば統計的に効率的である。
- 参考スコア(独自算出の注目度): 24.31381939721388
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Constructing confidence intervals for the value of an optimal treatment policy is an important problem in causal inference. Insight into the optimal policy value can guide the development of reward-maximizing, individualized treatment regimes. However, because the functional that defines the optimal value is non-differentiable, standard semi-parametric approaches for performing inference fail to be directly applicable. Existing approaches for handling this non-differentiability fall roughly into two camps. In one camp are estimators based on constructing smooth approximations of the optimal value. These approaches are computationally lightweight, but typically place unrealistic parametric assumptions on outcome regressions. In another camp are approaches that directly de-bias the non-smooth objective. These approaches don't place parametric assumptions on nuisance functions, but they either require the computation of intractably-many nuisance estimates, assume unrealistic $L^\infty$ nuisance convergence rates, or make strong margin assumptions that prohibit non-response to a treatment. In this paper, we revisit the problem of constructing smooth approximations of non-differentiable functionals. By carefully controlling first-order bias and second-order remainders, we show that a softmax smoothing-based estimator can be used to estimate parameters that are specified as a maximum of scores involving nuisance components. In particular, this includes the value of the optimal treatment policy as a special case. Our estimator obtains $\sqrt{n}$ convergence rates, avoids parametric restrictions/unrealistic margin assumptions, and is often statistically efficient.
- Abstract(参考訳): 最適治療方針の値に対する信頼区間を構築することは因果推論において重要な問題である。
最適な政策価値への洞察は、報酬を最大化し、個別化された治療体制の開発を導くことができる。
しかし、最適値を定義する関数は微分不可能であるため、推論を行うための標準的な半パラメトリックアプローチは直接適用できない。
この非微分可能性を扱う既存のアプローチは、2つのキャンプに大別される。
あるキャンプでは、最適値の滑らかな近似に基づく推定器がある。
これらのアプローチは計算的に軽量であるが、通常は結果の回帰に対して非現実的なパラメトリック仮定を課す。
別のキャンプでは、非滑らかな目的を直接バイアスを外すアプローチがある。
これらのアプローチはニュアンス関数に対するパラメトリックな仮定を定めていないが、それらは難解な多くのニュアンス推定の計算を必要とするか、非現実的な$L^\infty$ニュアンス収束率を仮定するか、治療に対する非応答を禁ずる強いマージン仮定を行う。
本稿では,微分不可能関数の滑らかな近似を構成する問題を再考する。
1次偏差と2次残差を慎重に制御することにより、ソフトマックス平滑化に基づく推定器を用いて、ニュアンス成分を含むスコアの最大値として指定されたパラメータを推定できることを示す。
特に、これは特別の場合として最適な治療方針の値を含む。
我々の推定子は$\sqrt{n}$収束率を取得し、パラメトリックな制限や非現実的なマージンの仮定を避け、しばしば統計的に効率的である。
関連論文リスト
- Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - C-Learner: Constrained Learning for Causal Inference [5.395560682099634]
本稿では,両世界の最適な重み付けを実現し,安定したプラグイン推定を実現する新しいデバイアス化手法を提案する。
我々の制約学習フレームワークは、プラグイン量に対する一階誤差がゼロであるという制約の下で、最高のプラグイン推定器を解く。
論文 参考訳(メタデータ) (2024-05-15T16:38:28Z) - Nonparametric estimation of a covariate-adjusted counterfactual
treatment regimen response curve [2.7446241148152253]
治療体制下での平均結果を柔軟に推定することは、パーソナライズされた医療にとって重要なステップである。
本研究では,スムーズな規則応答曲線関数の逆確率重み付き非パラメトリック効率推定器を提案する。
いくつかの有限サンプル特性はシミュレーションによって探索される。
論文 参考訳(メタデータ) (2023-09-28T01:46:24Z) - Kernel-based off-policy estimation without overlap: Instance optimality
beyond semiparametric efficiency [53.90687548731265]
本研究では,観測データに基づいて線形関数を推定するための最適手順について検討する。
任意の凸および対称函数クラス $mathcalF$ に対して、平均二乗誤差で有界な非漸近局所ミニマックスを導出する。
論文 参考訳(メタデータ) (2023-01-16T02:57:37Z) - Off-policy estimation of linear functionals: Non-asymptotic theory for
semi-parametric efficiency [59.48096489854697]
観測データに基づいて線形汎関数を推定する問題は、因果推論と包帯文献の両方において標準的である。
このような手順の平均二乗誤差に対して非漸近上界を証明した。
非漸近的局所ミニマックス下限をマッチングすることにより、有限標本のインスタンス依存最適性を確立する。
論文 参考訳(メタデータ) (2022-09-26T23:50:55Z) - Data-Driven Influence Functions for Optimization-Based Causal Inference [105.5385525290466]
統計的汎関数に対するガトー微分を有限差分法で近似する構成的アルゴリズムについて検討する。
本研究では,確率分布を事前知識がないが,データから推定する必要がある場合について検討する。
論文 参考訳(メタデータ) (2022-08-29T16:16:22Z) - Understanding the Effect of Stochasticity in Policy Optimization [86.7574122154668]
最適化手法の優位性は、正確な勾配が用いられるかどうかに大きく依存することを示す。
次に,政策最適化におけるコミット率の概念を紹介する。
第三に、外部のオラクル情報がない場合には、収束を加速するために幾何を利用することと、最適性をほぼ確実に達成することとの間に本質的にトレードオフがあることが示される。
論文 参考訳(メタデータ) (2021-10-29T06:35:44Z) - Multiply Robust Causal Mediation Analysis with Continuous Treatments [12.196869756333797]
Tchetgen Tchetgen と Shpitser の影響関数に基づく推定器 (2012) に触発された継続的治療の設定に適した推定器を提案する。
提案手法はクロスフィッティングを用いて,ニュアンス関数の滑らかさ要件を緩和し,対象パラメータよりも遅い速度で推定できるようにする。
論文 参考訳(メタデータ) (2021-05-19T16:58:57Z) - Support recovery and sup-norm convergence rates for sparse pivotal
estimation [79.13844065776928]
高次元スパース回帰では、ピボット推定器は最適な正規化パラメータがノイズレベルに依存しない推定器である。
非滑らかで滑らかな単一タスクとマルチタスク正方形ラッソ型推定器に対するミニマックス超ノルム収束率を示す。
論文 参考訳(メタデータ) (2020-01-15T16:11:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。