論文の概要: Minimax Instrumental Variable Regression and $L_2$ Convergence
Guarantees without Identification or Closedness
- arxiv url: http://arxiv.org/abs/2302.05404v1
- Date: Fri, 10 Feb 2023 18:08:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-13 15:07:31.001724
- Title: Minimax Instrumental Variable Regression and $L_2$ Convergence
Guarantees without Identification or Closedness
- Title(参考訳): minimaxインストゥルメンタル・レグレッションと$l_2$コンバージェンス保証
- Authors: Andrew Bennett, Nathan Kallus, Xiaojie Mao, Whitney Newey, Vasilis
Syrgkanis, Masatoshi Uehara
- Abstract要約: インストゥルメンタル変数(IV)回帰の非パラメトリック推定について検討した。
固定IV解に収束できる新しいペナル化ミニマックス推定器を提案する。
ラックス条件下での推定値に対して強い$L$誤差率を導出する。
- 参考スコア(独自算出の注目度): 71.42652863687117
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we study nonparametric estimation of instrumental variable
(IV) regressions. Recently, many flexible machine learning methods have been
developed for instrumental variable estimation. However, these methods have at
least one of the following limitations: (1) restricting the IV regression to be
uniquely identified; (2) only obtaining estimation error rates in terms of
pseudometrics (\emph{e.g.,} projected norm) rather than valid metrics
(\emph{e.g.,} $L_2$ norm); or (3) imposing the so-called closedness condition
that requires a certain conditional expectation operator to be sufficiently
smooth. In this paper, we present the first method and analysis that can avoid
all three limitations, while still permitting general function approximation.
Specifically, we propose a new penalized minimax estimator that can converge to
a fixed IV solution even when there are multiple solutions, and we derive a
strong $L_2$ error rate for our estimator under lax conditions. Notably, this
guarantee only needs a widely-used source condition and realizability
assumptions, but not the so-called closedness condition. We argue that the
source condition and the closedness condition are inherently conflicting, so
relaxing the latter significantly improves upon the existing literature that
requires both conditions. Our estimator can achieve this improvement because it
builds on a novel formulation of the IV estimation problem as a constrained
optimization problem.
- Abstract(参考訳): 本稿では,機器変数(IV)回帰の非パラメトリック推定について検討する。
近年,変数推定のためのフレキシブルな機械学習手法が数多く開発されている。
しかし、これらの方法には少なくとも1つの制限がある:(1)iv回帰を一意的に特定する制限;(2)正当なメトリクス(例えば、$l_2$ norm)ではなく、擬メトリック(例えば、射影ノルム)の項で推定誤差率を得るだけ;(3)ある条件付き期待演算子を十分に滑らかにする必要があるいわゆる閉包条件を設定する。
本稿では, 一般関数近似を許容しながら, 3つの制限をすべて回避できる最初の手法と解析について述べる。
具体的には、複数の解が存在する場合でも、固定IV解に収束できる新しいペナル化ミニマックス推定器を提案し、ラックス条件下では、推定器に対して強い$L_2$誤差率を導出する。
特に、この保証は広く使われるソース条件と実現可能性仮定のみを必要とするが、いわゆるクローズネス条件は必要ではない。
ソース条件とクローズネス条件は本質的に矛盾しているので、後者を緩和することは、両方の条件を必要とする既存の文献を著しく改善する。
提案手法は制約付き最適化問題としてのiv推定問題の新たな定式化を基盤として,この改善を実現する。
関連論文リスト
- Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Regularized DeepIV with Model Selection [72.17508967124081]
正規化DeepIV(RDIV)回帰は最小ノルムIV解に収束することができる。
我々の手法は現在の最先端の収束率と一致している。
論文 参考訳(メタデータ) (2024-03-07T05:38:56Z) - Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - A Primal-Dual Approach to Solving Variational Inequalities with General Constraints [54.62996442406718]
Yang et al. (2023) は最近、一般的な変分不等式を解決するために一階勾配法を使う方法を示した。
この方法の収束性を証明し、演算子が$L$-Lipschitz と monotone である場合、この手法の最後の繰り返しのギャップ関数が$O(frac1sqrtK)$で減少することを示す。
論文 参考訳(メタデータ) (2022-10-27T17:59:09Z) - On Well-posedness and Minimax Optimal Rates of Nonparametric Q-function
Estimation in Off-policy Evaluation [1.575865518040625]
連続状態と行動を伴う無限水平マルコフ決定過程における非政治評価問題について検討する。
我々は、$Q$関数推定を非パラメトリックインスツルメンタル変数(NPIV)推定問題の特別な形式に再キャストする。
論文 参考訳(メタデータ) (2022-01-17T01:09:38Z) - Stochastic regularized majorization-minimization with weakly convex and
multi-convex surrogates [0.0]
提案アルゴリズムの最初の最適性ギャップは,非テンソル依存データ設定下での様々な手法の期待損失率で減衰することを示す。
非テンション依存データ設定の下で, 各種手法の収束点を求める。
論文 参考訳(メタデータ) (2022-01-05T15:17:35Z) - Off-Policy Interval Estimation with Lipschitz Value Iteration [29.232245317776723]
一般の連続した環境下での政治外評価のための区間境界を求めるための正当な手法を提案する。
リプシッツ値の反復法を導入し、単調に間隔を縮める。
論文 参考訳(メタデータ) (2020-10-29T07:25:56Z) - Minimax-Optimal Off-Policy Evaluation with Linear Function Approximation [49.502277468627035]
本稿では,関数近似を用いたバッチデータ強化学習の統計的理論について検討する。
記録履歴から新たな対象政策の累積値を推定するオフ・ポリティクス評価問題を考察する。
論文 参考訳(メタデータ) (2020-02-21T19:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。