論文の概要: Adaptive Principal Component Regression with Applications to Panel Data
- arxiv url: http://arxiv.org/abs/2307.01357v3
- Date: Sun, 4 Aug 2024 22:31:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-07 00:35:17.034800
- Title: Adaptive Principal Component Regression with Applications to Panel Data
- Title(参考訳): 適応主成分回帰とパネルデータへの応用
- Authors: Anish Agarwal, Keegan Harris, Justin Whitehouse, Zhiwei Steven Wu,
- Abstract要約: 我々は、(正規化)主成分回帰に対する最初の時間一様有限標本保証を提供する。
結果は,現代のマルティンゲール濃度から変量設定への適応ツールに頼っている。
提案手法は,エラー・イン・変数の回帰を利用していないベースラインを経験的に上回ることを示す。
- 参考スコア(独自算出の注目度): 29.295938927701396
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Principal component regression (PCR) is a popular technique for fixed-design error-in-variables regression, a generalization of the linear regression setting in which the observed covariates are corrupted with random noise. We provide the first time-uniform finite sample guarantees for (regularized) PCR whenever data is collected adaptively. Since the proof techniques for analyzing PCR in the fixed design setting do not readily extend to the online setting, our results rely on adapting tools from modern martingale concentration to the error-in-variables setting. We demonstrate the usefulness of our bounds by applying them to the domain of panel data, a ubiquitous setting in econometrics and statistics. As our first application, we provide a framework for experiment design in panel data settings when interventions are assigned adaptively. Our framework may be thought of as a generalization of the synthetic control and synthetic interventions frameworks, where data is collected via an adaptive intervention assignment policy. Our second application is a procedure for learning such an intervention assignment policy in a setting where units arrive sequentially to be treated. In addition to providing theoretical performance guarantees (as measured by regret), we show that our method empirically outperforms a baseline which does not leverage error-in-variables regression.
- Abstract(参考訳): 主成分回帰(プリンシパル・コンポーネント・レグレッション、英: principal component regression, PCR)は、観測された共変体がランダムノイズで劣化する線形回帰設定の一般化である。
我々は、データが適応的に収集されるたびに(正規化)PCRに対する最初の時間均一な有限サンプル保証を提供する。
固定設計環境におけるPCR解析の手法は, オンライン環境にも容易には適用できないため, 現代のマルティンゲール濃度からエラー・イン・ヴァリタブル・セッティングへの適応ツールに頼っている。
我々は,パネルデータの領域,すなわち計量学と統計学のユビキタスな設定に適用することで,境界値の有用性を実証する。
最初のアプリケーションとして、介入が適応的にアサインされた場合、パネルデータ設定で実験的な設計を行うためのフレームワークを提供する。
本フレームワークは,適応的介入代入ポリシを通じてデータを収集する合成制御・合成介入フレームワークの一般化と考えられる。
第2の応用は、処理対象のユニットが順次到着する環境で、そのような介入割当ポリシーを学習するための手順である。
理論的性能保証(後悔によって測定される)を提供するのに加えて,本手法は,エラー・イン・ヴァリタブル・レグレッションを生かさないベースラインを経験的に上回っていることを示す。
関連論文リスト
- Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Offline Policy Evaluation for Reinforcement Learning with Adaptively Collected Data [28.445166861907495]
我々は,TMISオフライン政策評価(OPE)推定器の理論を開発する。
我々は、その推定誤差に基づいて高確率、インスタンス依存境界を導出する。
また,適応環境での極小最適オフライン学習を復元する。
論文 参考訳(メタデータ) (2023-06-24T21:48:28Z) - Conformalized Unconditional Quantile Regression [27.528258690139793]
コンフォメーション予測と非条件量子回帰を組み合わせた予測推論手法を開発した。
提案手法は不整合性に適応し,テストインスタンスに関連する透過的なカバレッジ保証を提供し,既存の手法と効率的に競合することを示す。
論文 参考訳(メタデータ) (2023-04-04T00:20:26Z) - A Regularized Implicit Policy for Offline Reinforcement Learning [54.7427227775581]
オフラインの強化学習は、環境とのさらなるインタラクションなしに、固定データセットから学習を可能にする。
フレキシブルだが十分に調整された完全実装ポリシーの学習を支援するフレームワークを提案する。
D4RLデータセットの実験とアブレーション研究により、我々のフレームワークとアルゴリズム設計の有効性が検証された。
論文 参考訳(メタデータ) (2022-02-19T20:22:04Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Post-Contextual-Bandit Inference [57.88785630755165]
コンテキストバンディットアルゴリズムは、電子商取引、医療、政策立案における非適応的なA/Bテストを置き換える傾向にある。
研究参加者の成果を改善することもでき、良い方針や最良の政策を特定できる可能性を高めることもできる。
研究の終盤における新規介入の信頼性推論を支援するため, 平均治療効果, サブグループ効果, あるいは新政策の価値について, 有効な信頼区間を構築したい。
論文 参考訳(メタデータ) (2021-06-01T12:01:51Z) - On Model Identification and Out-of-Sample Prediction of Principal
Component Regression: Applications to Synthetic Controls [20.96904429337912]
固定設計による高次元誤差変数設定における主成分回帰(PCR)の解析を行う。
我々は、最もよく知られたレートで改善される非漸近的なアウト・オブ・サンプル予測の保証を確立する。
論文 参考訳(メタデータ) (2020-10-27T17:07:36Z) - Fast OSCAR and OWL Regression via Safe Screening Rules [97.28167655721766]
順序付き$L_1$ (OWL)正規化回帰は、高次元スパース学習のための新しい回帰分析である。
近勾配法はOWL回帰を解くための標準手法として用いられる。
未知の順序構造を持つ原始解の順序を探索することにより、OWL回帰の最初の安全なスクリーニングルールを提案する。
論文 参考訳(メタデータ) (2020-06-29T23:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。