論文の概要: Adaptive Principal Component Regression with Applications to Panel Data
- arxiv url: http://arxiv.org/abs/2307.01357v2
- Date: Sat, 28 Oct 2023 03:26:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 20:46:48.646132
- Title: Adaptive Principal Component Regression with Applications to Panel Data
- Title(参考訳): 適応主成分回帰とパネルデータへの応用
- Authors: Anish Agarwal, Keegan Harris, Justin Whitehouse, Zhiwei Steven Wu
- Abstract要約: オンラインデータ収集において,最初のタイムユニフォーム有限サンプル保証を提供する。
結果は,現代のマルティンゲール濃度から変量設定への適応ツールに頼っている。
本研究では,介入が適応的にアサインされた場合のパネルデータ設定における実験設計のためのフレームワークを提供する。
- 参考スコア(独自算出の注目度): 32.00370867261089
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Principal component regression (PCR) is a popular technique for fixed-design
error-in-variables regression, a generalization of the linear regression
setting in which the observed covariates are corrupted with random noise. We
provide the first time-uniform finite sample guarantees for online
(regularized) PCR whenever data is collected adaptively. Since the proof
techniques for analyzing PCR in the fixed design setting do not readily extend
to the online setting, our results rely on adapting tools from modern
martingale concentration to the error-in-variables setting. As an application
of our bounds, we provide a framework for experiment design in panel data
settings when interventions are assigned adaptively. Our framework may be
thought of as a generalization of the synthetic control and synthetic
interventions frameworks, where data is collected via an adaptive intervention
assignment policy.
- Abstract(参考訳): 主成分回帰(プリンシパル・コンポーネント・レグレッション、英: principal component regression, PCR)は、観測された共変体がランダムノイズで劣化する線形回帰設定の一般化である。
オンライン(正規化)pcrに対して,データが適応的に収集される場合,最初の時間一様有限サンプル保証を提供する。
固定設計設定におけるpcr分析手法は, オンライン設定に容易には拡張できないため, 現代のマルティンゲール濃度からエラーイン変数設定への適応に依拠している。
本研究では,介入が適応的に割り当てられた場合のパネルデータ設定における実験設計のためのフレームワークを提供する。
提案手法は,適応的介入割当ポリシーによって収集される合成制御と合成介入フレームワークの一般化と考えることができる。
関連論文リスト
- Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。
学習シナリオにおける同値性に基づく単一のフレームワークを提案する。
我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文 参考訳(メタデータ) (2024-05-09T12:52:22Z) - Offline Policy Evaluation for Reinforcement Learning with Adaptively Collected Data [28.445166861907495]
我々は,TMISオフライン政策評価(OPE)推定器の理論を開発する。
我々は、その推定誤差に基づいて高確率、インスタンス依存境界を導出する。
また,適応環境での極小最適オフライン学習を復元する。
論文 参考訳(メタデータ) (2023-06-24T21:48:28Z) - Conformalized Unconditional Quantile Regression [27.528258690139793]
コンフォメーション予測と非条件量子回帰を組み合わせた予測推論手法を開発した。
提案手法は不整合性に適応し,テストインスタンスに関連する透過的なカバレッジ保証を提供し,既存の手法と効率的に競合することを示す。
論文 参考訳(メタデータ) (2023-04-04T00:20:26Z) - A Regularized Implicit Policy for Offline Reinforcement Learning [54.7427227775581]
オフラインの強化学習は、環境とのさらなるインタラクションなしに、固定データセットから学習を可能にする。
フレキシブルだが十分に調整された完全実装ポリシーの学習を支援するフレームワークを提案する。
D4RLデータセットの実験とアブレーション研究により、我々のフレームワークとアルゴリズム設計の有効性が検証された。
論文 参考訳(メタデータ) (2022-02-19T20:22:04Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Post-Contextual-Bandit Inference [57.88785630755165]
コンテキストバンディットアルゴリズムは、電子商取引、医療、政策立案における非適応的なA/Bテストを置き換える傾向にある。
研究参加者の成果を改善することもでき、良い方針や最良の政策を特定できる可能性を高めることもできる。
研究の終盤における新規介入の信頼性推論を支援するため, 平均治療効果, サブグループ効果, あるいは新政策の価値について, 有効な信頼区間を構築したい。
論文 参考訳(メタデータ) (2021-06-01T12:01:51Z) - On Model Identification and Out-of-Sample Prediction of Principal
Component Regression: Applications to Synthetic Controls [20.96904429337912]
固定設計による高次元誤差変数設定における主成分回帰(PCR)の解析を行う。
我々は、最もよく知られたレートで改善される非漸近的なアウト・オブ・サンプル予測の保証を確立する。
論文 参考訳(メタデータ) (2020-10-27T17:07:36Z) - Fast OSCAR and OWL Regression via Safe Screening Rules [97.28167655721766]
順序付き$L_1$ (OWL)正規化回帰は、高次元スパース学習のための新しい回帰分析である。
近勾配法はOWL回帰を解くための標準手法として用いられる。
未知の順序構造を持つ原始解の順序を探索することにより、OWL回帰の最初の安全なスクリーニングルールを提案する。
論文 参考訳(メタデータ) (2020-06-29T23:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。