論文の概要: Adaptive Principal Component Regression with Applications to Panel Data
- arxiv url: http://arxiv.org/abs/2307.01357v3
- Date: Sun, 4 Aug 2024 22:31:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-07 00:35:17.034800
- Title: Adaptive Principal Component Regression with Applications to Panel Data
- Title(参考訳): 適応主成分回帰とパネルデータへの応用
- Authors: Anish Agarwal, Keegan Harris, Justin Whitehouse, Zhiwei Steven Wu,
- Abstract要約: 我々は、(正規化)主成分回帰に対する最初の時間一様有限標本保証を提供する。
結果は,現代のマルティンゲール濃度から変量設定への適応ツールに頼っている。
提案手法は,エラー・イン・変数の回帰を利用していないベースラインを経験的に上回ることを示す。
- 参考スコア(独自算出の注目度): 29.295938927701396
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Principal component regression (PCR) is a popular technique for fixed-design error-in-variables regression, a generalization of the linear regression setting in which the observed covariates are corrupted with random noise. We provide the first time-uniform finite sample guarantees for (regularized) PCR whenever data is collected adaptively. Since the proof techniques for analyzing PCR in the fixed design setting do not readily extend to the online setting, our results rely on adapting tools from modern martingale concentration to the error-in-variables setting. We demonstrate the usefulness of our bounds by applying them to the domain of panel data, a ubiquitous setting in econometrics and statistics. As our first application, we provide a framework for experiment design in panel data settings when interventions are assigned adaptively. Our framework may be thought of as a generalization of the synthetic control and synthetic interventions frameworks, where data is collected via an adaptive intervention assignment policy. Our second application is a procedure for learning such an intervention assignment policy in a setting where units arrive sequentially to be treated. In addition to providing theoretical performance guarantees (as measured by regret), we show that our method empirically outperforms a baseline which does not leverage error-in-variables regression.
- Abstract(参考訳): 主成分回帰(プリンシパル・コンポーネント・レグレッション、英: principal component regression, PCR)は、観測された共変体がランダムノイズで劣化する線形回帰設定の一般化である。
我々は、データが適応的に収集されるたびに(正規化)PCRに対する最初の時間均一な有限サンプル保証を提供する。
固定設計環境におけるPCR解析の手法は, オンライン環境にも容易には適用できないため, 現代のマルティンゲール濃度からエラー・イン・ヴァリタブル・セッティングへの適応ツールに頼っている。
我々は,パネルデータの領域,すなわち計量学と統計学のユビキタスな設定に適用することで,境界値の有用性を実証する。
最初のアプリケーションとして、介入が適応的にアサインされた場合、パネルデータ設定で実験的な設計を行うためのフレームワークを提供する。
本フレームワークは,適応的介入代入ポリシを通じてデータを収集する合成制御・合成介入フレームワークの一般化と考えられる。
第2の応用は、処理対象のユニットが順次到着する環境で、そのような介入割当ポリシーを学習するための手順である。
理論的性能保証(後悔によって測定される)を提供するのに加えて,本手法は,エラー・イン・ヴァリタブル・レグレッションを生かさないベースラインを経験的に上回っていることを示す。
関連論文リスト
- Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Anchor Data Augmentation [53.39044919864444]
非線形過パラメータ回帰におけるデータ拡張のための新しいアルゴリズムを提案する。
我々のデータ拡張アルゴリズムは、因果関係に関する文献から借用し、最近提案されたデータ拡張のためのアンカー回帰(AR)法を拡張した。
論文 参考訳(メタデータ) (2023-11-12T21:08:43Z) - Robust Regression over Averaged Uncertainty [8.799946547516155]
この定式化はリッジ回帰を驚くほど回復させ、既存の回帰問題に対するロバスト最適化と平均二乗誤差アプローチの欠如を証明している。
また, 摂動レベルの異なる合成データセットにおいて, 既往の最悪の定式化よりも平均定式化が一貫した改善が見られた。
論文 参考訳(メタデータ) (2023-11-12T20:57:30Z) - PARL: A Unified Framework for Policy Alignment in Reinforcement Learning from Human Feedback [106.63518036538163]
我々は、強化学習におけるポリシーアライメントの最近強調された重要な問題に対処するために、新しい統合された二段階最適化ベースのフレームワーク、textsfPARLを提案する。
本フレームワークは, 上向きの目標(逆設計)の分布を, 下向きの最適変数で明示的にパラメータ化することにより, これらの問題に対処する。
その結果,提案したtextsfPARL が RL のアライメントの懸念に対処できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-08-03T18:03:44Z) - Offline Policy Evaluation for Reinforcement Learning with Adaptively Collected Data [28.445166861907495]
我々は,TMISオフライン政策評価(OPE)推定器の理論を開発する。
我々は、その推定誤差に基づいて高確率、インスタンス依存境界を導出する。
また,適応環境での極小最適オフライン学習を復元する。
論文 参考訳(メタデータ) (2023-06-24T21:48:28Z) - Conformalized Unconditional Quantile Regression [27.528258690139793]
コンフォメーション予測と非条件量子回帰を組み合わせた予測推論手法を開発した。
提案手法は不整合性に適応し,テストインスタンスに関連する透過的なカバレッジ保証を提供し,既存の手法と効率的に競合することを示す。
論文 参考訳(メタデータ) (2023-04-04T00:20:26Z) - A Regularized Implicit Policy for Offline Reinforcement Learning [54.7427227775581]
オフラインの強化学習は、環境とのさらなるインタラクションなしに、固定データセットから学習を可能にする。
フレキシブルだが十分に調整された完全実装ポリシーの学習を支援するフレームワークを提案する。
D4RLデータセットの実験とアブレーション研究により、我々のフレームワークとアルゴリズム設計の有効性が検証された。
論文 参考訳(メタデータ) (2022-02-19T20:22:04Z) - Post-Contextual-Bandit Inference [57.88785630755165]
コンテキストバンディットアルゴリズムは、電子商取引、医療、政策立案における非適応的なA/Bテストを置き換える傾向にある。
研究参加者の成果を改善することもでき、良い方針や最良の政策を特定できる可能性を高めることもできる。
研究の終盤における新規介入の信頼性推論を支援するため, 平均治療効果, サブグループ効果, あるいは新政策の価値について, 有効な信頼区間を構築したい。
論文 参考訳(メタデータ) (2021-06-01T12:01:51Z) - On the Minimal Error of Empirical Risk Minimization [90.09093901700754]
回帰作業における経験的リスク最小化(ERM)手順の最小誤差について検討する。
私たちの鋭い下限は、データを生成するモデルの単純さに適応する可能性(あるいは不可能)に光を当てています。
論文 参考訳(メタデータ) (2021-02-24T04:47:55Z) - On Model Identification and Out-of-Sample Prediction of Principal
Component Regression: Applications to Synthetic Controls [20.96904429337912]
固定設計による高次元誤差変数設定における主成分回帰(PCR)の解析を行う。
我々は、最もよく知られたレートで改善される非漸近的なアウト・オブ・サンプル予測の保証を確立する。
論文 参考訳(メタデータ) (2020-10-27T17:07:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。