Fugu-MT 論文翻訳(概要): Adaptive Principal Component Regression with Applications to Panel Data

論文の概要: Adaptive Principal Component Regression with Applications to Panel Data

arxiv url: http://arxiv.org/abs/2307.01357v3
Date: Sun, 4 Aug 2024 22:31:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-07 00:35:17.034800
Title: Adaptive Principal Component Regression with Applications to Panel Data
Title（参考訳）: 適応主成分回帰とパネルデータへの応用
Authors: Anish Agarwal, Keegan Harris, Justin Whitehouse, Zhiwei Steven Wu,
Abstract要約: 我々は、(正規化)主成分回帰に対する最初の時間一様有限標本保証を提供する。結果は,現代のマルティンゲール濃度から変量設定への適応ツールに頼っている。提案手法は,エラー・イン・変数の回帰を利用していないベースラインを経験的に上回ることを示す。
参考スコア（独自算出の注目度）: 29.295938927701396
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Principal component regression (PCR) is a popular technique for fixed-design error-in-variables regression, a generalization of the linear regression setting in which the observed covariates are corrupted with random noise. We provide the first time-uniform finite sample guarantees for (regularized) PCR whenever data is collected adaptively. Since the proof techniques for analyzing PCR in the fixed design setting do not readily extend to the online setting, our results rely on adapting tools from modern martingale concentration to the error-in-variables setting. We demonstrate the usefulness of our bounds by applying them to the domain of panel data, a ubiquitous setting in econometrics and statistics. As our first application, we provide a framework for experiment design in panel data settings when interventions are assigned adaptively. Our framework may be thought of as a generalization of the synthetic control and synthetic interventions frameworks, where data is collected via an adaptive intervention assignment policy. Our second application is a procedure for learning such an intervention assignment policy in a setting where units arrive sequentially to be treated. In addition to providing theoretical performance guarantees (as measured by regret), we show that our method empirically outperforms a baseline which does not leverage error-in-variables regression.
Abstract（参考訳）: 主成分回帰(プリンシパル・コンポーネント・レグレッション、英: principal component regression, PCR)は、観測された共変体がランダムノイズで劣化する線形回帰設定の一般化である。我々は、データが適応的に収集されるたびに(正規化)PCRに対する最初の時間均一な有限サンプル保証を提供する。固定設計環境におけるPCR解析の手法は, オンライン環境にも容易には適用できないため, 現代のマルティンゲール濃度からエラー・イン・ヴァリタブル・セッティングへの適応ツールに頼っている。我々は,パネルデータの領域,すなわち計量学と統計学のユビキタスな設定に適用することで,境界値の有用性を実証する。最初のアプリケーションとして、介入が適応的にアサインされた場合、パネルデータ設定で実験的な設計を行うためのフレームワークを提供する。本フレームワークは,適応的介入代入ポリシを通じてデータを収集する合成制御・合成介入フレームワークの一般化と考えられる。第2の応用は、処理対象のユニットが順次到着する環境で、そのような介入割当ポリシーを学習するための手順である。理論的性能保証(後悔によって測定される)を提供するのに加えて,本手法は,エラー・イン・ヴァリタブル・レグレッションを生かさないベースラインを経験的に上回っていることを示す。

関連論文リスト

Differentially Private Inference for Longitudinal Linear Regression [9.16331221881594]
ユーザレベルDP下での縦線形回帰における推定と推定のための包括的フレームワークを開発する。推測のために, 自動ヘテロスケダスティック性および自己相関性を持つ民生推定器を開発した。これらの結果は,ユーザレベルのDP推定と推測を行うための最初の統一フレームワークを提供する。
論文参考訳（メタデータ） (2026-01-15T17:47:02Z)
Rectifying Conformity Scores for Better Conditional Coverage [75.73184036344908]
本稿では,分割共形予測フレームワーク内で信頼セットを生成する新しい手法を提案する。本手法は,任意の適合度スコアのトレーニング可能な変換を行い,条件付き範囲を正確に確保しつつ,条件付き範囲を改善する。
論文参考訳（メタデータ） (2025-02-22T19:54:14Z)
A Planning Framework for Adaptive Labeling [8.883000217198843]
本稿では,バッチで計測作業を再配置できる適応ラベリングフレームワークを提案する。 1段階のルックアヘッドポリシーでさえ、一般的な適応ラベルよりも大幅に優れることを示す。本稿では,従来の非微分可能MDPのスムーズなバージョンに基づいて,直接バックプロパゲーションに基づくSmoothed-Autodiffを提案する。
論文参考訳（メタデータ） (2025-02-10T00:01:08Z)
A Meta-learner for Heterogeneous Effects in Difference-in-Differences [17.361857058902494]
条件付き平均処理効果(CATT)の評価のための二重頑健なメタラーナを提案する。我々のフレームワークは、汎用機械学習を用いて、興味のある変数の任意のサブセットを条件付ける際に、CATTの柔軟な推定を可能にする。
論文参考訳（メタデータ） (2025-02-07T07:04:37Z)
Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [53.03951222945921]
我々はスムーズな(摂動された)ポリシーを解析し、線形オラクルが使用する方向に対して制御されたランダムな摂動を付加する。我々の主な貢献は、過剰リスクを摂動バイアス、統計的推定誤差、最適化誤差に分解する一般化境界である。車両のスケジューリングやスムーズ化がトラクタブルトレーニングと制御された一般化の両方を可能にしていることを示す。
論文参考訳（メタデータ） (2024-07-24T12:00:30Z)
Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文参考訳（メタデータ） (2024-05-19T17:49:33Z)
Optimal Baseline Corrections for Off-Policy Contextual Bandits [61.740094604552475]
オンライン報酬指標の偏りのないオフライン推定を最適化する意思決定ポリシーを学習することを目指している。学習シナリオにおける同値性に基づく単一のフレームワークを提案する。我々のフレームワークは、分散最適非バイアス推定器の特徴付けを可能にし、それに対する閉形式解を提供する。
論文参考訳（メタデータ） (2024-05-09T12:52:22Z)
PARL: A Unified Framework for Policy Alignment in Reinforcement Learning from Human Feedback [106.63518036538163]
我々は、強化学習におけるポリシーアライメントの最近強調された重要な問題に対処するために、新しい統合された二段階最適化ベースのフレームワーク、textsfPARLを提案する。本フレームワークは, 上向きの目標(逆設計)の分布を, 下向きの最適変数で明示的にパラメータ化することにより, これらの問題に対処する。その結果,提案したtextsfPARL が RL のアライメントの懸念に対処できる可能性が示唆された。
論文参考訳（メタデータ） (2023-08-03T18:03:44Z)
Offline Policy Evaluation for Reinforcement Learning with Adaptively Collected Data [28.445166861907495]
我々は,TMISオフライン政策評価(OPE)推定器の理論を開発する。我々は、その推定誤差に基づいて高確率、インスタンス依存境界を導出する。また,適応環境での極小最適オフライン学習を復元する。
論文参考訳（メタデータ） (2023-06-24T21:48:28Z)
Conformalized Unconditional Quantile Regression [27.528258690139793]
コンフォメーション予測と非条件量子回帰を組み合わせた予測推論手法を開発した。提案手法は不整合性に適応し,テストインスタンスに関連する透過的なカバレッジ保証を提供し,既存の手法と効率的に競合することを示す。
論文参考訳（メタデータ） (2023-04-04T00:20:26Z)
Post Reinforcement Learning Inference [20.521169740409263]
強化学習アルゴリズムによって収集されたデータを用いて推定と推定を行う。この分散を安定化させるために適応重みを用いる重み付き一般化モーメント法(GMM)を提案する。主な用途は、動的処理効果の推定と動的オフポリシー評価である。
論文参考訳（メタデータ） (2023-02-17T12:53:15Z)
A Regularized Implicit Policy for Offline Reinforcement Learning [54.7427227775581]
オフラインの強化学習は、環境とのさらなるインタラクションなしに、固定データセットから学習を可能にする。フレキシブルだが十分に調整された完全実装ポリシーの学習を支援するフレームワークを提案する。 D4RLデータセットの実験とアブレーション研究により、我々のフレームワークとアルゴリズム設計の有効性が検証された。
論文参考訳（メタデータ） (2022-02-19T20:22:04Z)
Risk Minimization from Adaptively Collected Data: Guarantees for Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文参考訳（メタデータ） (2021-06-03T09:50:13Z)
Post-Contextual-Bandit Inference [57.88785630755165]
コンテキストバンディットアルゴリズムは、電子商取引、医療、政策立案における非適応的なA/Bテストを置き換える傾向にある。研究参加者の成果を改善することもでき、良い方針や最良の政策を特定できる可能性を高めることもできる。研究の終盤における新規介入の信頼性推論を支援するため, 平均治療効果, サブグループ効果, あるいは新政策の価値について, 有効な信頼区間を構築したい。
論文参考訳（メタデータ） (2021-06-01T12:01:51Z)
On Model Identification and Out-of-Sample Prediction of Principal Component Regression: Applications to Synthetic Controls [20.96904429337912]
固定設計による高次元誤差変数設定における主成分回帰(PCR)の解析を行う。我々は、最もよく知られたレートで改善される非漸近的なアウト・オブ・サンプル予測の保証を確立する。
論文参考訳（メタデータ） (2020-10-27T17:07:36Z)
Fast OSCAR and OWL Regression via Safe Screening Rules [97.28167655721766]
順序付き$L_1$ (OWL)正規化回帰は、高次元スパース学習のための新しい回帰分析である。近勾配法はOWL回帰を解くための標準手法として用いられる。未知の順序構造を持つ原始解の順序を探索することにより、OWL回帰の最初の安全なスクリーニングルールを提案する。
論文参考訳（メタデータ） (2020-06-29T23:35:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。