論文の概要: Least Squares Estimation Using Sketched Data with Heteroskedastic Errors
- arxiv url: http://arxiv.org/abs/2007.07781v3
- Date: Wed, 22 Jun 2022 10:14:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 05:28:43.079464
- Title: Least Squares Estimation Using Sketched Data with Heteroskedastic Errors
- Title(参考訳): Heteroskedastic Errorsを用いたスケッチデータを用いた最小二乗推定
- Authors: Sokbae Lee, Serena Ng
- Abstract要約: ランダムなプロジェクションによってスケッチされたデータを用いた推定は、エラーがホモスケダスティックであるかのように振る舞うことを示す。
楽器関連性の第一段階Fテストを含む推論は、スケッチスキームが適切に選択された場合の完全なサンプルケースよりも簡単である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Researchers may perform regressions using a sketch of data of size $m$
instead of the full sample of size $n$ for a variety of reasons. This paper
considers the case when the regression errors do not have constant variance and
heteroskedasticity robust standard errors would normally be needed for test
statistics to provide accurate inference. We show that estimates using data
sketched by random projections will behave `as if' the errors were
homoskedastic. Estimation by random sampling would not have this property. The
result arises because the sketched estimates in the case of random projections
can be expressed as degenerate $U$-statistics, and under certain conditions,
these statistics are asymptotically normal with homoskedastic variance. We
verify that the conditions hold not only in the case of least squares
regression when the covariates are exogenous, but also in instrumental
variables estimation when the covariates are endogenous. The result implies
that inference, including first-stage F tests for instrument relevance, can be
simpler than the full sample case if the sketching scheme is appropriately
chosen.
- Abstract(参考訳): 研究者は、さまざまな理由から、サイズ$n$の全サンプルではなく、サイズ$m$のスケッチを使用して回帰を行うことができる。
本稿では, 回帰誤差が一定のばらつきを持たず, 正則誤差が頑健である場合, 精度の高い推論を行うためには, テスト統計学には通常必要となる。
ランダムなプロジェクションによってスケッチされたデータを用いた推定は、エラーがホモスケダティックであるかのように振る舞います。
ランダムサンプリングによる推定は、この性質を持たない。
この結果は、ランダムな射影の場合のスケッチされた推定値が退化$U$-統計量として表され、ある条件下では、これらの統計値がホモスケダスティックな分散を伴う漸近正規であるから生じる。
共変数が外因性である場合の最小二乗回帰だけでなく、共変数が内因性である場合のインストゥルメンタル変数推定においても、条件が成り立つことを検証する。
結果として、もしスケッチ方式が適切に選択された場合、第一段階のfテストを含む推論は、完全なサンプルケースよりも単純であることが示唆される。
関連論文リスト
- Doubly Robust Conditional Independence Testing with Generative Neural Networks [8.323172773256449]
本稿では、第3の確率ベクトル$Z$を与えられた2つのジェネリックランダムベクトル$X$と$Y$の条件独立性をテストする問題に対処する。
条件分布を明示的に推定しない新しい非パラメトリック試験法を提案する。
論文 参考訳(メタデータ) (2024-07-25T01:28:59Z) - High-dimensional analysis of ridge regression for non-identically distributed data with a variance profile [0.0]
線形回帰に対する尾根推定器の予測リスクを分散プロファイルを用いて検討した。
ある種の分散プロファイルについては、よく知られた二重降下現象の出現に注目した。
また、独立分散データと同一分散データの標準設定で存在する類似点と相違点についても検討する。
論文 参考訳(メタデータ) (2024-03-29T14:24:49Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - The out-of-sample $R^2$: estimation and inference [0.0]
2つの予測モデルの比較として、アウト・オブ・サンプルの$R2$を定義する。
我々は、$hatR2$の標準誤差を提供するために、データ分割推定の不確実性に関する最近の理論的進歩を利用する。
論文 参考訳(メタデータ) (2023-02-10T09:29:57Z) - Efficient Truncated Linear Regression with Unknown Noise Variance [26.870279729431328]
雑音のばらつきが不明な場合に, 線形回帰の計算的, 統計的に効率的な推定器を提案する。
提案手法は, トランキャット標本の負の類似度に対して, プロジェクテッド・グラディエント・ディフレッシュを効果的に実装することに基づく。
論文 参考訳(メタデータ) (2022-08-25T12:17:37Z) - Robust Variable Selection and Estimation Via Adaptive Elastic Net
S-Estimators for Linear Regression [0.0]
同時変数選択と係数推定のための新しい頑健な正規化推定器を提案する。
適応PENSEは、残基のスケールに関する事前の知識のないオラクル特性を持つ。
シミュレーションおよび実データ集合に関する数値的研究は、広範囲な設定において優れた有限サンプル性能を示す。
論文 参考訳(メタデータ) (2021-07-07T16:04:08Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Individual Calibration with Randomized Forecasting [116.2086707626651]
予測値がランダムに設定された場合,各サンプルのキャリブレーションは回帰設定で可能であることを示す。
我々は、個別の校正を強制する訓練目標を設計し、それをランダム化された回帰関数の訓練に使用する。
論文 参考訳(メタデータ) (2020-06-18T05:53:10Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。