論文の概要: Functional Linear Regression of Cumulative Distribution Functions
- arxiv url: http://arxiv.org/abs/2205.14545v3
- Date: Fri, 8 Mar 2024 04:50:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 23:56:36.145246
- Title: Functional Linear Regression of Cumulative Distribution Functions
- Title(参考訳): 累積分布関数の関数線形回帰
- Authors: Qian Zhang, Anuran Makur, and Kamyar Azizzadenesheli
- Abstract要約: 本稿では,CDFを至る所で正確に推定する機能リッジ回帰に基づく推定手法を提案する。
固定設計, ランダム設計, 対逆コンテキストの場合の$widetilde O(sqrtd/n)$の推定誤差上限を示す。
パラメータ空間が無限次元ヒルベルト空間である無限次元モデルを定式化し、この設定に対して自己正規化推定誤差上限を確立する。
- 参考スコア(独自算出の注目度): 20.96177061945288
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The estimation of cumulative distribution functions (CDF) is an important
learning task with a great variety of downstream applications, such as risk
assessments in predictions and decision making. In this paper, we study
functional regression of contextual CDFs where each data point is sampled from
a linear combination of context dependent CDF basis functions. We propose
functional ridge-regression-based estimation methods that estimate CDFs
accurately everywhere. In particular, given $n$ samples with $d$ basis
functions, we show estimation error upper bounds of $\widetilde O(\sqrt{d/n})$
for fixed design, random design, and adversarial context cases. We also derive
matching information theoretic lower bounds, establishing minimax optimality
for CDF functional regression. Furthermore, we remove the burn-in time in the
random design setting using an alternative penalized estimator. Then, we
consider agnostic settings where there is a mismatch in the data generation
process. We characterize the error of the proposed estimators in terms of the
mismatched error, and show that the estimators are well-behaved under model
mismatch. Moreover, to complete our study, we formalize infinite dimensional
models where the parameter space is an infinite dimensional Hilbert space, and
establish a self-normalized estimation error upper bound for this setting.
Notably, the upper bound reduces to the $\widetilde O(\sqrt{d/n})$ bound when
the parameter space is constrained to be $d$-dimensional. Our comprehensive
numerical experiments validate the efficacy of our estimation methods in both
synthetic and practical settings.
- Abstract(参考訳): 累積分布関数(CDF)の推定は、予測や意思決定におけるリスク評価など、さまざまな下流アプリケーションにおいて重要な学習課題である。
本稿では,文脈依存型CDF基底関数の線形結合から各データ点をサンプリングする文脈依存CDFの機能回帰について検討する。
我々は,cdfを正確に推定する機能的リッジ回帰に基づく推定法を提案する。
特に、$d$ 基底関数を持つ$n$ サンプルを与えられた場合、固定設計、ランダム設計、逆文脈ケースに対して$\widetilde o(\sqrt{d/n})$ の上限推定誤差を示す。
また、マッチング情報理論の下界を導出し、CDF機能回帰の最小最適性を確立する。
さらに、別のペナル化推定器を用いてランダムな設計設定におけるバーンイン時間を除去する。
次に、データ生成プロセスにミスマッチがある場合の非依存的な設定について考察する。
提案する推定器の誤差をミスマッチ誤差の観点で特徴付け,モデルミスマッチ下で推定器が十分に整備されていることを示す。
さらに, パラメータ空間が無限次元ヒルベルト空間である無限次元モデルを定式化し, この設定の自己正規化推定誤差を上限として定式化する。
特に上界は、パラメータ空間が$d$次元に制約されているとき、$\widetilde O(\sqrt{d/n})$boundに還元される。
総合的な数値実験により, 総合的, 実用的両面において, 評価手法の有効性が検証された。
関連論文リスト
- Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - An Agnostic View on the Cost of Overfitting in (Kernel) Ridge Regression [34.331394834838804]
雑音性カーネルリッジ回帰(KRR)におけるオーバーフィッティングのコストについて検討する。
サンプルサイズが整合性に十分でない場合や,RKHSの外部にある場合であっても,そのコストは対象関数のサンプルサイズ関数として考慮する。
我々の分析は、良心的、誘惑的、破滅的なオーバーフィッティングのより洗練された特徴を提供する。
論文 参考訳(メタデータ) (2023-06-22T20:03:05Z) - Kernel-based off-policy estimation without overlap: Instance optimality
beyond semiparametric efficiency [53.90687548731265]
本研究では,観測データに基づいて線形関数を推定するための最適手順について検討する。
任意の凸および対称函数クラス $mathcalF$ に対して、平均二乗誤差で有界な非漸近局所ミニマックスを導出する。
論文 参考訳(メタデータ) (2023-01-16T02:57:37Z) - Conditional Distribution Function Estimation Using Neural Networks for
Censored and Uncensored Data [0.0]
検閲されたデータと検閲されていないデータの両方に対してニューラルネットワークを用いて条件分布関数を推定することを検討する。
本研究では,提案手法が望ましい性能を有することを示す一方で,モデル仮定に違反した場合に偏りのある推定値が得られることを示す。
論文 参考訳(メタデータ) (2022-07-06T01:12:22Z) - Experimental Design for Linear Functionals in Reproducing Kernel Hilbert
Spaces [102.08678737900541]
線形汎関数に対するバイアス認識設計のためのアルゴリズムを提供する。
準ガウス雑音下での固定および適応設計に対する漸近的でない信頼集合を導出する。
論文 参考訳(メタデータ) (2022-05-26T20:56:25Z) - Minimax Estimation of Conditional Moment Models [40.95498063465325]
min-max基準関数を導入し,ゼロサムゲームの解法とみなすことができる。
任意の仮説空間に対する結果推定器の統計的推定速度を解析する。
修正された平均二乗誤差率と、逆問題の不備とが組み合わさって、平均二乗誤差率をもたらすことを示す。
論文 参考訳(メタデータ) (2020-06-12T14:02:38Z) - Reinforcement Learning with General Value Function Approximation:
Provably Efficient Approach via Bounded Eluder Dimension [124.7752517531109]
一般値関数近似を用いた効率の良い強化学習アルゴリズムを確立する。
我々のアルゴリズムは、$d$が複雑性測度である場合、$widetildeO(mathrmpoly(dH)sqrtT)$の後悔の限界を達成することを示す。
我々の理論は線形値関数近似によるRLの最近の進歩を一般化し、環境モデルに対する明示的な仮定をしない。
論文 参考訳(メタデータ) (2020-05-21T17:36:09Z) - Error bounds in estimating the out-of-sample prediction error using
leave-one-out cross validation in high-dimensions [19.439945058410203]
高次元状態におけるサンプル外リスク推定の問題について検討する。
広範囲にわたる経験的証拠は、アウト・ワン・アウト・クロス・バリデーションの正確さを裏付ける。
この理論の技術的利点の1つは、拡張可能な近似LOに関する最近の文献から得られたいくつかの結果を明確化し、接続することができることである。
論文 参考訳(メタデータ) (2020-03-03T20:07:07Z) - Minimax-Optimal Off-Policy Evaluation with Linear Function Approximation [49.502277468627035]
本稿では,関数近似を用いたバッチデータ強化学習の統計的理論について検討する。
記録履歴から新たな対象政策の累積値を推定するオフ・ポリティクス評価問題を考察する。
論文 参考訳(メタデータ) (2020-02-21T19:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。