論文の概要: Learning with little mixing
- arxiv url: http://arxiv.org/abs/2206.08269v1
- Date: Thu, 16 Jun 2022 16:06:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-17 20:29:12.410702
- Title: Learning with little mixing
- Title(参考訳): 少し混ぜて学ぶこと
- Authors: Ingvar Ziemann, Stephen Tu
- Abstract要約: マーチンゲール差雑音を考慮した実測可能な時系列フレームワークにおける正方損失について検討する。
この結果から, トラジェクトリ過収縮条件が成立するたびに, 従属データに対する最小二乗推定器のリスクが, バーンイン時間後におけるイドレートの順に一致していることが示唆された。
- 参考スコア(独自算出の注目度): 7.518176633928742
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study square loss in a realizable time-series framework with martingale
difference noise. Our main result is a fast rate excess risk bound which shows
that whenever a trajectory hypercontractivity condition holds, the risk of the
least-squares estimator on dependent data matches the iid rate order-wise after
a burn-in time. In comparison, many existing results in learning from dependent
data have rates where the effective sample size is deflated by a factor of the
mixing-time of the underlying process, even after the burn-in time.
Furthermore, our results allow the covariate process to exhibit long range
correlations which are substantially weaker than geometric ergodicity. We call
this phenomenon learning with little mixing, and present several examples for
when it occurs: bounded function classes for which the $L^2$ and
$L^{2+\epsilon}$ norms are equivalent, ergodic finite state Markov chains,
various parametric models, and a broad family of infinite dimensional
$\ell^2(\mathbb{N})$ ellipsoids. By instantiating our main result to system
identification of nonlinear dynamics with generalized linear model transitions,
we obtain a nearly minimax optimal excess risk bound after only a polynomial
burn-in time.
- Abstract(参考訳): 我々は,martingale差分雑音を持つ実時間時系列フレームワークにおける正方形損失について検討する。
私たちの主な結果は、軌道上のハイパーコントラクティビティ条件が成立するたびに、依存するデータに対する最小二乗推定器のリスクがバーンイン後のiidレートの順番に一致することを示す、速いレート過剰なリスクバウンドです。
それに対して、依存データから学習する既存の結果の多くは、有効サンプルサイズがバーンイン時間後であっても、基礎プロセスの混合時間の要因によって膨張する速度を持つ。
さらに,共変量過程は,幾何学的エルゴード性よりもかなり弱い長距離相関を示すことができる。
l^2$ と $l^{2+\epsilon}$ノルムが等価である有界関数クラス、エルゴード有限状態マルコフ連鎖、様々なパラメトリックモデル、無限次元 $\ell^2(\mathbb{n})$ ellipsoids の広い族。
一般化線形モデル遷移による非線形力学のシステム同定に主結果をインスタンス化することにより、多項式バーンイン時間のみに制限された最小限の最適余剰リスクが得られる。
関連論文リスト
- Extreme Value Modelling of Feature Residuals for Anomaly Detection in Dynamic Graphs [14.8066991252587]
グラフの時間的シーケンスにおける異常の検出は、トランスポートネットワークにおける事故の検出や、コンピュータネットワークにおけるサイバー攻撃といった分野に適用することができる。
既存の異常グラフ検出方法は、高い偽陽性率や可変サイズのグラフの扱いの難しさ、非自明な時間ダイナミクスなど、複数の制限に悩まされることがある。
そこで本稿では,時間的依存を時系列解析によって時間的依存を明示的にモデル化し,残差を用いて依存を除去する手法を提案する。
論文 参考訳(メタデータ) (2024-10-08T05:00:53Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
さらに、テストポイントがトレーニングセットと非自明な相関を持ち、時系列予測で頻繁に発生するような場合まで分析を拡張します。
我々は多種多様な高次元データにまたがって理論を検証する。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Precise analysis of ridge interpolators under heavy correlations -- a Random Duality Theory view [0.0]
EmphRandom Duality Theory (RDT) を用いて, 関心量の最適化に係わるすべての推定器の正確なクローズドな形状のキャラクタリゼーションが得られることを示す。
論文 参考訳(メタデータ) (2024-06-13T14:56:52Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - Polynomial-Time Solutions for ReLU Network Training: A Complexity
Classification via Max-Cut and Zonotopes [70.52097560486683]
我々は、ReLUネットワークの近似の難しさがマックス・カッツ問題の複雑さを反映しているだけでなく、特定の場合において、それと完全に一致することを証明した。
特に、$epsilonleqsqrt84/83-1approx 0.006$とすると、目的値に関して相対誤差$epsilon$でReLUネットワーク対象の近似グローバルデータセットを見つけることはNPハードであることが示される。
論文 参考訳(メタデータ) (2023-11-18T04:41:07Z) - A U-turn on Double Descent: Rethinking Parameter Counting in Statistical
Learning [68.76846801719095]
二重降下がいつどこで起こるのかを正確に示し、その位置が本質的に閾値 p=n に結び付けられていないことを示す。
これは二重降下と統計的直観の間の緊張を解消する。
論文 参考訳(メタデータ) (2023-10-29T12:05:39Z) - Benign Overfitting in Time Series Linear Model with
Over-Parameterization [5.68558935178946]
複数の依存型に基づく推定器の過大なリスクの理論を考案する。
短期記憶プロセスにおけるリスクの収束率は、独立データの場合と同一であることを示す。
論文 参考訳(メタデータ) (2022-04-18T15:26:58Z) - Sampling Approximately Low-Rank Ising Models: MCMC meets Variational
Methods [35.24886589614034]
一般相互作用が$J$である超キューブ上の二次定値イジングモデルを考える。
我々の一般的な結果は、低ランクのIsingモデルに対する最初のサンプリングアルゴリズムを示唆している。
論文 参考訳(メタデータ) (2022-02-17T21:43:50Z) - Bayesian Inference in High-Dimensional Time-Serieswith the Orthogonal
Stochastic Linear Mixing Model [2.7909426811685893]
現代の時系列データセットの多くは、長期間にわたってサンプリングされた大量の出力応答変数を含んでいる。
本稿では,多種多様な大規模時系列データセット解析のための新しいマルコフ連鎖モンテカルロフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-25T01:12:54Z) - Consistency of mechanistic causal discovery in continuous-time using
Neural ODEs [85.7910042199734]
ダイナミカルシステムの研究において,連続時間における因果的発見を検討する。
本稿では,ニューラルネットワークを用いた因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-05-06T08:48:02Z) - Interpolation and Learning with Scale Dependent Kernels [91.41836461193488]
非パラメトリックリッジレス最小二乗の学習特性について検討する。
スケール依存カーネルで定義される推定器の一般的な場合を考える。
論文 参考訳(メタデータ) (2020-06-17T16:43:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。