論文の概要: Gradient-Free Warm-Start Library Recovery: an Amortized-Regret Separation
- arxiv url: http://arxiv.org/abs/2606.21253v1
- Date: Fri, 19 Jun 2026 09:30:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 07:03:34.245998
- Title: Gradient-Free Warm-Start Library Recovery: an Amortized-Regret Separation
- Title(参考訳): グラディエントフリー・ワームスタート・ライブラリー・リカバリ--アモータライズ・レグレト分離
- Authors: Jianwei Lou,
- Abstract要約: 勾配のない継続的学習、ローカル、オンライン、追加のみの学習は、エッジとストリーミングデプロイメントにとって魅力的なものだ。
繰り返し再生するストリームについて、証明可能な説明をします。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Continual learning that is gradient-free, local, online, and append-only is attractive for edge and streaming deployment, but its value is usually argued informally. We give a provable account on recurring-regime streams. Given segmentation, a warm-start library learner attains amortized recovery cost $O\!\big(KD/\varepsilon^2+(R-K)\logK/Δ^2\big)$ versus a memoryless re-estimator's $Θ(RD/\varepsilon^2)$, an advantage $(R-K)\,Θ(D/\varepsilon^2)$ growing with dimension $D$ and recurrence density. The mechanism is a decoupling: recognizing which of $K$ seen regimes is active costs $O(\log K/Δ^2)$, independent of $D$, whereas estimating a regime costs $Θ(D/\varepsilon^2)$. We prove this is tight: matching lower bounds give recognition $Θ(\log K/Δ^2)$ and a memoryless-class bound $Ω(RD/\varepsilon^2)$, so each term is individually minimax-tight (the joint statement is conditional). The separation is born-immune (a memoryless learner's advantage is identically zero) and paradigm-level: it matches, and does not beat, a fair spawn-capable Bayesian baseline; the contribution is attaining this cost structure without end-to-end backprop and with zero forgetting by construction. A count-calibrated variant ties the baseline's leading constant up to a bounded, never-negative per-recurrence overshoot, hyperparameter-free and with no per-step transcendentals. We bound the scope: recognizable regimes are capped by simplex packing (walls $e^{Θ(D)}$); autonomous segmentation is impossible at the packing wall (no detector escapes the false-alarm/delay frontier as regimes overlap); the advantage vanishes under overlap. The dimension-dependent separation is corroborated on synthetic streams and real $k$-mer genome distributions (memoryless cost $\propto D^{1.04}$, recognition $D$-independent); the one real sequential stream sits in the $D{=}1$ near-null corner.
- Abstract(参考訳): 勾配のない継続的学習、ローカル、オンライン、追加のみの学習は、エッジおよびストリーミングデプロイメントには魅力的だが、その価値は通常非公式に議論されている。
繰り返し再生するストリームについて、証明可能な説明をします。
セグメンテーションによって、ウォームスタートライブラリ学習者は、償却されたリカバリコストを$O\!
\big(KD/\varepsilon^2+(R-K)\logK/Δ^2\big)$と、メモリレス再推定器の$(RD/\varepsilon^2)$, an advantage $(R-K)\,\(D/\varepsilon^2)$は次元$D$と繰り返し密度で成長する。
このメカニズムはデカップリングであり、$K$のどのレジームがアクティブコスト$O(\log K/Δ^2)$、$D$とは独立であり、一方、レジームを見積もるレジームは$(D/\varepsilon^2)$である。
一致した下界は、認識する$(\log K/Δ^2)$と、メモリレスクラス境界$Ω(RD/\varepsilon^2)$を与えるので、それぞれの項は極小である(共同文は条件付きである)。
分離は生まれつき免疫(記憶のない学習者の優位性はゼロ)であり、パラダイムレベルである:それは一致し、打ち負かさず、公平な産卵能力を持つベイズベースラインである;貢献は、エンドツーエンドのバックプロップなしでコスト構造を達成し、建設によって忘れることなく達成する。
カウントキャリブレーションされた変種は、ベースラインの先頭定数を、有界で非負の逆数毎のオーバーシュート、ハイパーパラメータフリー、ステップ毎の超越性に結び付けている。
認識可能なレジームは単純なパッキング(壁$e^{*(D)}$); 自動セグメンテーションはパッキングウォールでは不可能(レジームが重なるにつれて、デザイナは偽アラーム/遅延フロンティアから逃れることはできない)。
次元依存的分離は、合成ストリームと実際の$k$-merゲノム分布(メモリレスコスト$\propto D^{1.04}$、認識$D$-independent)で相関する。
関連論文リスト
- Optimal Dimension-Free Sampling for Regularized Classification [56.72526267755301]
我々は、リプシッツ連続分類損失関数の幅広いクラスに対して、$(1pmvarepsilon)$-relativeエラーを達成する最適サンプリング境界を証明した。
これにはロジスティックやシグモイドの損失、ヒンジの損失、ReLUの損失といった重要な機能が含まれており、顕著で一般的な例である。
論文 参考訳(メタデータ) (2026-05-22T15:05:33Z) - Trade-off Functions for DP-SGD with Subsampling based on Random Shuffling: Tight Upper and Lower Bounds [7.787109481104569]
ランダムシャッフルに基づくサブサンプリングによるDP-SGDのトレードオフ関数の厳密な解析を導出する。
Berry-Esseenの定理によって導かれる我々の具体的な境界は、証明フレームワーク内の定数要素に密着している。
論文 参考訳(メタデータ) (2026-05-07T13:35:43Z) - Online Realizable Regression and Applications for ReLU Networks [14.292982828097465]
近似三角形の不等式を満たす損失(擬似測度)下での対向モデルにおける実現可能なオンライン回帰について検討する。
我々の主な貢献は、具体的なダドリー型エントロピー積分により、$mathbbD_mathrmonl$を上界とする一般ポテンシャル法である。
論文 参考訳(メタデータ) (2026-02-22T13:02:25Z) - Robust learning of halfspaces under log-concave marginals [6.852292115526837]
線形しきい値関数を学習し、境界体積$O(r+varepsilon)$の分類子を半径摂動$r$で返すアルゴリズムを与える。
dtildeO(1/varepsilon2)$の時間とサンプルの複雑さはブール回帰の複雑さと一致する。
論文 参考訳(メタデータ) (2025-05-19T20:12:16Z) - A Unified Framework for Uniform Signal Recovery in Nonlinear Generative
Compressed Sensing [68.80803866919123]
非線形測定では、ほとんどの先行結果は一様ではない、すなわち、すべての$mathbfx*$に対してではなく、固定された$mathbfx*$に対して高い確率で保持される。
本フレームワークはGCSに1ビット/一様量子化観測と単一インデックスモデルを標準例として適用する。
また、指標集合が計量エントロピーが低い製品プロセスに対して、より厳密な境界を生み出す濃度不等式も開発する。
論文 参考訳(メタデータ) (2023-09-25T17:54:19Z) - Optimal Sketching Bounds for Sparse Linear Regression [116.30196615349226]
我々は、$ell_p$ノルムや広範なヒンジ様損失関数のクラスから、様々な損失関数の下で、$k$スパース線形回帰の難読スケッチを研究する。
スパース$ell$varepsレグレッションの場合、$Theta(klog(d/k)/varepsilon2)$ rowsでスケッチの上に曖昧な分布が存在し、これは定数要素に固執することを示している。
また、$O(mu2 klog(mun d/varepsilon)/varのスケッチも示します。
論文 参考訳(メタデータ) (2023-04-05T07:24:19Z) - Sparse Signal Detection in Heteroscedastic Gaussian Sequence Models:
Sharp Minimax Rates [1.0309387309011746]
スパースな代替品に対する信号検出問題を、既知のスパシティ$s$に対して検討する。
ミニマックス分離半径$epsilon*$の上の上限と下限を見つけ、それらが常に一致することを証明する。
以上の結果から,epsilon*$の挙動に関する新たな位相遷移が,Sigma$の疎度レベル,$Lt$メトリック,およびヘテロスセダサシティプロファイル(herescedasticity profile)に現れる。
論文 参考訳(メタデータ) (2022-11-15T23:53:39Z) - Horizon-Free and Variance-Dependent Reinforcement Learning for Latent
Markov Decision Processes [62.90204655228324]
我々は,後期マルコフ決定過程(LMDP)における強化学習(RL)の文脈を考慮した後悔の最小化について検討した。
我々は,モデル最適化と値最適化の両手法でインスタンス化できる,新しいモデルベースアルゴリズムフレームワークを設計する。
論文 参考訳(メタデータ) (2022-10-20T21:32:01Z) - Sampling from Log-Concave Distributions with Infinity-Distance
Guarantees and Applications to Differentially Private Optimization [33.38289436686841]
本稿では,dis distributionO(varepsilon)$close から$ infinity-distance に点を出力するアルゴリズムを提案する。
また、ディキンウォークの「ソフトパイ」バージョンも提示する。
論文 参考訳(メタデータ) (2021-11-07T13:44:50Z) - Private Stochastic Convex Optimization: Optimal Rates in $\ell_1$
Geometry [69.24618367447101]
対数要因まで $(varepsilon,delta)$-differently private の最適過剰人口損失は $sqrtlog(d)/n + sqrtd/varepsilon n.$ です。
損失関数がさらなる滑らかさの仮定を満たすとき、余剰損失は$sqrtlog(d)/n + (log(d)/varepsilon n)2/3で上界(対数因子まで)であることが示される。
論文 参考訳(メタデータ) (2021-03-02T06:53:44Z) - Agnostic Learning of a Single Neuron with Gradient Descent [92.7662890047311]
期待される正方形損失から、最も適合した単一ニューロンを学習することの問題点を考察する。
ReLUアクティベーションでは、我々の人口リスク保証は$O(mathsfOPT1/2)+epsilon$である。
ReLUアクティベーションでは、我々の人口リスク保証は$O(mathsfOPT1/2)+epsilon$である。
論文 参考訳(メタデータ) (2020-05-29T07:20:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。