論文の概要: Online learning of smooth functions on $\mathbb{R}$
- arxiv url: http://arxiv.org/abs/2604.03525v1
- Date: Sat, 04 Apr 2026 00:08:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.622313
- Title: Online learning of smooth functions on $\mathbb{R}$
- Title(参考訳): $\mathbb{R}$上の滑らかな関数のオンライン学習
- Authors: Jesse Geneson, Kuldeep Singh, Alexander Wang,
- Abstract要約: 実数値関数の逆オンライン学習を$mathbbR$で研究する。
任意の$p$-loss $sum_tge 1|hat y_t-f(x_t)|p$ に対して、敵は無限の損失を強いることができる。
- 参考スコア(独自算出の注目度): 46.81931064034358
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study adversarial online learning of real-valued functions on $\mathbb{R}$. In each round the learner is queried at $x_t\in\mathbb{R}$, predicts $\hat y_t$, and then observes the true value $f(x_t)$; performance is measured by cumulative $p$-loss $\sum_{t\ge 1}|\hat y_t-f(x_t)|^p$. For the class \[ \mathcal{G}_q=\Bigl\{f:\mathbb{R}\to\mathbb{R}\ \text{absolutely continuous}:\ \int_{\mathbb{R}}|f'(x)|^q\,dx\le 1\Bigr\}, \] we show that the standard model becomes ill-posed on $\mathbb{R}$: for every $p\ge 1$ and $q>1$, an adversary can force infinite loss. Motivated by this obstruction, we analyze three modified learning scenarios that limit the influence of queries that are far from previously observed inputs. In Scenario 1 the adversary must choose each new query within distance $1$ of some past query. In Scenario 2 the adversary may query anywhere, but the learner is penalized only on rounds whose query lies within distance $1$ of a past query. In Scenario 3 the loss in round $t$ is multiplied by a weight $g(\min_{j<t}|x_t-x_j|)$. We obtain sharp characterizations for Scenarios 1-2 in several regimes. For Scenario 3 we identify a clean threshold phenomenon: if $g$ decays too slowly, then the adversary can force infinite weighted loss. In contrast, for rapidly decaying weights such as $g(z)=e^{-cz}$ we obtain finite and sharp guarantees in the quadratic case $p=q=2$. Finally, we study a natural multivariable slice generalization $\mathcal{G}_{q,d}$ of $\mathcal{G}_q$ on $\mathbb{R}^d$ and show a sharp dichotomy: while the one-dimensional case admits finite opt-values in certain regimes, for every $d\ge 2$ the slice class $\mathcal{G}_{q,d}$ is too permissive, and even under Scenarios 1-3 an adversary can force infinite loss.
- Abstract(参考訳): 実数値関数の逆オンライン学習を$\mathbb{R}$で研究する。
各ラウンドで学習者は$x_t\in\mathbb{R}$で問合せされ、$\hat y_t$を予測し、次に真値$f(x_t)$を観測し、累積$p$-loss$\sum_{t\ge 1}|\hat y_t-f(x_t)|^p$でパフォーマンスを測定する。
クラス \[ \mathcal{G}_q=\Bigl\{f:\mathbb{R}\to\mathbb{R}\ \text{absolutely continuous}:\ \int_{\mathbb{R}}|f'(x)|^q\,dx\le 1\Bigr\}, \] に対して、標準モデルは$\mathbb{R}$に悪影響を及ぼす。
この障害によって動機付けられた3つの修正学習シナリオを解析し、従来観測されていた入力から遠く離れたクエリの影響を制限する。
シナリオ1では、敵は過去のクエリから1ドル以内で、それぞれの新しいクエリを選択する必要がある。
シナリオ2では、相手はどこでもクエリできるが、学習者は過去のクエリの1ドル以内のラウンドでのみペナル化される。
シナリオ3では、ラウンド$t$の損失は重量$g(\min_{j<t}|x_t-x_j|)$で乗算される。
いくつかの制度において、シナリオ1-2の鋭い特徴付けを得る。
シナリオ3では、クリーンなしきい値現象が特定される:$g$が崩壊しすぎると、敵は無限の重み付き損失を強いる。
対照的に、$g(z)=e^{-cz}$のような急速に崩壊する重みに対して、2次の場合$p=q=2$で有限かつ鋭い保証を得る。
最後に、自然な多変数スライス一般化 $\mathcal{G}_{q,d}$ of $\mathcal{G}_q$ on $\mathbb{R}^d$ を研究し、鋭い二分法を示す。
関連論文リスト
- High-Dimensional Calibration from Swap Regret [40.9736612423411]
任意の凸集合 $mathcalP 部分集合 mathbbRd$ 上での多次元予測のオンライン校正について検討する。
我々は、$O(sqrtrho T)$$$T$ラウンド後の最悪の後悔を保証できるならば、$T = exp(logd/epsilon2) の後、$epsilon$-calibrated 予測を得ることができることを示した。
論文 参考訳(メタデータ) (2025-05-27T17:31:47Z) - Worst-case Error Bounds for Online Learning of Smooth Functions [0.0]
本研究では,あるスムーズな制約のある実関数のオンライン学習における最悪の誤りについて検討する。
すべての$p, q ge 2$ および $eta ge 1$ に対して $operatornameopttextnf_p, eta (mathcalF_q)$ は有限であることを示す。
また、スムーズな関数のオンライン学習のためのノイズモデルを定義し、学習者は最大1回まで誤ったフィードバックを受けることができる。
論文 参考訳(メタデータ) (2025-02-23T00:43:10Z) - Monge-Kantorovich Fitting With Sobolev Budgets [6.748324975906262]
我々は、$rho$が$mtext-d$集合の近くに集中しているとき、これをノイズのあるデータを持つ多様体学習問題と解釈できることを示した。
Monge-Kantorovich $p$-cost $mathbbW_pp(rho, nu)$を介して$rho$を近似する際の$nu$のパフォーマンスを定量化し、$mathrmsupp nu$を$f : mathbbRmでカバーできるようにすることで複雑さを制限します。
論文 参考訳(メタデータ) (2024-09-25T01:30:16Z) - Online Learning with Adversaries: A Differential-Inclusion Analysis [52.43460995467893]
我々は,完全に非同期なオンラインフェデレート学習のための観察行列ベースのフレームワークを提案する。
我々の主な結果は、提案アルゴリズムがほぼ確実に所望の平均$mu.$に収束することである。
新たな差分包摂型2時間スケール解析を用いて,この収束を導出する。
論文 参考訳(メタデータ) (2023-04-04T04:32:29Z) - On Optimal Learning Under Targeted Data Poisoning [48.907813854832206]
本研究は,学習者によって達成可能な最小のエラー$epsilon=epsilon(eta)$を,そのような敵の存在下で特徴付けることを目的とする。
注目すべきは,上界が決定論的学習者によって達成できることである。
論文 参考訳(メタデータ) (2022-10-06T06:49:48Z) - Low-degree learning and the metric entropy of polynomials [44.99833362998488]
少なくとも$Omega(sqrtvarepsilon)2dlog n leq log mathsfM(mathscrF_n,d,|cdot|_L,varepsilon)は2辺の推定値$c(1-varepsilon)2dlogを満たす。
論文 参考訳(メタデータ) (2022-03-17T23:52:08Z) - Optimal SQ Lower Bounds for Learning Halfspaces with Massart Noise [9.378684220920562]
マスアートノイズの存在下でハーフスペースを学習するための、最も厳密な統計クエリ(SQ)の下界。
任意の $eta in [0,1/2]$ に対して、$eta$ よりも誤り分類誤差の少ない全ての SQ アルゴリズムは、スーパーポリノミカルな精度のクエリを必要とすることを示す。
論文 参考訳(メタデータ) (2022-01-24T17:33:19Z) - A note on the price of bandit feedback for mistake-bounded online
learning [0.0]
標準モデルとバンディットモデルは、ミスバウンドモデルからオンラインマルチクラス分類への一般化である。
両方のモデルでは、学習者は各ラウンドで分類を推測しますが、標準モデルでは、学習者は各推測後に正しい分類を受け取ります。
この補題は、$s$ と $t$ が互いに複数の mod $p$ である場合に正確に偽であることを示す。
論文 参考訳(メタデータ) (2021-01-18T06:00:30Z) - Near-Optimal SQ Lower Bounds for Agnostically Learning Halfspaces and
ReLUs under Gaussian Marginals [49.60752558064027]
ガウス境界の下では、半空間とReLUを不可知的に学習する基本的な問題について検討する。
我々の下限は、これらのタスクの現在の上限が本質的に最良のものであるという強い証拠を与える。
論文 参考訳(メタデータ) (2020-06-29T17:10:10Z) - Taking a hint: How to leverage loss predictors in contextual bandits? [63.546913998407405]
我々は,損失予測の助けを借りて,文脈的包帯における学習を研究する。
最適な後悔は$mathcalO(minsqrtT, sqrtmathcalETfrac13)$である。
論文 参考訳(メタデータ) (2020-03-04T07:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。