論文の概要: Continuous Prediction with Experts' Advice
- arxiv url: http://arxiv.org/abs/2206.00236v1
- Date: Wed, 1 Jun 2022 05:09:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-02 16:43:14.085208
- Title: Continuous Prediction with Experts' Advice
- Title(参考訳): 専門家のアドバイスによる連続予測
- Authors: Victor Sanches Portella, Christopher Liaw, Nicholas J. A. Harvey
- Abstract要約: 専門家のアドバイスによる予測は、オンライン学習における最も基本的な問題の1つである。
近年の研究では、微分方程式のレンズと連続時間解析によるオンライン学習が研究されている。
- 参考スコア(独自算出の注目度): 10.98975673892221
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prediction with experts' advice is one of the most fundamental problems in
online learning and captures many of its technical challenges. A recent line of
work has looked at online learning through the lens of differential equations
and continuous-time analysis. This viewpoint has yielded optimal results for
several problems in online learning.
In this paper, we employ continuous-time stochastic calculus in order to
study the discrete-time experts' problem. We use these tools to design a
continuous-time, parameter-free algorithm with improved guarantees for the
quantile regret. We then develop an analogous discrete-time algorithm with a
very similar analysis and identical quantile regret bounds. Finally, we design
an anytime continuous-time algorithm with regret matching the optimal
fixed-time rate when the gains are independent Brownian Motions; in many
settings, this is the most difficult case. This gives some evidence that, even
with adversarial gains, the optimal anytime and fixed-time regrets may
coincide.
- Abstract(参考訳): 専門家のアドバイスによる予測は、オンライン学習における最も根本的な問題の1つであり、その技術的な課題の多くを捉えている。
最近の研究は、微分方程式のレンズと連続時間解析によるオンライン学習に注目している。
この視点は、オンライン学習におけるいくつかの問題に対して最適な結果をもたらす。
本稿では,離散時間専門家の問題を研究するために,連続時間確率計算を用いる。
これらのツールを使用して、量子的後悔の保証を改善した、連続時間でパラメータフリーなアルゴリズムを設計する。
次に、非常に類似した解析と同一の量的後悔境界を持つ類似の離散時間アルゴリズムを開発する。
最後に,ゲインが独立なブラウン運動である場合の最適固定時間率に一致することを後悔して,任意の時間連続時間アルゴリズムを設計する。
これは、敵対的な利益であっても、最適な時限と固定時間後悔が一致する可能性があるといういくつかの証拠を与える。
関連論文リスト
- Learning-Augmented Algorithms with Explicit Predictors [67.02156211760415]
アルゴリズム設計の最近の進歩は、過去のデータと現在のデータから得られた機械学習モデルによる予測の活用方法を示している。
この文脈における以前の研究は、予測器が過去のデータに基づいて事前訓練され、ブラックボックスとして使用されるパラダイムに焦点を当てていた。
本研究では,予測器を解き,アルゴリズムの課題の中で生じる学習問題を統合する。
論文 参考訳(メタデータ) (2024-03-12T08:40:21Z) - Improving Adaptive Online Learning Using Refined Discretization [44.646191058243645]
リプシッツ損失を伴う制約のないオンライン線形最適化について検討する。
インスタンス最適性の追求に動機づけられ,我々は新しいアルゴリズムを提案する。
これらの結果の中心は、オンライン学習に対する継続的な時間的アプローチである。
論文 参考訳(メタデータ) (2023-09-27T21:54:52Z) - Bayesian Q-learning With Imperfect Expert Demonstrations [56.55609745121237]
そこで本研究では,Q-ラーニングを高速化するアルゴリズムを提案する。
我々は,スパース・リワード・チェーン環境と,より複雑な6つのアタリゲームに対して,報酬の遅れによるアプローチを評価した。
論文 参考訳(メタデータ) (2022-10-01T17:38:19Z) - Optimal Tracking in Prediction with Expert Advice [0.0]
専門家のアドバイス設定を用いて予測を検証し、専門家の集合が生み出す決定を組み合わせて意思決定を行うことを目的とする。
我々は、専門家のアドバイス設定による予測の下で、最小限の動的後悔を達成する。
我々のアルゴリズムは、このような普遍的に最適で適応的で真にオンラインの保証を、事前の知識なしで生成した最初のアルゴリズムです。
論文 参考訳(メタデータ) (2022-08-07T12:29:54Z) - Near-Linear Time Algorithm with Near-Logarithmic Regret Per Switch for
Mixable/Exp-Concave Losses [0.0]
動的環境における対数的静的後悔を伴う混合損失関数のオンライン最適化について検討する。
文献では,スイッチ1回あたりのほぼ対数的後悔を1時間あたりのポリノミカルな複雑さで達成できることが確認できた。
論文 参考訳(メタデータ) (2021-09-28T15:06:31Z) - Contrastive learning of strong-mixing continuous-time stochastic
processes [53.82893653745542]
コントラスト学習(Contrastive Learning)は、ラベルのないデータから構築された分類タスクを解決するためにモデルを訓練する自己指導型の手法のファミリーである。
拡散の場合,小~中距離間隔の遷移カーネルを適切に構築したコントラスト学習タスクを用いて推定できることが示される。
論文 参考訳(メタデータ) (2021-03-03T23:06:47Z) - A closer look at temporal variability in dynamic online learning [19.468067110814808]
この作品は、完全な情報でオンライン学習の文脈でダイナミックな後悔の設定に焦点を当てています。
損失関数の列は時間とともに大きく変化しないと仮定することにより、既存の結果と比較して改善された後悔境界を導き出すことが可能であることを示す。
論文 参考訳(メタデータ) (2021-02-15T16:50:16Z) - Optimal Robustness-Consistency Trade-offs for Learning-Augmented Online
Algorithms [85.97516436641533]
機械学習予測を取り入れたオンラインアルゴリズムの性能向上の課題について検討する。
目標は、一貫性と堅牢性の両方を備えたアルゴリズムを設計することだ。
機械学習予測を用いた競合解析のための非自明な下界の最初のセットを提供する。
論文 参考訳(メタデータ) (2020-10-22T04:51:01Z) - Temporal Variability in Implicit Online Learning [15.974402990630402]
最強の後悔分析は、オンラインミラー・ダイスンよりも限界的な改善しか示さない。
損失関数列の時間的変動に依存する新しい静的な後悔境界を証明した。
本稿では、時間的変動の事前知識を必要とせずに、この後悔を抑える適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:50:34Z) - Time-varying Gaussian Process Bandit Optimization with Non-constant
Evaluation Time [93.6788993843846]
非定常評価時間を効果的に処理できる新しい時間変化ベイズ最適化アルゴリズムを提案する。
我々の限界は、評価時間列のパターンが問題の難易度に大きな影響を与えることを決定づける。
論文 参考訳(メタデータ) (2020-03-10T13:28:33Z) - Learning with Differentiable Perturbed Optimizers [54.351317101356614]
本稿では,操作を微分可能で局所的に一定ではない操作に変換する手法を提案する。
提案手法は摂動に依拠し,既存の解法とともに容易に利用することができる。
本稿では,この枠組みが,構造化予測において発達した損失の族とどのように結びつくかを示し,学習課題におけるそれらの使用に関する理論的保証を与える。
論文 参考訳(メタデータ) (2020-02-20T11:11:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。