論文の概要: Optimal Tracking in Prediction with Expert Advice
- arxiv url: http://arxiv.org/abs/2208.03708v1
- Date: Sun, 7 Aug 2022 12:29:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-09 14:17:51.861770
- Title: Optimal Tracking in Prediction with Expert Advice
- Title(参考訳): エキスパートアドバイスによる予測における最適追跡
- Authors: Hakan Gokcesu, Suleyman S. Kozat
- Abstract要約: 専門家のアドバイス設定を用いて予測を検証し、専門家の集合が生み出す決定を組み合わせて意思決定を行うことを目的とする。
我々は、専門家のアドバイス設定による予測の下で、最小限の動的後悔を達成する。
我々のアルゴリズムは、このような普遍的に最適で適応的で真にオンラインの保証を、事前の知識なしで生成した最初のアルゴリズムです。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the prediction with expert advice setting, where the aim is to
produce a decision by combining the decisions generated by a set of experts,
e.g., independently running algorithms. We achieve the min-max optimal dynamic
regret under the prediction with expert advice setting, i.e., we can compete
against time-varying (not necessarily fixed) combinations of expert decisions
in an optimal manner. Our end-algorithm is truly online with no prior
information, such as the time horizon or loss ranges, which are commonly used
by different algorithms in the literature. Both our regret guarantees and the
min-max lower bounds are derived with the general consideration that the expert
losses can have time-varying properties and are possibly unbounded. Our
algorithm can be adapted for restrictive scenarios regarding both loss feedback
and decision making. Our guarantees are universal, i.e., our end-algorithm can
provide regret guarantee against any competitor sequence in a min-max optimal
manner with logarithmic complexity. Note that, to our knowledge, for the
prediction with expert advice problem, our algorithms are the first to produce
such universally optimal, adaptive and truly online guarantees with no prior
knowledge.
- Abstract(参考訳): 予測をエキスパートアドバイス設定で検討し,例えば,アルゴリズムの独立実行など,専門家による意思決定を組み合わせることで意思決定を行うことを目的としている。
我々は、専門家のアドバイス設定による予測の下で、最小限の動的後悔、すなわち、最適な方法で専門家の判断の時間変化(必ずしも固定されていない)の組み合わせと競合することができる。
我々の終末アルゴリズムは、文献の様々なアルゴリズムで一般的に使われている時間水平線や損失範囲などの事前情報を持たない真にオンラインである。
我々の後悔の保証とmin-max下限は、専門家の損失が時空的特性を持ち、おそらくは非有界であるという一般的な考察から導かれる。
我々のアルゴリズムは、損失フィードバックと意思決定の両方に関して制限的なシナリオに適応することができる。
我々の保証は普遍的であり、すなわち、対数的複雑性を伴う min-max 最適方法で競合列に対して後悔の保証を与えることができる。
私たちの知識では、専門家のアドバイス問題による予測のために、我々のアルゴリズムは、事前の知識なしで、このような普遍的に最適で適応的で真にオンラインな保証を最初に作成する。
関連論文リスト
- Active Ranking of Experts Based on their Performances in Many Tasks [72.96112117037465]
我々は、dタスクのパフォーマンスに基づいて、n名のエキスパートをランク付けする問題を考察する。
我々は,各専門家のペアに対して,各タスクにおいて他方よりも優れているという,単調な仮定を定めている。
論文 参考訳(メタデータ) (2023-06-05T06:55:39Z) - Streaming Algorithms for Learning with Experts: Deterministic Versus
Robust [62.98860182111096]
エキスパート問題を伴うオンライン学習では、アルゴリズムは、T$day(または時間)ごとに結果を予測する必要がある。
目標は最小限のコストで予測を行うことだ。
最良専門家が$M$の誤りを犯したとき、後悔する$R$を達成するような決定論的アルゴリズムに対して、$widetildeOmegaleft(fracnMRTright)$の空間下界を示す。
論文 参考訳(メタデータ) (2023-03-03T04:39:53Z) - Memory Bounds for the Experts Problem [53.67419690563877]
専門家のアドバイスによるオンライン学習は、逐次予測の根本的な問題である。
目標は、予測を処理し、最小コストで予測を行うことです。
アルゴリズムは、そのセットでもっとも優れた専門家と比較してどれだけうまく機能するかによって判断される。
論文 参考訳(メタデータ) (2022-04-21T01:22:18Z) - Second Order Regret Bounds Against Generalized Expert Sequences under
Partial Bandit Feedback [0.0]
本稿では,部分帯域フィードバック設定下でのエキスパートアドバイスの問題について検討し,逐次ミニマックス最適アルゴリズムを作成する。
本アルゴリズムは,従来の帯域幅フィードバックとは対照的に,逆向きに損失を明らかにすることのできる,より一般的な部分的監視設定で動作する。
論文 参考訳(メタデータ) (2022-04-13T22:48:12Z) - Double Coverage with Machine-Learned Advice [100.23487145400833]
オンラインの基本的な$k$-serverの問題を学習強化環境で研究する。
我々のアルゴリズムは任意の k に対してほぼ最適の一貫性-破壊性トレードオフを達成することを示す。
論文 参考訳(メタデータ) (2021-03-02T11:04:33Z) - Optimal Robustness-Consistency Trade-offs for Learning-Augmented Online
Algorithms [85.97516436641533]
機械学習予測を取り入れたオンラインアルゴリズムの性能向上の課題について検討する。
目標は、一貫性と堅牢性の両方を備えたアルゴリズムを設計することだ。
機械学習予測を用いた競合解析のための非自明な下界の最初のセットを提供する。
論文 参考訳(メタデータ) (2020-10-22T04:51:01Z) - A Generalized Online Algorithm for Translation and Scale Invariant
Prediction with Expert Advice [0.0]
本稿では,専門家の助言問題による逐次予測において,一般競合クラスに対するアルゴリズムの期待された後悔について検討する。
我々の後悔の限界は任意のスケーリングと損失の翻訳の下で安定している。
論文 参考訳(メタデータ) (2020-09-09T15:45:28Z) - Optimal anytime regret with two experts [11.959180302329358]
我々は、いつでも後悔を最小限に抑えるために、最初のミニマックス最適アルゴリズムを設計する。
このアルゴリズムは、計算のアイデアを用いて解決した後悔問題の連続的な類似を考慮し、設計する。
論文 参考訳(メタデータ) (2020-02-20T20:04:32Z) - Toward Optimal Adversarial Policies in the Multiplicative Learning
System with a Malicious Expert [87.12201611818698]
専門家のアドバイスを組み合わせて真の結果を予測する学習システムについて考察する。
専門家の一人が悪意があり、システムに最大損失を課すことを目指していると推測されている。
誤予測を常に報告する単純な欲求ポリシーは、近似比が1+O(sqrtfracln NN)$で最適であることを示す。
悪意のある専門家がその判断を適応的に行うことができるオンライン環境では、最適のオンラインポリシーを$O(N3)$で動的プログラムを解くことで効率的に計算できることが示される。
論文 参考訳(メタデータ) (2020-01-02T18:04:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。