論文の概要: A Combinatorial Characterization of Supervised Online Learnability
- arxiv url: http://arxiv.org/abs/2307.03816v2
- Date: Fri, 9 Feb 2024 18:27:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 20:40:45.477925
- Title: A Combinatorial Characterization of Supervised Online Learnability
- Title(参考訳): 教師付きオンライン学習能力の組合せ的特徴付け
- Authors: Vinod Raman, Unique Subedi, Ambuj Tewari
- Abstract要約: 本稿では,任意だが有界な損失関数に対する仮説クラスのオンライン学習可能性について検討する。
連続最小次元と呼ばれる新しいスケール感性次元を与え、オンライン学習可能性の厳密な定量的評価を与えることを示す。
- 参考スコア(独自算出の注目度): 20.291598040396302
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the online learnability of hypothesis classes with respect to
arbitrary, but bounded loss functions. No characterization of online
learnability is known at this level of generality. We give a new
scale-sensitive combinatorial dimension, named the sequential minimax
dimension, and show that it gives a tight quantitative characterization of
online learnability. In addition, we show that the sequential minimax dimension
subsumes most existing combinatorial dimensions in online learning theory.
- Abstract(参考訳): 任意だが有界な損失関数に対する仮説クラスのオンライン学習可能性について検討した。
オンライン学習能力の特徴はこのレベルでは知られていない。
我々は、シーケンシャルなminimax次元と呼ばれる、新しいスケールに敏感な組合せ次元を与え、オンライン学習可能性の厳密な定量的特徴付けを与えることを示した。
さらに, オンライン学習理論において, 逐次的ミニマックス次元が既存の組合せ次元の大部分を占めることを示す。
関連論文リスト
- Optimal Learners for Realizable Regression: PAC Learning and Online Learning [52.37726841759983]
本研究では,PAC学習環境とオンライン学習環境の両方において,実現可能な回帰の統計的複雑さを特徴付けることを目的とする。
まず,再現可能な回帰のためのミニマックスインスタンス最適学習器を導入し,実数値予測器のどのクラスが学習可能であるかを質的かつ定量的に特徴付ける新しい次元を提案する。
オンライン学習の文脈では、最小の最適インスタンス最適累積損失を一定要素まで特徴付ける次元を提供し、再現可能な回帰のための最適オンライン学習者を設計する。
論文 参考訳(メタデータ) (2023-07-07T21:39:25Z) - Online Learning with Set-Valued Feedback [18.054632903107546]
学習者は1つのラベルを予測するが、フィードバックとしてラベルのテキストセットを受け取る。
単一ラベルフィードバックによるオンラインマルチクラス学習とは異なり、決定論的かつランダムなオンライン学習は、実現可能な設定においてもテキストと同等であることを示す。
論文 参考訳(メタデータ) (2023-06-09T20:43:19Z) - Multiclass Online Learning and Uniform Convergence [34.21248304961989]
対戦型オンライン学習環境におけるマルチクラス分類について検討する。
任意のマルチクラスの概念クラスが、そのリトルストーン次元が有限である場合に限り、不可知的に学習可能であることを証明する。
論文 参考訳(メタデータ) (2023-03-30T21:35:48Z) - Offline Reinforcement Learning with Differentiable Function
Approximation is Provably Efficient [65.08966446962845]
歴史的データを用いて意思決定戦略を最適化することを目的としたオフライン強化学習は、現実の応用に広く適用されている。
微分関数クラス近似(DFA)を用いたオフライン強化学習の検討から一歩踏み出した。
最も重要なことは、悲観的な適合Q-ラーニングアルゴリズムを解析することにより、オフライン微分関数近似が有効であることを示すことである。
論文 参考訳(メタデータ) (2022-10-03T07:59:42Z) - Stabilizing Q-learning with Linear Architectures for Provably Efficient
Learning [53.17258888552998]
本研究では,線形関数近似を用いた基本的な$Q$-learningプロトコルの探索変種を提案する。
このアルゴリズムの性能は,新しい近似誤差というより寛容な概念の下で,非常に優雅に低下することを示す。
論文 参考訳(メタデータ) (2022-06-01T23:26:51Z) - Near-optimal Offline Reinforcement Learning with Linear Representation:
Leveraging Variance Information with Pessimism [65.46524775457928]
オフライン強化学習は、オフライン/歴史的データを活用して、シーケンシャルな意思決定戦略を最適化しようとしている。
線形モデル表現を用いたオフライン強化学習の統計的限界について検討する。
論文 参考訳(メタデータ) (2022-03-11T09:00:12Z) - Learning Connectivity of Neural Networks from a Topological Perspective [80.35103711638548]
本稿では,ネットワークを解析のための完全なグラフに表現するためのトポロジ的視点を提案する。
接続の規模を反映したエッジに学習可能なパラメータを割り当てることにより、学習プロセスを異なる方法で行うことができる。
この学習プロセスは既存のネットワークと互換性があり、より大きな検索空間と異なるタスクへの適応性を持っている。
論文 参考訳(メタデータ) (2020-08-19T04:53:31Z) - Can Temporal-Difference and Q-Learning Learn Representation? A Mean-Field Theory [110.99247009159726]
時間差とQ-ラーニングは、ニューラルネットワークのような表現力のある非線形関数近似器によって強化される深層強化学習において重要な役割を担っている。
特に時間差学習は、関数近似器が特徴表現において線形であるときに収束する。
論文 参考訳(メタデータ) (2020-06-08T17:25:22Z) - On the Equivalence between Online and Private Learnability beyond Binary
Classification [26.400891660337777]
プライベートな学習性は、両方の設定においてオンライン学習性を意味することを示す。
オンライン学習が多クラス分類において個人的学習可能性を示す一方で、現在の証明手法は回帰設定において重大なハードルに直面していることを示す。
論文 参考訳(メタデータ) (2020-06-02T23:30:41Z) - Towards a combinatorial characterization of bounded memory learning [21.031088723668486]
我々は,境界記憶学習を特徴付ける次元を開発する。
候補解に対して上界と下界の両方を証明します。
我々は、我々の特徴がより広いパラメータの体系で成り立つと推測する。
論文 参考訳(メタデータ) (2020-02-08T09:04:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。