論文の概要: Sobolev Norm Learning Rates for Conditional Mean Embeddings
- arxiv url: http://arxiv.org/abs/2105.07446v1
- Date: Sun, 16 May 2021 14:43:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-19 06:36:53.136648
- Title: Sobolev Norm Learning Rates for Conditional Mean Embeddings
- Title(参考訳): 条件付き平均埋め込みのためのソボレフノルム学習率
- Authors: Prem Talwai, Ali Shameli, David Simchi-Levi
- Abstract要約: 我々は、再現カーネルヒルベルト空間(RKHS)の理論を適用して条件平均埋め込みの新しい学習率を開発する。
我々の学習速度は,最先端技術よりも極めて弱い仮定下でのサンプル推定器の一貫性を示す。
- 参考スコア(独自算出の注目度): 9.408434948140833
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We develop novel learning rates for conditional mean embeddings by applying
the theory of interpolation for reproducing kernel Hilbert spaces (RKHS). Our
learning rates demonstrate consistency of the sample estimator under
drastically weaker assumptions than the state-of-the art, allowing the much
broader application of conditional mean embeddings to more complex ML/RL
settings involving infinite dimensional RKHS and continuous state spaces.
- Abstract(参考訳): カーネルヒルベルト空間 (RKHS) の補間理論を適用し, 条件付き平均埋め込みの学習率を向上させる。
我々の学習速度は、サンプル推定器が最先端技術よりも大幅に弱い仮定の下で整合性を示し、無限次元RKHSと連続状態空間を含むより複雑なML/RL設定への条件平均埋め込みのより広範な適用を可能にした。
関連論文リスト
- Convolutional Filtering with RKHS Algebras [110.06688302593349]
我々は、Kernel Hilbert Spaces(RKHS)の再生のための畳み込み信号処理とニューラルネットワークの理論を開発する。
任意の RKHS が複数の代数的畳み込みモデルの形式的定義を可能にすることを示す。
本研究では,無人航空機による実測値から無線通信を予測できる実データに関する数値実験について述べる。
論文 参考訳(メタデータ) (2024-11-02T18:53:44Z) - Asynchronous Stochastic Approximation and Average-Reward Reinforcement Learning [11.868402302316131]
我々は、より一般的な雑音条件を満たすために、ボルカールとメインの安定性証明法を拡張した。
我々は、Schweitzerの古典的相対値アルゴリズムRVI Q-learningの非同期SAアナログの収束を確立する。
RVIQ学習における最適報酬率を推定するための新しい単調性条件を導入する。
論文 参考訳(メタデータ) (2024-09-05T21:23:51Z) - Unveil Conditional Diffusion Models with Classifier-free Guidance: A Sharp Statistical Theory [87.00653989457834]
条件付き拡散モデルは現代の画像合成の基礎となり、計算生物学や強化学習などの分野に広く応用されている。
経験的成功にもかかわらず、条件拡散モデルの理論はほとんど欠落している。
本稿では,条件拡散モデルを用いた分布推定の急激な統計的理論を提示することにより,ギャップを埋める。
論文 参考訳(メタデータ) (2024-03-18T17:08:24Z) - Q-Learning for Stochastic Control under General Information Structures
and Non-Markovian Environments [1.90365714903665]
反復に対する収束定理を提示し、特に一般の、おそらくは非マルコフ的環境下でのQ学習を反復する。
非マルコフ環境における様々な制御問題に対するこの定理の意義と応用について論じる。
論文 参考訳(メタデータ) (2023-10-31T19:53:16Z) - DiffuSeq-v2: Bridging Discrete and Continuous Text Spaces for
Accelerated Seq2Seq Diffusion Models [58.450152413700586]
ガウス空間に基づく離散突然変異を再構成する学習において拡散モデルを容易にする軟吸収状態を導入する。
我々は、サンプリングプロセスの高速化のために、連続空間内で最先端のODEソルバを用いている。
提案手法は, トレーニング収束率を4倍に向上させ, 類似品質のサンプルを800倍高速に生成する。
論文 参考訳(メタデータ) (2023-10-09T15:29:10Z) - Conditional Kernel Imitation Learning for Continuous State Environments [9.750698192309978]
条件付きカーネル密度推定に基づく新しい模倣学習フレームワークを提案する。
我々は、多くの最先端ILアルゴリズムよりも一貫して優れた経験的性能を示す。
論文 参考訳(メタデータ) (2023-08-24T05:26:42Z) - Certifying Ensembles: A General Certification Theory with
S-Lipschitzness [128.2881318211724]
組み立ては、一般化、不確実性推定、校正、コンセプトドリフトの効果の緩和に有用であることが示されている。
本研究では、S-Lipschitz分類器を導入し、アンサンブルの理論的堅牢性を分析することにより、リプシッツ連続性を一般化する。
論文 参考訳(メタデータ) (2023-04-25T17:50:45Z) - On the Importance of Gradient Norm in PAC-Bayesian Bounds [92.82627080794491]
対数ソボレフ不等式の縮約性を利用する新しい一般化法を提案する。
我々は、この新たな損失段階的ノルム項が異なるニューラルネットワークに与える影響を実証的に分析する。
論文 参考訳(メタデータ) (2022-10-12T12:49:20Z) - Adaptive joint distribution learning [0.0]
テンソル積再生カーネルヒルベルト空間(RKHS)を用いた結合確率分布推定のための新しいフレームワークを開発する。
我々のフレームワークはラドン-ニコディム微分の低次元、正規化、正のモデルに対応しており、最大数百万のサンプルサイズから推定する。
論文 参考訳(メタデータ) (2021-10-10T15:51:01Z) - A Measure-Theoretic Approach to Kernel Conditional Mean Embeddings [14.71280987722701]
条件付き平均埋め込みに対する演算子なし測度理論的アプローチを提案する。
我々は、経験的推定を得るために自然な回帰解釈を導出する。
自然副産物として、平均不一致とヒルベルト=シュミット独立基準の条件付き類似点を得る。
論文 参考訳(メタデータ) (2020-02-10T12:44:12Z) - Representation of Reinforcement Learning Policies in Reproducing Kernel
Hilbert Spaces [72.5149277196468]
このフレームワークは、カーネルヒルベルト空間(RKHS)上のポリシーの低次元埋め込みを見つけることを含む。
我々は、再建された政策の復活を期待して、強い理論的保証を得る。
その結果、低次元空間にロバストに埋め込むことができる一方で、組込みポリシはリターンの低下をほとんど起こさないことを確認した。
論文 参考訳(メタデータ) (2020-02-07T15:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。